Xiaomi’den Konuşma Bozukluğu Olan Kişilere Özel Teknoloji

Xiaomi, erişilebilirlik alanına yönelik geliştirdiği ileri seviye algoritma uygulamasını ve konuşma teknolojisini tanıttı. Xiaomi AI Lab’ın geliştirdiği spontane şeklindeki Metin Okuma teknolojisi, konuşma bozukluğu olan şahıslar için eşsiz ve özelleştirilmiş bir ses üretiyor.

Konuşma bozukluğu çeken şahıslar, monoton bir elektronik ses yerine “kendi seslerini” kullanarak diğerleriyle bağlantı kurabiliyor. Xiaomi Teknik Komitesi tarafından yönetilen “Own My Voice” ön araştırma projesinin bir kesimi olan bu başarılı teşebbüs, Xiaomi’nin “İyilik için teknolojiye bağlılığını” ve “Dünya genelinde herkesin yenilikçi teknolojiler aracılığıyla daha düzgün bir ömür sürmesine imkan tanıma” misyonunu gerçekleştirmeye yönelik kararlılığını gösteriyor.

İnsanları önemseyen Xiaomi, teknoloji inovasyonlarıyla insanların farklı muhtaçlıklarını karşılamaya çalışıyor. Konuşma bozukluğu olan birçok kişinin günlük irtibatta eşsiz seslere sahip olma isteğini gören Xiaomi, kullanıcıların kendi seslerine sahip olmaları için “Own My Voice” proje takımını kurdu. Xiaomi Corporation Teknoloji Komitesi Düzgünlük için Teknoloji Organizatörü Zhu Xi, “Kişilerin taleplerine karşılık vermek üzere teknoloji inovasyonlarının bize sağladığı birçok bedeli keşfetmekten büyük heyecan duyuyoruz” dedi.

Xiaomi, konuşma bozukluğu çeken kişi için en uygun ve şahsileştirilmiş sesin oluşturulabilmesi ismine şirket bünyesinde 200’den fazla gönüllüyle birlikte çalıştı. Gönüllülerin bağışladığı seslerin özelliklerini konuşma bozukluğu çeken şahısların sesleriyle eşleştirmek için ses izi eşleştirme algoritması kullanıldı. Bu yaklaşımla, konuşma bozukluğu çeken kişinin ses referansının temel sesi olarak en uygun ses bulundu. Şahsileştirme ve şahsî saklılık göz önünde bulundurularak seçilen gerçek ses, yeni ve özgün bir ses oluşturmak için karmaşık bir akustik modifikasyonla manipüle edildi.

Daha sonra, yapay zeka modelini eğitmek için spontane usulde metin okuma teknolojisi kullanılarak, yeni sesin kademeli olarak bir insanın hislerini ve tonunu hakikat bir formda söz edebilen doğal bir ritim ve tonlama kazanması sağlandı.

“Own My Voice” projesi, sentezlenen sesin özgünlüğünü, güvenliğini ve son derece özgün olmasını sağlamak için Xiaomi’nin kendi geliştirdiği konuşma teknolojisini bir ortaya getirerek konuşma bozukluğu olan bireyler için şahsileştirilmiş konuşma sentezi konusunda bir çığır açıyor.

Projenin omurgasını, Xiaomi AI Lab bünyesinde çalışan bir küme konuşma teknolojisi uzmanı oluşturuyor. 2017’den bu yana, Milletlerarası Akustik, Konuşma ve Sinyal Sürece Konferansı (ICASSP) üzere en uygun memleketler arası konferanslarda konuşma üzerine 37 bildiri yayınladılar. “Own My Voice” projesinin başarısı, temel olarak bu uzmanlar tarafından geliştirilen spontane şeklinde Metin Okuma teknolojisine bağlı.

Spontane üslupta Metin Okuma teknolojisi, sentezlenen sesi tonlama, duraklatma, sürat ve öbür özellikler bağlamında gerçek bir insan sesi haline getiriyor. bu, elektronik sesin monoton ve doğal olmayan hissini daha doğal bir sesle değiştiriyor. Şu an bu teknoloji, Xiaomi’nin yapay zeka dayanaklı sesli asistanı Xiaoai ile donatılan birçok akıllı aygıtta kullanılıyor. “Own My Voice” projesi, spontane şekildeki Metin Okuma teknolojisinin erişilebilirlik alanlarında geniş çapta benimsenebileceğini ve kullanıcı tecrübesini güzelleştirebileceğini gösteriyor.

Zhu Xi, “Azınlık kümelerinin muhtaçlıklarını erken bir etapta fark edip karşılarsak, teknolojinin yayılma süreci değerli ölçüde kısalabilir. Bu, yeni teknolojilerin yararlarının özel gereksinimleri olan bireyler için gecikme olmadan erişilebilir olmasına imkan tanır” dedi.

Xiaomi, ilerleyen süreçte konuşma bozukluğu yaşayan şahıslardan geri bildirim almaya devam edecek ve bu projenin fizibilitesini daha geniş bir aralıkta inceleyecek. Xiaomi, teknolojik yeniliklerle insanların farklı gereksinimlerini karşılamaya çalışarak, en son teknolojiyle erişilebilirliği güçlendirmeye devam edecek.