Meta’nın konuşma odaklı yapay zekası 4 binden fazla konuşma dilini tanıyor

Meta, konuşmayı tanımak ve oluşturmak için geliştirdiği yapay zekasıyla 4 binden fazla dili analiz edebiliyor. Massively Multilingual Speech (MMS) ile Meta, en büyük rakiplerinden kolayca ayrılabiliyor. 

Meta, konuşmayı tanımak ve oluşturmak için geliştirdiği yapay zekasıyla 4 binden fazla dili analiz edebiliyor. Massively Multilingual Speech (MMS) ile Meta, en büyük rakiplerinden kolayca ayrılabiliyor.

Çok dilli konuşma projeleri, dil teknolojisinin ilerlemesinde ve küresel dilsel çeşitliliğin desteklenmesinde önemli bir sıçramayı temsil ediyor. Bu projeler, genellikle binlerce farklı dilsel arka planı kapsayan çok çeşitli dillerde konuşmayı tanımak ve oluşturmak için yapay zeka dil modellerini kullanıyor.

Çok dilli konuşma projeleri, geleneksel olmayan veri kaynaklarını birleştirmek veya kendi kendini denetleyen konuşma temsili öğrenimini kullanmak gibi yenilikçi yaklaşımlardan yararlanarak engelleri aşmayı ve bireyleri kendi ana dillerinde iletişim kurma, öğrenme ve bilgilere erişme konusunda güçlendirmeyi amaçlıyor.

İnovasyona yönelik benzeri görülmemiş bir adım atan Meta’nın MMS’i, 4.000’den fazla konuşma dilinden oluşan şaşırtıcı bir dizide konuşmayı tanıma ve oluşturma becerisiyle rakiplerinin yeteneklerini geride bırakıyor. Bu atılımı gizli tutmakla yetinmeyen Meta, MMS’i açık kaynak yapmaya karar verdi ve araştırmacıları temelinden yararlanmaya ve genişletmeye davet etti. Bunu yaparken Meta, dil çeşitliliğinin korunmasına hükmetmeyi ve bu alanda iş birlikçi ilerlemeyi teşvik etmeyi amaçlıyor.

Geleneksel konuşma tanıma ve metinden konuşmaya modelleri, makine öğrenimi algoritmalarını kolaylaştıran titiz transkripsiyon etiketleriyle tamamlanan geniş ses veri kümeleri hakkında kapsamlı eğitim gerektiriyor. Bununla birlikte, ağırlıklı olarak sanayileşmiş ülkelerin dışında bulunan ve nesli tükenmekte olan birçok dil, bu tür kapsamlı verilerden yoksundur ve bu da onları tamamen yok olma riskiyle karşı karşıya kalıyor. Bu durumu kabul eden Meta, çevrilmiş dini metinlerden yararlanarak dahice bir yaklaşım benimsiyor.
Kendi kendini denetleyen konuşma gösterimi öğrenimi için wav2vec 2.0 modelini kullanan Meta, bir hizalama modeli eğiterek verilerin kullanılabilirliğini daha da geliştirdi. Alışılmışın dışında veri kaynakları ile kendi kendini denetleyen konuşma modellemesi arasındaki sinerji dikkate değer sonuçlar verdi. 
Bireylerin ana dillerinde iletişim kurmasına ve öğrenmesine olanak tanıdığı bir dünya tasavvur eden Meta, dünya çapında dillerin korunmasına ve canlılığına ilham vermeyi umuyor.

Güncel İçerikler