Top50 2024

Neko konačno pomaže modelima veštačke inteligencije da razumeju osobe sa smetnjama u govoru

Boffins na Univerzitetu Ilinois Urbana-Champaign (UIUC) u SAD radi sa uobičajenim internet super-korpusom kako bi, u idealnom slučaju, poboljšali prepoznavanje glasa AI za osobe sa invaliditetom.

PCPress.rs Image

Govorni interfejsi treba da budu dostupni svima

Softver za prepoznavanje govora često ima problema da obradi govor za ljude sa jakim akcentima, a radi još lošije za osobe sa smetnjama u govoru, pošto njihovi glasovi obično nisu dobro ili uopšte predstavljeni u skupovima podataka za obuku. Projekat pristupačnosti govoru, pokrenut 3. oktobra i podržan od strane Amazona, Applea, Google-a, Meta i Microsofta, kao i neprofitnih organizacija, ima za cilj da modele prepoznavanja govora učini efikasnijim za sve. „Za mnoge od nas govor i komunikacija su bez napora“, rekao je za Clarion Mendes, klinički profesor nauke o govoru i sluhu na UIUC-u koji radi na projektu.

„Međutim, postoje milioni ljudi za koje komunikacija nije laka, već svakodnevna borba. Objedinjavanjem naših napora ka zajedničkom cilju poboljšanja pristupa govoru za osobe sa smetnjama u govoru ili razlikama, mi ne poboljšavamo samo tehnologiju – mi popravljemo kvalitet života i promovišemo nezavisnost“. Istraživači će se fokusirati na dobijanje različitih audio podataka od ljudi pogođenih različitim medicinskim poremećajima koji utiču na govor, kao što su Lu Gerigova bolest ili amiotrofična lateralna skleroza (ALS), Parkinsonova bolest, cerebralna paraliza i Daunov sindrom, koji govore engleski.

Pročitajte i:  Apple AI i naslov BBC o Luigi Mangione-u

Volonteri će biti plaćeni za snimanje audio uzoraka, koji će se koristiti za kreiranje velikog skupa podataka za obuku AI modela za komercijalne i istraživačke aplikacije. Ako postoje ili su postojali projekti slični ovom naporu, to je sjajno, iako se ovaj izdvaja po podršci od onih koji prave današnje AI glasovne asistente i slično. Industrijski partneri koji podržavaju projekat pristupačnosti govoru finansiraju projekat najmanje dve godine i radiće sa akademicima kako bi otkrili kako se trenutni modeli prepoznavanja govora mogu poboljšati.

„Kroz direktan rad sa pojedincima sa govornim razlikama i invaliditetom, preko fokus grupa i naših partnera za zastupanje, bićemo opremljeni da utvrdimo prednosti i ograničenja trenutnih sistema automatskog prepoznavanja govora i potrebu za razvojem novih sistema“, rekao je Mendes. Tim će sarađivati sa Dejvis Fini fondacijom i Timom Glison, dve neprofitne organizacije na prikupljanju govornih podataka od ljudi sa ALS-om i Parkinsonovom bolešću u početku pre nego što se proširi na podršku drugim vrstama invaliditeta. „Opcija komuniciranja i upravljanja uređajima pomoću govora je ključna za svakoga ko danas ima interakciju sa tehnologijom ili digitalnom ekonomijom. Govorni interfejsi treba da budu dostupni svima, a to uključuje i osobe sa invaliditetom“, rekao je Mark Hasegava-Džonson, profesor elektrotehnike UIUC-a. i računarski inženjering koji vodi projekat.

Pročitajte i:  Schneider Electric predstavlja nova rešenja za izazove u oblasti energetike i održivosti koje postavlja AI

„Ovaj zadatak je bio težak jer zahteva mnogo infrastrukture, idealno onakvu koju mogu da podrže vodeće tehnološke kompanije, tako da smo stvorili jedinstven interdisciplinarni tim sa ekspertizom u lingvistici, govoru, veštačkoj inteligenciji, bezbednosti i privatnosti kako bismo pomogli suočavamo se sa ovim važnim izazovom.”

Izvor: Theregister

Facebook komentari:
Računari i Galaksija
Tagovi: , ,