Neko konačno pomaže modelima veštačke inteligencije da razumeju osobe sa smetnjama u govoru

17. 10. 2022.17. 10. 2022. Tijana Barašević

Boffins na Univerzitetu Ilinois Urbana-Champaign (UIUC) u SAD radi sa uobičajenim internet super-korpusom kako bi, u idealnom slučaju, poboljšali prepoznavanje glasa AI za osobe sa invaliditetom.

Govorni interfejsi treba da budu dostupni svima

Softver za prepoznavanje govora često ima problema da obradi govor za ljude sa jakim akcentima, a radi još lošije za osobe sa smetnjama u govoru, pošto njihovi glasovi obično nisu dobro ili uopšte predstavljeni u skupovima podataka za obuku. Projekat pristupačnosti govoru, pokrenut 3. oktobra i podržan od strane Amazona, Applea, Google-a, Meta i Microsofta, kao i neprofitnih organizacija, ima za cilj da modele prepoznavanja govora učini efikasnijim za sve. „Za mnoge od nas govor i komunikacija su bez napora“, rekao je za Clarion Mendes, klinički profesor nauke o govoru i sluhu na UIUC-u koji radi na projektu.

„Međutim, postoje milioni ljudi za koje komunikacija nije laka, već svakodnevna borba. Objedinjavanjem naših napora ka zajedničkom cilju poboljšanja pristupa govoru za osobe sa smetnjama u govoru ili razlikama, mi ne poboljšavamo samo tehnologiju – mi popravljemo kvalitet života i promovišemo nezavisnost“. Istraživači će se fokusirati na dobijanje različitih audio podataka od ljudi pogođenih različitim medicinskim poremećajima koji utiču na govor, kao što su Lu Gerigova bolest ili amiotrofična lateralna skleroza (ALS), Parkinsonova bolest, cerebralna paraliza i Daunov sindrom, koji govore engleski.

Pročitajte i: Novi Copilot režim u Microsoft Edgeu uz više AI

Volonteri će biti plaćeni za snimanje audio uzoraka, koji će se koristiti za kreiranje velikog skupa podataka za obuku AI modela za komercijalne i istraživačke aplikacije. Ako postoje ili su postojali projekti slični ovom naporu, to je sjajno, iako se ovaj izdvaja po podršci od onih koji prave današnje AI glasovne asistente i slično. Industrijski partneri koji podržavaju projekat pristupačnosti govoru finansiraju projekat najmanje dve godine i radiće sa akademicima kako bi otkrili kako se trenutni modeli prepoznavanja govora mogu poboljšati.

„Kroz direktan rad sa pojedincima sa govornim razlikama i invaliditetom, preko fokus grupa i naših partnera za zastupanje, bićemo opremljeni da utvrdimo prednosti i ograničenja trenutnih sistema automatskog prepoznavanja govora i potrebu za razvojem novih sistema“, rekao je Mendes. Tim će sarađivati sa Dejvis Fini fondacijom i Timom Glison, dve neprofitne organizacije na prikupljanju govornih podataka od ljudi sa ALS-om i Parkinsonovom bolešću u početku pre nego što se proširi na podršku drugim vrstama invaliditeta. „Opcija komuniciranja i upravljanja uređajima pomoću govora je ključna za svakoga ko danas ima interakciju sa tehnologijom ili digitalnom ekonomijom. Govorni interfejsi treba da budu dostupni svima, a to uključuje i osobe sa invaliditetom“, rekao je Mark Hasegava-Džonson, profesor elektrotehnike UIUC-a. i računarski inženjering koji vodi projekat.

Pročitajte i: Zašto biste trebali da proverite da li Gmail koristi vaše mejlove za treniranje AI-ja — i kako da se isključite

„Ovaj zadatak je bio težak jer zahteva mnogo infrastrukture, idealno onakvu koju mogu da podrže vodeće tehnološke kompanije, tako da smo stvorili jedinstven interdisciplinarni tim sa ekspertizom u lingvistici, govoru, veštačkoj inteligenciji, bezbednosti i privatnosti kako bismo pomogli suočavamo se sa ovim važnim izazovom.”

Izvor: Theregister

Facebook komentari: