Google AI prepoznaje pojedinačne glasove u gužvi

13. 04. 2018.13. 04. 2018. Milan Živković

Ljudska bića su obično dobra u raspoznavanju pojedinačnih glasova u bučnim okruženjima, ali je kompjuterima to još uvek teško. To dobro znaju oni koji su pokušavali da zadaju komandu pametnim zvučnicima tokom neke kućne zabave, što se ispostavilo kao prilično nemoguće.

Google namerava da to promeni, a njegovi stručnjaci rade na razvijanju sistema koji uključuje deep learning, te može da raspoznaje pojedinačne glasove, ali samo kada može da „vidi“ lice onoga koji govori. Tim je neuralne mreže trenirao tako što im je omogućavao da snimaju pojedince dok govore, da bi ih potom testirao u prepoznavanju tih glasova u gužvi.

Rezultati su prilično fascinantni, budući da je sistem i pored okolne buke uspevao da izdvoji čiste audio zapise onoga što govore pojedinačne osobe, a tako što se fokusirao na njihova lica. U tome ih nije sprečila ni gestikulacija govornika, kao ni mikrofon koji se u pojedinim trenucima nalazio ispred lica onoga koji govori.

Nova tehnologija bi u budućnosti mogla da ima široku primenu, te bi na primer mogla da se ugradi u slušne aparate sa kamerom, koji bi poboljšavali kvalitet zvuka čak i u bučnom okruženju. Pored brojnih prednosti, tu je i zabrinutost da bi tehnologija mogla da se zloupotrebi, te da ugrozi privatnost građana, ali kreatori kažu da bi teško mogao da se izoluje glas onoga koji prethodno nije dao svoj pristanak, budući da sistem ne bi prepoznavao njegovo lice.

Pročitajte i: Kako “skrivene” funkcije u Google Maps mogu da vas spasu od frustracija zbog gradilišta?

Izvor: Engadget

Facebook komentari: