Facebook je predstavio unapređenu AI tehnologiju koju koristi za generisanje opisa fotografija postovanih na njihovoj mreži. Ova tehnologija nazvana je Automatic Alternative Text (AAT) i predstavljena je 2016. godine s ciljem da osobama sa oštećenim vidom ukaže na fotografije koje korisnici postavljaju na svojim profilima ili u grupama. Pre aktiviranja ove tehnologije obaveštavanje je bilo veoma jednostavno – izgovarana je reč „photo“ i ime osobe koja ju je šerovala.

AAT-a je omogućio i opisivanje fotografije, pa je korisnik mogao da čuje nešto slično ovom „image may contain: two people, smiling, outdoors“. Unapređivanjem ove tehnologije korisnik će moći da dobije mnogo više detalja o fotografiji. Na primer, AI je sada u stanju da identifikuje ne samo koliko osoba je na fotografiji, već i da pretpostavi njihove aktivnosti, kao i da pokuša da prepozna i lokacije na kojima se nalaze. Na prethodnom primeru to bi zvučalo otprilike ovako: „a selfie of two people, outdoors, the Leaning Tower of Pisa“. Osoba koja bi čula takav opis mogla bi mnogo bolje da zamisli fotografiju u odnosu na prethodnu varijantu opisa.

Facebook je naveo da je AI sposoban da prepozna više od 1.200 različitih koncepata, a to je omogućeno zahvaljujući velikom modelu za učenje, koji se stalno dopunjava novim primerima. Učenje je zasnovano na sopstvenoj open-source platformi, Facebook AI Research, koja služi za identifikovanje objekata na fotografijama.

I druge velike kompanije trude se da olakšaju upotrebu svojih servisa slabovidim i slepim osobama. Google je, na primer, prošle godine u okviru Androdi OS-a ugradio TalkBack sistem koji koristi reči i vibracije da bi korisnicima objasnio šta se nalazi na ekranu telefona.

Izvor: ZDNet

