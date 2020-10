Jedan od davno postavljenih zadataka za veštačku inteligenciju je da bude u stanju da precizno opiše fotografiju. Tu je neophodno, ne samo da se opišu objekti na sceni, već i kakvu međusobnu interakciju oni imaju i kako da se to predstavi rečima.

Google je 2014. godine objavio da njihov AI može da to uradi skoro kao ljudi, sa tačnošću opisa od 94 procenta. Sada Microsoft tvrdi da je postigao još bolji rezultat – Zvaničnici iz kompanije tvrde da je njihov AI precizniji od ljudi, kao i da je nova verzija duplo bolja od sistema koji koriste još od 2015. godine.

Microsoft je ovaj sistem ponudio kao deo Azure Cognitive Services, što znači da svaki developer može da ga ugradi u svoje aplikacije. On je već dostupan u Seeing AI, Microsoft-ovoj aplikaciji za slepe i slabovide ljude, koji mogu da koriste naraciju za opis sveta oko sebe. Očekuje se da će do kraja godine, ovaj sistem biti sposoban da poboljša prezentacije u PowerPoint-u za web, Windows i Mac, a biće dostupan i za Word i Outlook desktop aplikacije.

Sistem je treniran tako što su fotografije tagovane sa specifičnim ključnim rečima, što je pomoglo da se razvije vizuelni jezik, koji većina drugih AI-jeva nema. Rezultat bi trebao da se pokaže veoma brzo – na primer u boljoj pretrazi fotografija ili za bolju navigaciju slepih osoba u prostoru.

Izvor: Engadget

