Startap – Softver Daktilograf koji govor pretvara u tekst
Prototip softvera “Daktilograf”, koji automatski pretvara govor u tekst, prilagođen za srpski, bosanski, crnogorski, hrvatski i slovenački jezik, predstavljen je u juče u ICT Hub-u u Beogradu.
“Daktilograf” je novo tehnološko rešenje koje na osnovu posebno kreiranog algoritma pretvara audio u tekst. “Prednost ovog rešenja u odnosu na konkurenciju je u tome što nije isključivo oslonjen na audio biblioteke, već posmatra reči kao audio signale, rastavlja ih, prepoznaje i pretvara u pisani tekst”, kaže se u saopštenju startapa “Daktilograf”. Korišćenje “Daktilografa” u institucijama ubrzalo bi digitalizaciju javnih ustanova i uštedelo bi vreme u mnogim birokratskim poslovima koji zahtevaju kucanje tekstova. Softver namenjen pre svega medijima i novinskim agencijama, a može da ima primenu i u sudovima, skupštinama, drugim organima javne uprave i svim drugim institucijama ili kompanijama koje imaju svakodnevnu potrebu za kucanjem teksta, objasnio je Mirsad Hadžalić, direktor razvoja startapa “Daktilograf”.
Početkom godine, objašnjava Mirsad Hadžalić, ekipa okupljena oko Daktilografa bila je u punom zamahu razvoja startapa u oblasti pametne poljoprivrede. „Plan nam je bio da godinu započnemo učešćem na PODIM konferenciji i tražimo podršku investitora. Tokom pauze pregledali smo neke stare projekte, a onda sam gledajući prototip društvene mreže za decu sa posebnim potrebama ukapirao stvarnu vrednost dela tog koda i uzviknuo – obustavljaj! Uzeo sam papir i nacrtao layout aplikacije koja služi za konverziju govora u tekst i u vrhu ispisao naše sadašnje ime. Gospodo, mi smo sada Daktilograf i sa ovim projektom idemo na PODIM – rekao sam ostalim članovima tima. Ostatak ekipe me je gledao u neverici, ali smo vrlo brzo zajednički zaključili da je to bolji izbor”, ispričao je Hadžalić.Uspeli su da kreiraju prototip do početka dela konferencije koji se održavao u Podgorici, a ubrzo nakon toga započeli su i pregovore o investiranju sa ICT Hub Venture i sa SC Ventures.
Dosadašnji softveri ovog tipa razvijali su se u dva pravca: prvi je zasnovan na upotrebi rečnika ili audio biblioteka, a drugi je baziran na veštačkoj inteligenciji. Kako Mirsad istakao, regionalni konkurenti Daktilografa rade po sistemu rečnika, dok globalna konkurencija koristi oba pristupa. “Prednost našeg rešenja je u tome što smo mi prevazišli sistem rečnika, a za prepoznavanje reči ne koristimo AI sisteme, pa ne samo što naše rešenja zahteva znatno manju procesorsku snagu već mnogo bolje uči jer su rezultati treninga mnogo predvidljiviji od rezultata dobijenih treniranjem veštačke inteligencije.
Ovaj softver, takođe, nije isključivo oslonjen na audio biblioteke i za sada prototip ima dvostruku proveru sa rečnicima – prvo pokušava da odgonetne audio signal odnosno da „shvati“ koju je to reč „čuo“. On se za sada „konsultuje“ se rečnicima zbog bolje tačnosti, ali će vremenom potreba za „konsultovanjem“ biti sve manja i na kraju nestati. Međutim, kako vrlo često svakodnevni govor nije isti kao onaj pisani, postavlja se pitanje: da li softver ispravlja gramatičke i logičke greške? “U ovom prototipu ne postoje gramatički niti interpukcijski moduli predviđeni planom razvoja. U narednih šest meseci bi trebalo da imamo kreiran tržišni proizvod koji će imati kako lingvističku, tako i interpukcijsku i gramatičku korekciju, kao i mogućnost njenog isključivanja, zavisno od potreba klijenata. Za sada softver zapisuje ono što je čuo ako je dovoljno siguran u to, ili ga ispraviti ako nije dovoljno siguran”, objasnio je Hadžalić.
Jedna od glavnih karakteristika softvera je da gotovo trenutno pretvara govor u tekst za sve južnoslovenske jezike. „Mi već razvijamo module za ruski, poljski, češki, slovački i ostale slovenske jezike, a početkom 2019. planiran je razvoj rešenja za engleski i španski. Dakle, kada kažem da ćemo kreirati rešenja za engleski i španski, to znači da ćemo ih kreirati na osnovu našeg algoritma, dakle srpsko-hrvatskog jezika i ta šifra će biti osnov za razumevanje drugih jezika. Za slovenske jezike je taj posao znatno lakši, dok je za „zapadne“ dosta komplikovaniji ali ne i nemoguć”, istako je direktor Daktilografa i dodao da oni već sada mogu da kreiraju aplikaciju za prevođenje koristeći API kompanija kao što je Google za jezike koji su već odlično pokriveni rečnicima i dalje postoji vrlo mali broj specijalizovanih aplikacija, čak i u zemljama čiji su jezici odlično pokriveni rečnicima, te je i to veliki potencijal za razvoj i širenje. Sam softver se, pored jezika, može dodatno da se nadogradi na zahtev klijenata. .
Izvor: Beta / Netokracija