BIZIT 11 - prvi dan

Wikipedia ima Google Translate problem

Wikipedia je osnovana sa ciljem da znanje postane pristupačno širom sveta, ali je činjenica da je trenutno najviše sadržaja dostupno na engleskom jeziku. Tako je engleska Wikipedia najbogatija, te broji 5,5 miliona članaka, a kvalitet sadržaja značajno varira budući da često nedostaje vitalnih informacija.

PCPress.rs Image

Tako je Wikipedia problem postao polje pogodno za testiranje i razvoj mašinskog učenja, pa se Google u januaru udružio sa Wikimedia fondacijom, nakon čega se Google Translate pridružio alatima za prevođenje sadržaja u okviru Wikipedia-e. Ipak, pokazalo se da je za kreatore sadržaja koji ne pišu na engleskom jeziku Google alatka više noćna mora nego rešenje, pa se ponovo pokrenulo pitanje da li bi Wikipedia uopšte trebalo da se oslanja na sisteme mašinskog učenja. Prevođenje sadržaja uz pomoć alata mašinskog učenja generiše tekst koji se zasniva na automatskom prevođenju, te, ako se koristi pravilno, kreatorima može da uštedi mnogo vremena. Ipak, ako nešto krene naopako, rezultati su često pogubni, a zbog toga što se neke reči, ili grupe reči, prevode potpuno pogrešno, čime se često potpuno menja smisao te tačnost, teksta.

Pročitajte i:  Volkswagen integriše veštačku inteligenciju

PCPress.rs Image

Eksperti ističu da Google Translate nije planiran kao zamena za pravo poznavanje jezika. Od Wikipedia kreatora se očekuje da poseduju potrebna znanja, budući da mašinski prevodi traže nadgledanje, tako da onaj koji kontroliše mora da poznaje i jezik sa kojeg se sadržaj prevodi, i jezik na koji se prevodi. Tu nastaje problem za jezike za koje nemaju dovoljno volontera, tako da su manji projekti obično znatno lošijeg kvaliteta od engleske Wikipedia-e.

Izvor: The Verge

Facebook komentari:
Računari i Galaksija
Tagovi: , ,