DeepMindov nov AI daje istoričarima moćan novi alat za tumačenje prošlosti
Google DeepMind je sarađivao sa naučnicima klasičnih nauka kako bi kreirao novi AI alat koji koristi duboke neuronske mreže.
Ithaca sistem vraća tekst, a može i da identifikuje lokaciju i datum oštećenih spisa
Cilj ove saradnje je da pomogne istoričarima da dešifruju tekst oštećenih natpisa iz drevne Grčke. Novi sistem, nazvan Ithaca, temelji se na ranijem sistemu restauracije teksta pod nazivom Pithia.
Ithaca ne pomaže samo istoričarima u obnavljanju teksta – ona takođe može da identifikuje lokaciju porekla teksta i datum stvaranja, navodi se u novom radu koji je istraživački tim objavio u časopisu Nature. U stvari, Ithaka je već korišćena da pomogne u rešavanju tekuće debate među istoričarima o tačnim datumima za grupu drevnih atinskih dekreta. Interaktivna verzija Ithake je besplatno dostupna, jer je u pitanju otvoreni kod. Mnogi drevni izvori — bilo da su napisani na svicima, papirusima, kamenu, metalu ili grnčariji — toliko su oštećeni da su veliki delovi teksta često nečitki. Utvrđivanje porekla tekstova takođe može biti izazov, jer su verovatno više puta premeštani.
Što se tiče tačnog utvrđivanja kada su nastali, radiokarbonsko datiranje i slične metode se ne mogu koristiti, jer mogu oštetiti neprocenjive artefakte. Dakle, zastrašujući i dugotrajan zadatak tumačenja ovih nepotpunih tekstova pada na takozvane epigrafiste koji su specijalizovani za te veštine. Da bi pomogli da se proces ubrza, istraživači iz DeepMind-a sarađivali su sa istraživačima na Univerzitetu u Oksfordu kako bi razvili Pithia, sistem restauracije drevnog teksta. Prvi korak istraživača bio je pretvaranje Packard Humanities Institute (PHI) baze podataka – najveće digitalne kolekcije drevnih grčkih natpisa – u machine-actionable tekst koji su nazvali PHI-ML. To je iznosilo oko 35.000 natpisa i više od 3 miliona reči od 7. veka pre nove ere do 5. veka nove ere. Zatim su istraživači obučili Pithiu (i sa rečima i sa pojedinačnim znakovima kao ulazima) da predvidi slova reči koja nedostaju u tim natpisima. Pithia je bila obučena da koristi mogućnosti prepoznavanja obrazaca dubokih neuronskih mreža. Kada se suočila sa nekompletnim natpisom, Pithia je proizvela čak 20 različitih mogućih slova ili reči koje bi mogle da popune praznine, kao i nivo pouzdanosti za svaku mogućnost.
Na istoričarima (tj. „stručnjacima iz domena“) je bilo da prouče te mogućnosti i donesu konačnu odluku na osnovu svoje stručnosti u predmetu. Tim je testirao sistem upoređujući Pithijine rezultate na popunjavanju 2.949 natpisa sa onima diplomiranih studenata Oksforda u epigrafiji. Pithijin rezultat imao je stopu greške od 30,1 posto, u poređenju sa stopom greške od 57,3 posto za studente. Pithia je takođe uspela da obavi zadatak mnogo brže, zahtevajući samo nekoliko sekundi da dešifruje 50 natpisa, u poređenju sa dva sata, koliko je bilo potrbno studentima. Sada je nastala Ithaca – pored mogućnosti obnavljanja teksta, Ithaca predviđa geografsku atribuciju nepotpunih natpisa. Distribucija verovatnoće u svim mogućim predviđanjima je vizualizovana na mapi, „da bi se rasvetlile moguće geografske veze širom drevnog sveta“, napisao je tim u propratnom postu na blogu.
Za hronološko pripisivanje, Ithaca daje distribuciju svojih predviđenih datuma između 800. pre nove ere i 800. godine nove ere. Testiranje je pokazalo da Ithaca sama po sebi može da postigne tačnost od 62 odsto u restauraciji oštećenog teksta, u poređenju sa 25 odsto tačnosti za ljudske istoričare. Ali kombinacija čoveka i mašine povećava ukupnu preciznost na 72 procenta, što pokazuje „potencijal za saradnju ljudi i mašina“ na terenu. Što se tiče pripisivanja natpisa njihovoj prvobitnoj lokaciji, Ithaca to može učiniti sa 71 posto tačnošću i datirati natpise u rasponu od 30 godina. Ithaca je već imala priliku da demonstrira svoju korisnost istoričarima u testu koji uključuje niz atinskih dekreta koji su bili u centru kontroverze o datiranju.
Istoričari su ranije vezali datume dekreta za najkasnije 446. pre nove ere. Ta procena je bila zasnovana na određenim oblicima slova (poznatim kao atička trokraka sigma) koje je atinska birokratija koristila tokom ovog perioda. Posle 446. pre nove ere, Atinjani su za svoje uredbe prešli na jonsku sigmu sa četiri trake. Ovo je bila standardna metodologija datiranja atinskih natpisa sve dok drugi istoričari nisu počeli da dovode u pitanje njene pretpostavke, posebno zato što se činilo da je nekoliko dekreta datiranih na ovaj način u suprotnosti sa istorijskim izveštajima Tukidida. Ovi istoričari su otkrili dokaze da je atičko pismo nastavilo da se koristi u zvaničnim dokumentima dugo nakon 446. pre nove ere. Zaključili su da bi datumi mnogih od ovih dekreta trebalo da budu ranije — oko 420. godine pre nove ere.
Ithaca je predvidela datum 421. pre nove ere, što je veoma u skladu sa tim zaključkom. „Iako može izgledati kao mala razlika, ova promena datuma ima značajne implikacije na naše razumevanje političke istorije klasične Atine“, rečeno je u saopštenju. Sledeći korak je razvoj dodatnih verzija Itake koje mogu da obnove tekst na drugim drevnim jezicima, uključujući akadski, demotski, hebrejski i majanski. Ovaj rad predstavlja veoma važan razvoj u zajedničkoj upotrebi veštačke inteligencije za poboljšanje restauracije, datiranja i atribucije natpisa napisanih na grčkom iz antičkog sveta tokom perioda od nekoliko vekova.
Izvor: Arstechnica