Može li mašina da misli kao čovek? Test koji treba da odgovori na to pitanje osmislio je Alan Tjuring a sada je, 75 godina posle ove ideje, Chat GPT-4.5 (Orion) položio Tjuringov test.

Ušli smo u doba veštačke inteligencije i jedna od najprisutnijih tema i enigmi naučnog sveta jeste koliko veštačka inteligencija može da se približi prirodnoj čovekovoj inteligenciji. Može li se „mašina“ naučiti da misli i koji su kriterijumi na osnovu kojih se takva procena može napraviti?

To pitanje svakako nije novo i o njemu se razmišlja već decenijama, a relevantan postupak da se ta procena napravi dao je još pre 75 godina genijalni naučnik Alan Tjuring. On je osmislio test za procenu koji do sada nijedna „mašina“ nije uspela da prođe, ali se nedavno pojavio AI model koji je u tome uspeo.

Tjuringov test

Alan Tjuring je britanski matematičar koji se bavio logikom i kriptografijom. Radio je na softveru jednog od prvih pravih računara Mark I, a posebno je značajan njegov rad u britanskom kriptoanalitičkom centru tokom Drugog svetskog rata: za samo nekoliko nedelja je, u saradnji sa kolegama, uspeo je da napravi kriptoanalitički uređaj Bomba za razbijanje nemačkog uređaja za šifrovanje poruka pod nazivom Enigma. Nakon toga razvio je teoriju (turingizmus) koja će predstavljati osnovu za konstruisanje prvog programabilnog računara pod nazivom Kolos.

Tjuringov test – možete li da prepoznate računar

Alan Tjuring se smatra ocem modernog računarstva, a posebno su značajna njegova dostignuća u oblasti veštačke inteligencije. Dilemu o mogućnosti veštačke inteligencije da misli poput čoveka on je preinačio u procenu kvaliteta veštačke inteligencije na osnovu toga koliko dobro imitira čovekovu inteligenciju. Za tu procenu osmislio je test (poznat kao Tjuringov test), čije je principe 1950. godine opisao u radu „Računarske mašine i inteligencija“. Rad je zasnovan na činjenici, po Tjuringu, da ljudi ne umeju da definišu inteligenciju na dovoljno precizan način, ali da umeju da prepoznaju inteli­gentno ponašanje.

GPT-4.5 je procenjen kao ljudsko biće u 73 odsto slučajeva, LLama 3.1 u 56 odsto, a ELIZA i GPT-4 sa znatno nižim procentom (23, odnosno 21 odsto).

Značaj Tjuringovih radova potvrđen je mnogo puta, pa je Asocijacija za računarstvo 1966. godine ustanovila nagradu s njegovim imenom za oblast računarstva, što je danas ekvivalent Nobelove nagrade u ovoj oblasti. Pomenimo i činjenicu da je 2014. godine snimljen američki film o njemu, biografski triler pod nazivom The Imitation Game koji preporučujemo našim čitaocima.

Igra imitacije

Tjuring je svoj test zasnovao na misaonom eksperimentu, igri imitacije. U igri učestvuju tri entiteta. Jedan od njih (čovek) igra ulogu ispitivača, dok su druga dva učesnika (čovek i računar) smešteni u drugoj prostoriji. Ispitivač postavlja pitanja, a ostala dva učesnika odgovaraju. Na osnovu njihovih odgovora ispitivač treba da izvede zaključak koji od učesnika je čovek, a koji računar. Računar prolazi Tjuringov test ako „prevari“ ispitivača da je njegove odgovore dao čovek.

Prvi pokušaj razgovora sa računarom na slobodnu temu

Komunikacija između učesnika u igri obavlja se pisanim putem, s obzirom na to da računar ne bi bio ravnopravan čoveku u govoru. U početku, s obzirom na stepen razvoja tehnologije, Tjuring je predložio da se za komunikaciju koristi teleprinter, ali su danas dostupne mnoge naprednije i pogodnije mogućnosti putem različitih Internet servisa.

Iako mnogo puta kritikovan, Tjuringov test je ipak postao važan koncept u proceni veštačke inteligencije i do danas je jedini operativni pogled na AI. Da bi neki računarski program prošao Tjuringov test, treba dovoljno puta da pobedi u igri imitacije. Prema Tjuringovim stavovima, to znači da treba da pobedi u više od 50 odsto slučajeva. S razvojem tehnologije prolazak Tjuringovog testa postaje sve teži, s obzirom na to da obični ljudi u ulozi ispitivača u početku nisu ništa znali o računarima.

Bilans prolaza Tjuringovog testa

Opšta je tvrdnja da do sada nijedan računar nije uspeo da prođe Tjuringov test. Ipak, bilo je ozbiljnih kandidata. Jedan od prvih je četbot ELIZA, koji je još 1966. godine razvio nemačko-američki informatičar i profesor na MIT-u Jozef Vajzenbaum. Program je dobio ime po književnom liku Elize Dulitl (junakinja predstave „Pigmalion“, Džordža Bernarda Šoa… verovatno je znate po sjajnom filmu My Fair Lady, gde je igra Audrey Hepburn), koja je uspela da nauči pravilan izgovor i gramatiku iako je bila potpuno neobrazovana, i tako „prođe“ kao osoba kraljevske krvi. Na isti način i kompjuterski program treba da se nauči da „misli“ onako kao što to radi čovek.

Tjuringov test opisan je 1950. godine u radu „Računarske mašine i inteligencija“. Tjuring je smatrao da ljudi ne umeju da definišu inteligenciju na dovoljno precizan način, ali da umeju da prepoznaju inteligentno ponašanje

ELIZA je programirana da traži ključne reči u pitanjima ispitivača i da ih iskoristi kako bi dala relevantne odgovore. Na taj način je uspela da prevari neke ispitivače, ali ne dovoljno da prođe Tjuringov test (23 odsto maksimalno). Usledili su mnogobrojni pokušaju drugih modela veštačke inteligencije. Treba pomenuti superkompjuter Eugene Goostman, razvijen u Sankt Peterburgu 2001. godine (Vladimir Veselov, Eugene Demchenko i Sergej Ulasen), chatbot koji je simulirao 13-godišnjeg ukrajinskog dečaka. Na Tjuringovom testu on je ostvario „prolaz“ sa 33 odsto.

Nove značajne rezultate ostvario je OpenAI-ev Chat GPT. Najpre je u junu 2024. objavljeno da je Chat GPT-4 prošao Tjuringov test. U eksperimentu 500 ljudi je razgovaralo sa četiri različita ispitanika, od kojih je jedan bio čovek, a ostali modeli veštačke inteligencije (ELIZA, GPT-3.5 i GPT-4). Razgovori su trajali po pet minuta. Rezultati su pokazali da je Chat GPT-4 prošao test sa 54 procenta, čovek sa 67 odsto, GPT-3.5 sa 50 odsto, a Eliza sa standardna 22 odsto. I dok se još uvek izražava sumnja u validnost tih rezultata (na granici prolaznosti), stigla je nova informacija iz OpenAI-ja: Chat GPT-4.5 prošao je Tjuringov test sa fantastičnih 73 odsto.

Prvi AI model koji je prošao Tjuringov test

Chat GPT-4.5 (kodnog imena Orion) je LLM model OpenAI GPT serije, realizovan februara 2025. godine. Kako ga opisuje Sem Altman, izvršni direktor OpenAI-ja, to je ogroman i skup model, s naprednim mogućnostima učenja na osnovu povratnih informacija koje dolaze od ljudi. Obučen je korišćenjem Microsoft-ove platforme u oblaku Azure. Testiran je MMLU test setom (procena mogućnosti velikih jezičkih modela) za 15 različitih jezika, pri čemu je za svaki od njih nadmašio GPT-4.

OpenAI Chat GPT-4.5 model

Najnovije istraživanje obuhvatalo je eksperiment od osam rundi na online habu (čvorištu). U njemu je učestvovalo oko 300 učesnika, koji su nasumično raspoređivani da budu ispitivači ili jedan od dva ispitanika, dok je drugi ispitanik bio chatbot. Osim GPT-4.5, istraživanje je procenjivalo i modele Meta LLama 3.1-405B, OpenAI Chat GPT-4.0 i stari program ELIZA.

Eksperimentom je upravljao Cameron Jones, koji je izjavio: „GPT-4.5 je znatno češće procenjen kao čovek nego što su bili procenjeni stvarni ljudi“. Eksperiment je pokazao da je GPT-4.5 procenjen kao ljudsko biće u 73 odsto slučajeva, LLama 3.1 sa 56 odsto (gotovo u istom procentu kao ljudi), a ELIZA i GPT-4 sa znatno nižim procentom (23, odnosno 21 odsto).

Iako mnogo puta kritikovan, Tjuringov test je ostao važan koncept u proceni veštačke inteligencije i do danas je jedini operativni pogled na AI

Ovo je prvi put da je mašina prošla Tjuringov test, ali svakako ne i poslednji. Iako ima mišljenja da je Tjuringov test zastareo i da ne ide u korak s vremenom, on je još uvek vrlo aktuelan, jer ne predstavlja statičnu evaluaciju modela veštačke inteligencije i lako se prilagođava aktuelnom razvoju tehnologije.

Ipak, imitacija čovekovog razmišljanja daleko je od scenarija u kome AI u potpunosti zamenjuje čoveka, što je jedna od najvećih strepnji za razvoj veštačke inteligencije u budućnosti. Taj proces se odnosi samo na imitaciju čovekovog razmišljanja, dok su ostali aspekti čovekovog ponašanja u komunikaciji, uključujući pre svega emocije, mnogo složeniji i ne mogu se uspešno imitirati. Za sada.

Autor: Nadežda Veljković

