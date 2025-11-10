Sledeći put kada na društvenim mrežama naiđete na neobično ljubazan ili uljudan komentar – proverite dva puta. Možda komentator i nije čovek, već veštačka inteligencija koja (neuspešno) pokušava da se stopi s masom, piše portal Ars Technica.

U sredu su istraživači sa Univerziteta u Cirihu, Univerziteta u Amsterdamu, Univerziteta Djuk i Njujorškog univerziteta objavili studiju koja pokazuje da su AI modeli i dalje lako prepoznatljivi u onlajn konverzacijama, pri čemu je preterano prijateljski i emotivan ton najupadljiviji znak. U istraživanju, koje je obuhvatilo devet otvorenih modela na platformama X, Bluesky i Reddit, njihovi klasifikatori su uspešno otkrivali AI-generisane odgovore sa tačnošću od 70 do 80 procenata.

Studija uvodi ono što autori nazivaju „računarski Tjuringov test“ – način da se proceni koliko se AI modeli približavaju ljudskom jeziku. Umesto subjektivnog ljudskog suda o tome da li tekst zvuči autentično, ovaj okvir koristi automatske klasifikatore i jezičku analizu da bi otkrio specifične osobine koje razlikuju tekst koji je napisala mašina od onog koji je napisao čovek.

„Čak i nakon podešavanja izrazi velikih jezičkih modela ostaju jasno prepoznatljivi u poređenju s ljudskim tekstom, posebno u emotivnom tonu i izražavanju osećanja“, navode istraživači. Tim na čelu s Nikolom Paganom sa Univerziteta u Cirihu testirao je različite strategije optimizacije – od jednostavnog promptovanja do dubljeg finog podešavanja – ali su emocionalni tragovi i dalje ostali najpouzdaniji pokazatelji da određeni onlajn odgovor potiče od veštačke inteligencije.

U okviru studije testirano je devet velikih jezičkih modela: Llama 3.1 8B, Llama 3.1 8B Instruct, Llama 3.1 70B, Mistral 7B v0.1, Mistral 7B Instruct v0.2, Qwen 2.5 7B Instruct, Gemma 3 4B Instruct, DeepSeek-R1-Distill-Llama-8B i Apertus-8B-2509.

Kada su bili zamoljeni da odgovore na prave objave stvarnih korisnika, pokazalo se da imaju poteškoće da oponašaju tipičnu ljudsku neformalnost, sarkazam i spontanost. Njihovi odgovori su uvek bili pristojniji i s nižim stepenom toksičnosti od autentičnih ljudskih komentara.

Da bi umanjili te razlike, istraživači su pokušali različite tehnike optimizacije (uključujući davanje primera stvarnog komentarisanja i kontekstualne informacije), ali su razlike u emocionalnom tonu ostale. „Naši sveobuhvatni testovi dovode u pitanje pretpostavku da sofisticiranija optimizacija nužno donosi humanije rezultate“, zaključuju autori.

Jedno od najzanimljivijih otkrića bilo je da instrukcijski trenirani modeli (oni koji su dodatno obučeni da slede korisnička uputstva i budu korisni) zapravo lošije imitiraju ljude od svojih osnovnih verzija. Modeli poput Llama 3.1 8B i Mistral 7B v0.1 pokazali su bolju ljudskost od svojih „Instruct“ verzija.

Zanimljivo je i da povećavanje veličine modela nije donelo prednost – Llama 3.1 70B nije bila ništa bolja (a ponekad i lošija) od manjih modela sa 8 milijardi parametara, čime su poljuljane pretpostavke da veći modeli stvaraju autentičniji govor.

Istraživači su uočili osnovni paradoks: kada su modeli bili podešeni da zvuče više ljudski, njihovi odgovori su se sadržajno više udaljavali od stvarnih ljudskih komentara. A kada su pokušavali da budu sadržajno bliži ljudskim odgovorima, postajali su lakše prepoznatljivi kao veštački.

Jednostavne tehnike su dale bolje rezultate od kompleksnih – kada je AI dobijao konkretne primere korisnikovih prethodnih objava, tekst je postajao uverljiviji, dok su sofisticirane metode (poput finog podešavanja prema opisu ličnosti korisnika) imale zanemarljiv ili čak negativan efekat.

Postojale su i razlike među platformama: AI je najuspešnije oponašao korisnike na mreži X, nešto lošije na Bluesky-ju, dok je Reddit bio najlakši za detekciju veštačkih odgovora. Istraživači smatraju da to odražava razlike u stilu komunikacije i u stepenu zastupljenosti podataka tih platformi u treninzima modela.

Rezultati, koji još nisu prošli stručnu recenziju, mogli bi da imaju važne implikacije i za razvoj AI modela i za autentičnost na društvenim mrežama. I pored svih pokušaja, današnji alati i dalje imaju problema da imitiraju spontanost i emocionalnu nijansu ljudske komunikacije. Autori zaključuju da su „stilistička sličnost i semantička tačnost konkurentski, a ne usklađeni ciljevi“, što znači da AI tekst i dalje ostaje – previše veštački da bi bio stvaran.

Na kraju, dok istraživači pokušavaju da AI zvuči što više kao čovek, pravi korisnici društvenih mreža i dalje dokazuju da autentičnost znači i biti pomalo haotičan, protivrečan – i ponekad neprijatan. A to, kako se pokazuje, ostaje najteži izazov za veštačku inteligenciju.