Istraživanje otkriva: AI pretrage koriste manje poznate izvore
Od prošlogodišnjeg neuspelog lansiranja Google-ove funkcije AI Overviews, svet je postao svestan koliko se rezultati pretrage koje pokreće veštačka inteligencija mogu drastično razlikovati od tradicionalnih lista linkova koje pretraživači generišu već decenijama. Sada novo istraživanje kvantifikuje tu razliku i pokazuje da AI pretraživači češće citiraju manje popularne sajtove – pa čak i one koji se ne bi pojavili ni među prvih 100 rezultata u „organskoj“ Google pretrazi.

U radu Characterizing Web Search in The Age of Generative AI, istraživači sa Univerziteta Ruhr u Bohumu i Instituta Max Planck za softverske sisteme uporedili su tradicionalne rezultate Google pretrage sa njegovim AI Overviews i modelom Gemini-2.5-Flash. Analizirali su i GPT-4o u režimu web pretrage, kao i njegovu verziju sa dodatnim Search Tool modulom, koji koristi internet samo kada model proceni da mu je potreban podatak van sopstvenog znanja.
Istraživači su koristili test-upite iz različitih izvora: pitanja iz baze WildChat, političke teme sa portala AllSides, kao i proizvode sa liste 100 najtraženijih artikala na Amazonu. Rezultati pokazuju da AI pretrage češće citiraju izvore sa manje popularnih domena u poređenju sa tradicionalnim top-10 Google linkovima, mereno prema indeksu Tranco. Čak 53 odsto izvora koje koristi Google AI Overviews nije se pojavilo među prvih 10 rezultata standardne pretrage, dok 40 odsto tih izvora nije bilo ni među prvih 100. Gemini se naročito izdvojio po citiranju manje poznatih domena, pri čemu se prosečan izvor nalazio izvan Tranco liste 1.000 najpopularnijih.
To ne znači nužno da su AI rezultati „lošiji“. GPT-4o, na primer, češće je koristio izvore poput korporativnih sajtova i enciklopedija, dok gotovo nikada nije citirao društvene mreže. Analiza pokazuje i da AI rezultati obuhvataju približno isti broj pojmova i koncepata kao i klasična pretraga, što sugeriše sličan nivo detalja i raznolikosti. Ipak, primećeno je da generativni motori često kompresuju informacije, izostavljajući sporedne ili višeznačne aspekte koje tradicionalni rezultati zadržavaju – naročito kod dvosmislenih pojmova (recimo imena osoba).

AI pretrage imaju i određenu prednost jer kombinuju „unutrašnje znanje“ modela sa podacima sa mreže. GPT-4o sa Search Tool-om u mnogim slučajevima daje direktne odgovore bez citiranja izvora. Međutim, ta oslonjenost na unapred trenirane podatke može biti ograničenje za ažurne teme – na primer, pri pretragama pojmova iz Google-ove liste Trending Queries, model je često odgovarao zahtevom za dodatnim informacijama, umesto da sam izvrši novu pretragu.
Autori zaključuju da nije moguće jednoznačno oceniti da li su AI pretraživači „bolji“ ili „gori“, ali naglašavaju potrebu za novim metodama vrednovanja koje će istovremeno uzimati u obzir raznovrsnost izvora, pokrivenost pojmova i način sinteze informacija u generativnim sistemima.


