Najnoviji Google AI koristi veb pregledač
Google predstavlja novi Gemini AI model dizajniran za navigaciju i interakciju sa vebom putem pregledača, omogućavajući veštačkim agentima da rade stvari unutar interfejsa dizajniranih za upotrebu od strane ljudi, a ne robota. Model, nazvan Gemini 2.5 Upotreba računara, koristi „vizuelno razumevanje i mogućnosti rasuđivanja“ da bi analizirao zahtev korisnika i izvršio zadatak, kao što je popunjavanje i slanje formulara.

Može se koristiti za testiranje korisničkog interfejsa ili navigaciju interfejsa napravljenih za ljude koji nemaju dostupan API ili drugu direktnu vezu. Druge verzije ovog modela su korišćene za agentske funkcije u veštačkom režimu i Projektu Mariner, istraživačkom prototipu koji koristi veštačke agente da samostalno obavljaju zadatke u pregledaču, kao što je dodavanje artikala u korpu na osnovu liste sastojaka.
Googleova objava dolazi samo dan nakon što je OpenAI otkrio nove aplikacije za ChatGPT kao deo svog godišnjeg Dana razvoja i nastavlja da usmerava pažnju na svoju funkciju ChatGPT agenta koja može da završi složene zadatke u vaše ime. U međuvremenu, Anthropic je već prošle godine objavio verziju svog Claude AI modela sa „korišćenjem računara“.
Google je objavio nekoliko demo video snimaka koji prikazuju njegov alat za korišćenje računara u akciji i napominje da su ubrzani 3 puta.
Google kaže da njegov model korišćenja računara „nadmašuje vodeće alternative na višestrukim veb i mobilnim testovima“. Za razliku od ChatGPT agenta i Anthropic-ovog alata za korišćenje računara, Google-ov novi AI model ima pristup samo pregledaču — ne celom računarskom okruženju. Google napominje da pokazuje da „još uvek nije optimizovan za kontrolu na nivou desktop operativnog sistema“ i trenutno podržava 13 radnji, uključujući otvaranje veb pregledača, kucanje teksta, kao i prevlačenje i ispuštanje elemenata.
Gemini 2.5 Computer Use je dostupan programerima putem Google AI Studio i Vertex AI, ali postoji i demo na Browserbase-u, gde gledate kako završava zadatke, poput „Igraj igru 2048“ ili „Pregledaj hakerske vesti za trendovske debate“.
Izvor: TheVerge


