Novi AI model od slika pravi interaktivne 3D snimke
Nova AI alatka je otvoreno dostupna svima, a od običnih slika pravi 3D video sadržaje koji mogu da se istražuju kao pravi snimci. Za sve to je naravno potrebna ozbiljna GPU snaga.

U pitanju je HunyuanWorld-Voyager kompanije Tencent koji od jedne slike može da napravi video. Korisnici potom mogu da pokreću „kameru“ i „istražuju“ novonastali prostor. Model radi tako što istovremeno generiše RGB video i daje informacije o dubini slike, pa nema potrebe za tradicionalnim tehnikama modeliranja. To ne znači da je sve savršeno – stručnjaci kažu da neće uskoro zameniti tradicionalne načine za pravljenje video igara.
Rezultat dakle nije pravi 3D model, ali postiže sličan efekat: AI alatka kreira 2D video frejmove zahvaljujući kojima deluje da se kamera kreće kroz 3D prostor. Video je kratak – traje tek dve sekunde, ali korisnik kasnije može da poveže više njih u jednu celinu. Korisnik može da precizira kako će se kretati kamera – napred ili unazad, levo, desno, ili ukrug.
Sistem koristi dva glavna dela koji rade zajedno, navodi se u Tencent-ovom tehničkom izveštaju. Prvo istovremeno generiše video u boji i podatke o dubini, vodeći računa da se savršeno poklapaju — kada se na videu pojavi drvo, podaci o dubini tačno ukazuju na kojoj udaljenosti se to drvo nalazi. Drugo, koristi ono što Tencent naziva „svetski keš“ — rastuću kolekciju 3D tačaka nastalih iz prethodno generisanih frejmova. Prilikom generisanja novih frejmova, ovaj oblak tačaka se projektuje nazad u 2D iz nove kamere kako bi se kreirale delimične slike koje prikazuju ono što bi trebalo da bude vidljivo na osnovu prethodnih frejmova. Model onda koristi ove projekcije kao proveru konzistentnosti, obezbeđujući da se novi frejmovi usklade sa već generisanim.
Ova alatka se pridružuje sve većoj kolekciji modela za generisanje svetova koje razvijaju različite kompanije. Google-ov Genie 3, najavljen u avgustu 2025, generiše interaktivne svetove u rezoluciji od 720p i 24 frejma u sekundi na osnovu tekstualnih promptova, čime omogućuje navigaciju u realnom vremenu u trajanju od nekoliko minuta.
Mirage 2 iz Dynamics Laba nudi generisanje svetova kroz internet pregledač, pa korisnicima omogućava da otpreme slike i pretvore ih u interaktivna okruženja uz tekstualne komande koje se zadaju u realnom vremenu. Dok se Genie 3 fokusira na treniranje AI agenata i nije javno dostupan, a Mirage 2 naglašava sadržaj koji kreiraju korisnici za potrebe gejminga, Voyager je usmeren na produkciju videa i radne procese 3D rekonstrukcije.
Voyager obećava puno, a najveći izazov za sada je procesorska snaga koja mu je neophodna – nemaju svi moćne mašine. Poznavaoci uprkos tome tvrde da svedočimo važnim koracima ka novoj interaktivnoj „umetničkoj formi“ (ako uopšte možemo da zovemo umetnošću ono što čovek nije samostalno stvorio).


