Kontinuirane misaone mašine mogle bi biti sledeći korak u razvoju veštačke inteligencije
Da li AI modeli „razmišljaju“?

Naši umovi i dalje su misterija
To je važno pitanje, jer korisnicima alata poput ChatGPT-a ili Claude-a često deluje kao da bot zaista razmišlja. Čak i korisnički interfejs ume da prikazuje poruke poput „razmišljam“, a danas čak možete i da pratite „lanac razmišljanja“ modela kako biste videli kako je došao do nekog zaključka. Međutim, istina je da, iako veliki jezički modeli (LLM-ovi) i drugi AI sistemi oponašaju određene aspekte razmišljanja, to još uvek nije isto što i rad prirodnog mozga. Ipak, novo istraživanje o kontinuiranim misaonim mašinama (CTM – Continuous Thought Machines) moglo bi to da promeni.
Šta je CTM?
Kontinuirana misaona mašina (CTM) je nova vrsta neuronske mreže koja bukvalno uključuje vreme u proces razmišljanja. Za razliku od klasičnih modela koji donose odluke kroz jednu obradu, svaki neuron u CTM-u prati svoju prethodnu aktivnost i koristi tu istoriju kako bi odlučio šta dalje da uradi. U maju 2025. godine, kompanija Sakana AI objavila je istraživački rad i blog post u kojem detaljno opisuje CTM model. Sakana tvrdi da je ovo nova vrsta neuronske mreže koja mnogo vernije oponaša način na koji funkcioniše ljudski mozak. Neuroni u CTM-u ne aktiviraju se samo jednom, već imaju kratkotrajnu memoriju i mogu da sinhronizuju svoje obrasce aktivacije sa drugim neuronima. Unutrašnje stanje mreže definiše se upravo tim obrascima sinhronizacije tokom vremena. To veoma podseća na sinhronizaciju u biološkom mozgu koja dovodi do moždanih talasa. Zbog toga su CTM-ovi veoma različiti od klasičnih dubokih neuronskih mreža ili transformera. Na primer, tipičan model baziran na transformer arhitekturi obrađuje tekst (ili sliku) kroz unapred definisani broj slojeva, odjednom. Drugim rečima, „razmišlja“ u kratkom naletu, a zatim miruje dok ne dobije novi unos. Ovo ima velike posledice. U postu se, između ostalog, navodi primer rešavanja lavirinta i posmatranja fotografija:
„Neverovatno je da, iako nije dizajniran s tom svrhom, rešenje koje uči za lavirinte izgleda vrlo razumljivo i ljudsko – možemo ga videti kako prati putanju kroz lavirint dok ‘razmišlja’ o rešenju. Kod pravih slika, iako nema eksplicitni podsticaj da ih istražuje pogledom, to ipak čini na intuitivan način.“
Još jedna važna rečenica iz teksta kaže:
„Nazvali smo novi model kontinuiranom misaonom mašinom (CTM) jer koristi novu vremensku dimenziju, bogatu dinamiku neurona i informacije o sinhronizaciji kako bi ‘razmišljao’ o zadatku i planirao pre nego što da odgovor. ‘Kontinuiran’ označava da model funkcioniše u unutrašnjoj dimenziji razmišljanja i može da obrađuje kako statične, tako i sekvencijalne podatke na isti način. Testirali smo ga na širokom spektru zadataka i pokazalo se da može da rešava različite probleme, često na vrlo razumljiv i jasan način.“
Zašto je ovo bolje od postojećih neuronskih mreža?
Glavna prednost CTM-a je što se odriče koncepta jednokratnog rešavanja problema („one-shot“), koji danas dominira u AI svetu. Današnji modeli moraju da daju tačan odgovor odmah, u okviru ograničenog prozora za obradu. To je i razlog zbog kojeg aktuelni LLM-ovi nemaju efikasan način da isprave greške koje povremeno prave. Pojavili su se dodaci poput „lanca razmišljanja“, samopodsećanja (self-prompting), pa i međusobne provere između modela, ali se čini da CTM pristup može da popuni važnu prazninu u tačnosti i pouzdanosti. Na osnovu onoga što Sakana navodi u svojim radovima, ovaj model može da spoji snage LLM-ova sa prilagodljivošću i razvojem prirodnog mozga. Moguće je i da CTM-ovi imaju veliki potencijal u robotici, gde bi fizičke mašine mogle učiti i razvijati se u stvarnom svetu slično kao ljudi.
Loše strane „preteranog razmišljanja“
Kontinuirano razmišljanje je moćno, ali ima svoje kompromise:
- Veća složenost i potrošnja resursa: Svakom neuronu se dodaje „memorija“ i istorija, što višestruko uvećava stanje mreže. Zbog toga je za obuku CTM-a potrebna znatno veća računska snaga, više memorije i više vremena za konvergenciju.
- Sporije izvođenje: Kada model proceni da mu treba više koraka „razmišljanja“ za teži zadatak, vreme izvođenja može se značajno produžiti.
- Postojeći alati nisu prilagođeni CTM-ovima: Većina današnjih biblioteka i alata oslanja se na statične modele, pa će biti potrebno vreme da alatke sustignu nove potrebe.
- Kad prestati sa razmišljanjem? Ovo je ključno pitanje. Postoji opasnost od „beskonačnog“ razmišljanja – model može ući u petlju. Ako ne postoje mehanizmi da ga zaustave u pravom trenutku, može doći do grešaka i „halucinacija“, slično onima koje već viđamo kod postojećih LLM-ova.
- Preciznost zaostaje: Prema izveštaju portala VentureBeat, rani CTM modeli još uvek ne dostižu tačnost najboljih transformera, što je ozbiljan izazov.
Iako ono što smo do sada videli o CTM-ovima, posebno iz radova Sakana AI-a, podseća na ponašanje ljudskog mozga, istina je da i dalje ne znamo dovoljno ni o sopstvenim umovima. Možda su istraživači AI-ja slučajno pronašli rešenje slično onom koje je evolucija oblikovala kroz milione godina, ali je isto tako moguće da razvijamo paralelni sistem koji bi jednog dana mogao da postigne slične sposobnosti. Utisak je da su aktuelni modeli (poput LLM-ova) samo jedan deo slagalice opšte veštačke inteligencije — više kao jezički centar mozga, a da CTM modeli deluju kao još jedan ključni deo te slagalice.
Izvor: Howtogeek