PC - Naših 30

Intervju: Od robota do AI budućnosti

U eri kada veštačka inteligencija postaje nezaobilazni deo svakodnevice, razgovarali smo sa dr Nemanjom Rakićevićem, naučnikom zaposlenim u kompaniji Google DeepMind, jednoj od vodećih svetskih laboratorija za razvoj AI tehnologija.

PCPress.rs Image

Profesionalni put dr Rakićevića, koji vodi od Novog Sada do Londona, od robotike do velikih jezičkih modela, predstavlja inspiraciju za sve one koji sanjaju o velikim naučnim dostignućima. U ovom intervjuu s njim smo razgovarali o tome kako je gradio svoj profesionalni put i kako sada prenosi svoje znanje mlađim naraštajima, kao i o mnogim drugim temama.

PC - Naših 30

Vaš put od Novog Sada do Google DeepMind-a je fascinantan. Možete li da ispričate kako je sve počelo?

Moje obrazovanje je započelo u Novom Sadu, najpre Osnovna škola „Svetozar Marković – Toza“ na Detelinari, zatim Gimnazija „Jovan Jovanović Zmaj“ i onda Fakultet tehničkih nauka Univerziteta u Novom Sadu, smer Mehatronika, robotika i automatizacija. Kada sam završio osnovne studije, želeo sam da nastavim da se bavim robotikom, sa fokusom na mobilnu robotiku.

PCPress.rs Image
dr Nemanja Rakićević

Za master studije sam završio EMARO – dvogodišnji program studija napredne robotike, koji se održavao na fakultetima u Đenovi, Nantu i Keio univerzitetu u Japanu. Nakon završenih studija sam radio kao istraživač u LAAS u Tuluzu i na Imperijal koledžu u Londonu, gde sam upisao doktorske studije, koje sam završio 2021. godine.

Tokom doktorskih studija sam se orijentisao na primenu AI metoda u robotici, kao što su sistemi upravljanja zasnovani na podacima, odnosno razvoj algoritama za treniranje sistema upravljanja na podacima dobijenim kroz interakciju robota sa svojim okruženjem dok ispunjava različite zadatke. Nakon druge godine studija bio sam na praksi u DeepMind-u na temu efikasnog transfera upravljačkih sistema naučenih u simuliranom okruženju, na prave fizičke robote.

Za vreme ove prakse sam mnogo naučio, naročito iz domena računarskih nauka, što izvorno nije bio moj smer na fakultetu, kao i rad na velikim projektima i u velikim timovima, što uglavnom nije slučaj na doktorskim studijama. Nakon doktoriranja sam se zaposlio u DeepMind-u kao istraživač (research scientist) i radio na raznim projektima u domenu podržanog učenja (reinforcement learning) i velikim jezičkim modelima (LLM) kao što je Gemini.

Nekada se čini da je posao naučnika da nađu rešenje za problem koji ne postoji, ali taj problem je uglavnom generalizacija postojećih problema i cilj je da se pronađe elegantno rešenje koje će ih pokriti

Od robotike do AI-ja

Kako ste napravili tranziciju iz sveta robotike ka AI i velikim jezičkim modelima? Šta je bilo najteže u tom prelasku? Kako danas ta multidisciplinarna perspektiva pomaže Vašem radu?

Još od osnovnih studija interesovala me je mobilna robotika i algoritmi planiranja koji su se tada najčešće
koristili za navigaciju u prostoru i mapiranje okruženja. Takvi algoritmi se uglavnom sastoje iz tri segmenta: percepcija okruženja (kroz kameru, različite senzore i slično), sistem za upravljanje i planiranje pokreta (glavni „mozak“ koji na osnovu okruženja i zadatka definiše niz narednih pokreta ka tom cilju) i aktuacija (izvršenje pokreta slanjem upravljačkih signala na motore koji se prenose na točkove, noge i slične robotske aktuatore).

S obzirom na to da u stvarnom svetu senzori i aktuatori nisu uvek pouzdani – na primer, zbog šuma kod senzora i praznog hoda kod motora – neophodno je napraviti segment zadužen za planiranje pouzdanim i robusnim na ove greške, tj. inteligentnijim. Algoritmi za planiranje i procesuiranje signala su se uglavnom zasnivali na fizičkim modelima s komponentama zasnovanim na teoriji verovatnoće.

U poslednjih 10-20 godina sve više se naginje ka korišćenju podataka dobijenih kroz interakciju robotskih
sistema sa svojim okruženjem i koriste se algoritmi mašinskog učenja da se dobiju naučeni modeli umesto modela zasnovanih na fizici.

PCPress.rs Image

Kroz upoznavanje s različitim metodologijama i ja sam svoje interesovanje i fokus usmeravao s tradicionalnih fizičkih modela ka modelima zasnovanim na učenju kroz podatke, kao što su neuronske mreže i algoritmi dubokog učenja (deep learning). Ova promena se prvenstveno desila tokom mog doktorata i prakse u DeepMind-u, jer sam u tom periodu najviše radio na sistemima upravljanja zasnovanim na neuronskim mrežama. Tokom tog perioda sam naučio mnogo o samim algoritmima i bazama podataka koje se koriste u ove svrhe, kao i usavršio znanje iz oblasti matematike (linearne algebre, teorije verovatnoće i statistike) koje su neophodne za razumevanje i implementaciju algoritama veštačke inteligencije.

Pročitajte i:  Microsoft Aurora AI precizno predviđa tajfun

Iako svoje znanje iz elektronike, mehanike i slično trenutno ne koristim koliko i pre, postoji dosta sličnosti između standardnih algoritama teorije upravljanja i nekih algoritama u AI, na primer, podržano učenje (reinforcement learning), što olakšava stvari. Takođe, uvek je dobro imati šire razumevanje i perspektivu oblasti, jer se neke teme, iako su kreirane za određenu primenu ili oblast, često mogu preneti u drugi kontekst i u drugu oblast nauke.

Jedan primer je koncept entropije, koji potiče iz termodinamike, ali se podjednako koristi i u teoriji informacija kao jedan od veoma značajnih koncepata u velikom broju algoritama AI.

Rad u DeepMind-u

Kako izgleda rad u Google DeepMind-u? Na čemu konkretno radite kada je reč o Gemini modelima i šta su, prema Vašem mišljenju, prednosti ovih modela?

Google DeepMind je, po mom mišljenju, jedno od retkih mesta na svetu gde možete naći neke od vodećih svetskih naučnika iz oblasti AI, ali i drugih prirodnih nauka, koji zajedno i koordinisano rade na nekim od najbitnijih naučnih projekata na svetu. Od razvoja fundamentalnih algoritama AI, do primene tih algoritama na realne probleme u svetu, kao što su predikcija funkcije proteina koja je neophodna za razvoj lekova, meteorologija i vremenska prognoza, do komercijalnih proizvoda kao što su AI asistenti i slično.

PCPress.rs Image

Pored toga, ljudi su veoma pristupačni i uvek otvoreni za kratke sastanke i diskusiju o istraživačkim idejama uz kafu – jer nam je intelektualna kreativnost i razmena ideja zapravo u opisu posla, što ga i čini veoma zanimljivim.

Trenutno radim na razvoju naprednih mogućnosti Gemini modela, kao što su korišćenje alatki (pretraživač, kalendar, e-mail i slično) i funkcija, odnosno programa, koje korisnik može sam da definiše. Ove mogućnosti čine Gemini mnogo sposobnijim nego modeli koji su samo naučeni na određenim informacijama, jer dobija mogućnost da u realnom vremenu dobija najnovije informacije sa Interneta da bi što verodostojnije odgovorio na zahtev ili da direktno komunicira s korisničkim programom da ispuni zadati zahtev.

Problem koji (ne) postoji

Pominjete da vas posebno motiviše intelektualna kreativnost kroz ceo istraživački proces. Možete li podeliti neki primer kako jedna ideja dođe do realizacije, to jest konkretne primene u proizvodima kao što je Gemini?

Nekada se čini da je posao naučnika da nađu rešenje za problem koji ne postoji, ali taj problem je uglavnom generalizacija postojećih problema i cilj je da se pronađe elegantno rešenje koje će ih pokriti. Jedna od čestih pojava kod velikih jezičkih modela jeste problem halucinacije, odnosno izmišljanja činjenica u svojim odgovorima. Postoji mnogo potencijalnih pristupa za rešavanje ovog problema,
kao što su pažljiv izbor i selekcija podataka za treniranje, fino do-treniranje (fine-tuning), tj. treniranje na
malom broju kvalitetnih podataka koristeći podržano učenje ili uz nadzor čoveka i slično.

Mi smo došli na ideju da bi trebalo iskoristiti sposobnost modela da generišu kod i činjenicu da je taj kod dovoljno kvalitetan da može da se izvršava. Kod takođe može da poziva različite funkcije kojima ima pristup, bilo iz instaliranih biblioteka ili koje se ad-hoc definišu tokom interakcije, kao što su pristup različitim API-jevima.

PCPress.rs Image

Jedan od takvih primera je korišćenje API-ja za Google Search, odnosno pretraživanje aktuelnih informacija na Internetu. Mi smo to implementirali i istrenirali model s nekoliko takvih primera, tako da kada pitamo za rezultat Olimpijade 2024, iako je model treniran na podacima pre leta 2024, umesto da halucinira rezultate, model je uspešno pronašao informacije na Internetu koristeći Google Search i tačno odgovorio na naš zahtev.

Ovaj sistem je integrisan u Gemini aplikaciju i to je pristup poznat kao RAG (retrieval augmented generation), koji čini Gemini model mnogostruko pouzdanijim i tačnijim u odnosu na modele koji ne koriste ovu sposobnost.

Sledeći veliki korak

Kuda ide budućnost AI i velikih jezičkih modela? Šta je sledeći veliki korak? Kako vidite uticaj AI na svakodnevni život običnih ljudi u narednih pet do deset godina? Da li ćemo videti pravu integraciju LLM-ova i RL u svakodnevnim alatima?

Pročitajte i:  Google inicijativa za podršku AI startapovima

AI, naročito veliki jezički modeli, već imaju neverovatan uticaj na današnje društvo i ekonomiju, posebno u poređenju s periodom pre 2022. godine, od kada su chatbot-ovi postigli ogromnu popularnost i interesovanje stručne i šire javnosti. Napredak u kvalitetu, kao i dijapazon sposobnosti i primena velikih jezičkih modela, eksponencijalno je porastao u proteklih godinu dana, zahvaljujući sve većem broju igrača u ovoj oblasti, kao i razvoju tehnologija treniranja i samog hardvera koji opslužuje ove modele.

Prirodno je pitati se šta nas očekuje – da li će doći do zasićenja ili do još većih iskoraka? Nažalost, jako je teško predvideti ovako nešto u oblasti u kojoj se inovacije dešavaju na dnevnom nivou i na način koji do sada još nije viđen u ljudskoj istoriji od industrijske i Internet revolucije. RL se već uveliko koristi za do treniranje velikih jezičkih modela, što je omogućilo iskorak u kvalitetu i sposobnostima istih, dok je pre komercijalna primena RL-a bila poprilično limitirana na sisteme preporuke i upravljačke sisteme za klimatizaciju kompjuterskih centara.

U skorijoj budućnosti verovatno možemo očekivati i dalji napredak u sposobnostima jezičkih modela i njihovu bolju integraciju u postojeće sisteme, naročito u manjim preduzećima i industrijama koje se nisu tradicionalno oslanjale na AI alate, kao što su pravo, zdravstvo, ali i nauka, pored ostalih.

Jedna od sposobnosti koja mi je naročito obećavajuća jesu takozvani agenti – jezički modeli koji imaju
pristup još širem skupu moćnijih alata, tako da samostalno izvršavaju zadate naredbe umesto da samo vraćaju odgovore na zahteve što je do sada bio slučaj. Pored alatki, agenti takođe imaju naprednije sposobnosti rezonovanja, jer u pozadini mogu da generišu nekoliko potencijalnih odgovora i da se preispituju i proveravaju svoje odgovore korišćenjem alatki, pre nego što korisniku vrate finalan odgovor na zahtev.

Pored jezičkih modela, budućnost primene AI deluje veoma optimistično i u drugim oblastima nauke. Kao primer bih izdvojio Nobelovu nagradu iz hemije koju su dobili autori AlphaFold modela za predikciju funkcije proteina. Očekujem da će se ovaj trend samo nastaviti i da je ovo tek početak.

Sindrom uljeza

Pominjete sindrom uljeza kao često osećanje među istraživačima. Kako se Vi lično nosite s tim?

Sindrom uljeza je veoma česta pojava i, prema mom mišljenju, dolazi iz toga što naučni rad zahteva dugoročan fokusiran rad, najčešće individualan ili u manjim timovima gde je povratna informacija retka i uglavnom dolazi od naučne zajednice kroz proces recenzije radova. Istraživači mnogo svoje energije ulažu u rad, tako da kada nešto ne ide dobro, često se profesionalni problemi shvataju lično.

U naučnoj zajednici se uglavnom vide samo pozitivni rezultati i ljudi retko pričaju o svojim neuspesima, tako da je veoma lako upasti u negativno stanje svesti i osećati se nedovoljno kvalitetnim u poređenju s drugima.

Iako su saveti i koraci kako izbeći ovakve situacije jednostavni, njihova implementacija nije nimalo laka i zahteva svestan trud. Moj pristup je da pokušavam da ne poistovećujem svoj profesionalni rad s ličnim kvalitetima i da budem svesniji da sve moje kolege prolaze kroz slične uspone i padove kao i ja. Drago mi je što se o ovoj temi više priča u poslednje vreme i nadam se da će se tako i nastaviti i da će narednim generacijama istraživača biti lakše.

Pored rada na AI, aktivni ste i u edukaciji mladih i povezivanju naučne zajednice. Šta vas je inspirisalo da pokrenete Serbian Researchers platformu i kako ona danas funkcioniše?

Platformu Serbian Researchers (SR) pokrenuli smo 2021. godine Luka Jakovljević, Velimir Bulatović i ja, sa ciljem da napravimo jedinstvenu platformu preko koje bi se naši istraživači iz različitih oblasti, u zemlji i inostranstvu, lakše pronalazili i povezivali, radi lakšeg ostvarivanja saradnje na radovima, projektima, pronalaženja poslova i slično.

SR smo osnovali kao neprofitnu i apolitičnu nevladinu organizaciju, sa ciljem da osnaži našu akademsku i industrijsku istraživačku zajednicu. Na sajtu možete pretraživati istraživače po lokaciji, instituciji i oblasti istraživanja i na profilima istraživača imate kratak opis njihovog istraživanja, spisak radova i način na koji ih možete kontaktirati.

Da bi osoba bila deo SR platforme, neophodno je da ispunjava barem jedan od tri uslova: da je student doktorskih studija, da ima barem jedan objavljen rad koji je prošao kroz proces recenzije ili da ima barem jedan patent. Jedan od ciljeva ove platforme je da i mlađim istraživačima olakša snalaženje u svetu nauke,
tako što im pomaže da stupe u kontakt s ljudima koji se bave oblastima koje ih interesuju i tako nauče više i donesu informisanu odluku čime bi želeli da se bave.

Pročitajte i:  Google inicijativa za podršku AI startapovima

Platformu smo pokrenuli i održavali nas trojica u svoje slobodno vreme i iz svojih ličnih sredstava. Želimo
da platforma postane samoodrživa i da bude korisna većem broju istraživača i pomogne našoj istraživačkoj zajednici, zato trenutno radimo na strategiji kakve dodatne sposobnosti želimo da ima, na primer, vesti, događaje i slično, kao i dodatne izvore finansiranja koji bi nam omogućili da ovo sve izvedemo.

Motivacija za osnivanje Serbian Researchers je da olakša povezivanje sa istraživačima u oblasti koja nas zanima da bismo više naučili i doneli informisanu odluku kojom oblasti želimo da se bavimo

Letnje škole

Letnje škole poput Eastern European Machine Learning Summer School (EEML) i Mediterranean Machine Learning Summer School (M2L) postale su centralna mesta za AI zajednicu. Zašto su one važne?

Letnje škole su prvenstveno namenjene studentima doktorskih studija, jer im omogućavaju da, slično kao i na konferencijama, slušaju predavanja istaknutih svetskih eksperata iz različitih oblasti AI, kao i da se povezuju s kolegama iz iste oblasti.

Glavna prednost u odnosu na konferencije jeste to što su letnje škole znatno manjeg formata (100-300 polaznika u odnosu na nekoliko hiljada), što omogućava mnogo ličnije i kvalitetnije iskustvo i više su fokusirane na doktorande i istraživače koji su u ranim fazama svoje karijere. Pored toga, letnje škole obično imaju i edukativni karakter, jer često sadrže i segmente s tutorijalima, panelima i slično, gde učesnici mogu da nauče i primene nove metode.

Dodatna korist koja čini EEML i M2L posebnim u odnosu na ostale letnje škole jeste to što one imaju dodatni fokus na lokalne zajednice i teže da ih osnaže tako što se održavaju na lokacijama gde istraživači uglavnom nemaju pristup ekspertima iz oblasti. EEML se fokusira na region istočne Evrope, a M2L na region Mediterana. S obzirom na to da je Srbija, odnosno Balkan, na preseku te dve oblasti, ove škole su bile izuzetno korisne za naše istraživače iz oblasti AI i stavljaju naše zemlje na mapu svetske AI istraživačke scene.

Šta biste poručili studentima i mladima iz Srbije koji žele da prate Vaš put — da uđu u svet AI, mašinskog učenja i da se možda jednog dana pridruže timovima kao što je DeepMind?

Situacija je danas mnogo drugačija nego kada sam ja počeo svoju akademsku karijeru. Informacije su znatno dostupnije preko online resursa, poput blogova, repozitorijuma koda, konferencija koje radove čine dostupnim onlajn, YouTube tutorijala, podkasta, i naravno LLM chatbot-ova i slično, tako da je mnogo lakše savladati materiju i pratiti najnovija dostignuća. Upravo zbog ove proliferacije resursa i povećane dostupnosti, više ljudi može da se bavi naukom i samim tim je i napredak u nauci mnogo brži. S druge strane, konkurencija je mnogo veća.

Moj savet istraživačima bi bio da se ova trenutna situacija iskoristi najbolje moguće – da se resursi maksimalno iskoriste i da se nađe oblast koja vas interesuje koja možda nije nužno najpopularnija, tj. gde konkurencija nije najveća, ali koja ima potencijal i još dosta otvorenih pitanja. Najteži korak je odlučiti čime želimo da se bavimo i šta nas ispunjava, a taj problem je tu oduvek, samo je sada uz dostupnost informacija lakše doneti informisanu odluku. Motivacija za osnivanje Serbian Researchers je upravo da pomogne oko ovog dela i olakša povezivanje sa istraživačima u oblasti koja nas zanima da bismo više naučili i doneli informisanu odluku kojom oblasti želimo da se bavimo.

Facebook komentari:
Tagovi:

Leave a Reply

Your email address will not be published. Required fields are marked *