AI sada može da igra Minecraft jednako dobro kao i vi – evo zašto je to važno
Stručnjaci u OpenAI obučili su neuronsku mrežu da igra Minecraft po jednako visokom standardu kao i ljudski igrači.
OpenAI je razvio neuronsku mrežu sposobnu da igra Minecraft po standardu ljudskog nivoa
Neuronska mreža je obučena na 70.000 sati raznih snimaka u igri, dopunjenih malom bazom podataka video snimaka u kojima su izvođači obavljali specifične zadatke u igri, a takođe su snimljeni ulazi sa tastature i miša. Nakon finog podešavanja, OpenAI je otkrio da je model u stanju da izvodi sve vrste složenih veština, od plivanja do lova na životinje i konzumiranja njihovog mesa. Takođe je shvatio „pillar jump“, potez kojim igrač stavlja blok materijala ispod sebe usred skoka kako bi postigao visinu. Možda je najimpresivnije to što je AI uspela da napravi dijamantske alate (za koje je potreban dug niz radnji koje se izvršavaju sekvencijalno), što je OpenAI opisao kao dostignuće „bez presedana“.
Značaj Minecraft projekta je u tome što demonstrira efikasnost nove tehnike koju je OpenAI primenio u obuci AI modela – pod nazivom Video PreTraining (VPT) – za koju kompanija kaže da bi mogla da ubrza razvoj „generalnih compuret-using agenata“. Istorijski gledano, poteškoća sa korišćenjem sirovog videa kao izvora za obuku AI modela bila je u tome što je ono što se dogodilo dovoljno jednostavno da se razume, ali ne nužno i kako. U stvari, AI model bi apsorbovao željene rezultate, ali ne bi razumeo ulazne kombinacije koje su potrebne da bi se oni postigli. Međutim, sa VPT-om, OpenAI uparuje veliki skup video podataka koji je izvučen iz javnih web izvora sa pažljivo odabranim skupom snimaka označenih relevantnim pokretima tastature i miša kako bi se uspostavio osnovni model.
Da bi fino podesio osnovni model, tim zatim uključuje manje skupove podataka dizajnirane da podučavaju specifične zadatke. U ovom kontekstu, OpenAI je koristio snimke igrača koji izvode radnje u ranoj igri, kao što su sečenje drveća i pravljenje stolova za izradu, za koje se kaže da je donelo „ogromno poboljšanje“ u pouzdanosti sa kojom je model bio u stanju da izvrši ove zadatke. Druga tehnika uključuje „nagrađivanje“ AI modela za postizanje svakog koraka u nizu zadataka, praksa poznata kao učenje uz pomoć. Ovaj proces je omogućio neuronskoj mreži da prikupi sve sastojke za dijamantski pijuk sa stopom uspeha na nivou čoveka.
„VPT utire put ka omogućavanju agentima da nauče da deluju gledajući ogroman broj video snimaka na internetu. U poređenju sa generativnim video modeliranjem ili kontrastivnim metodama koje bi dale samo reprezentativne prioritete, VPT nudi uzbudljivu mogućnost direktnog učenja velikih bihejvioralnih prioriteta u više domena nego samo u jeziku“, objasnio je OpenAI u postu na blogu. „Iako eksperimentišemo samo u Minecraft-u, igra je veoma otvorena, a izvorni ljudski interfejs (miš i tastatura) je veoma generički, tako da verujemo da su naši rezultati dobri za druge slične domene, npr. korišćenje računara”. Da bi podstakao dalje eksperimentisanje, OpenAI se udružio sa MineRL NeurIPS takmičenjem, donirajući svoje podatke o izvođačima i kod modela takmičarima koji pokušavaju da koriste veštačku inteligenciju za rešavanje složenih Minecraft zadataka. Glavna nagrada: 100.000 dolara.
Izvor: Techradar