Veštačka inteligencija daje „atletski inteligentnog“ psa robota
Jednog dana, kada nas zadese potresi, požari i poplave, prvi koji reaguju mogli bi biti čopori robotskih pasa spasilaca koji jure da pomognu nesrećnicima. Ovi četvoronošci na baterije bi koristili kompjuterski vid da bi odredili prepreke i koristili veštine agilnosti poput psa da bi ih prevazišli.
U tom cilju, istraživači veštačke inteligencije na Univerzitetu Stanford i Šangajskom Qi Zhi institutu kažu da su razvili novi algoritam zasnovan na viziji koji pomaže robopsima da preskaču visoke objekte, skaču preko praznina, puze ispod pragova, provlače se kroz pukotine, a zatim se kreću ka sledećem izazovu. Algoritam predstavlja mozak robodoga.
„Autonomija i raspon složenih veština koje je naš četvoronožni robot naučio je prilično impresivan“, rekla je Čelsi Fin, docent računarstva i viši autor novog recenziranog rada koji objašnjava rad tima. „A mi smo ga kreirali koristeći obične robote.“
Ključni napredak, kažu autori, je to što je njihov robopas autonoman, to jest, u stanju je da odredi fizičke izazove i zamisli, a zatim izvrši, širok spektar agilnih veština zasnovanih jednostavno na preprekama koje vidi.
„Ono što radimo je kombinovanje percepcije i kontrole, koristeći slike sa dubinske kamere postavljene na robota i mašinsko učenje da obradimo sve te unose i pomeramo noge kako bismo prešli, ispod i zaobišli prepreke“, rekao je Zipeng Fu, doktorant u Finovoj laboratoriji i prvi autor studije, zajedno sa Ziwen Zhuang iz Šangajskog instituta Qi Zhi.
Njihov robopas nije prvi koji je pokazao takvu agilnost – vrsta atletike poznat kao “parkour” – ali je prvi koji je kombinovao samodovoljnost sa širokim spektrom veština.
„Naši roboti imaju i viziju i autonomiju, atletsku inteligenciju da odmere izazov i da sami izaberu i izvode veštine parkura na osnovu zahteva trenutka“, rekao je Fu.
Postojeće metode učenja se često zasnivaju na složenim sistemima nagrađivanja koji se moraju fino prilagoditi određenim fizičkim preprekama. Shodno tome, oni se ne uklapaju dobro u nova ili nepoznata okruženja. Drugi pristupi uče koristeći podatke iz stvarnog sveta kako bi imitirali agilne veštine životinja. Tim robopsima nedostaje širok skup veština i nemaju mogućnosti vida novih robopasa. I obe postojeće metode su računarski spore.
Prema studiji, ovo je prva aplikacija otvorenog koda koja postiže ove ciljeve jednostavnim sistemom nagrađivanja koji ne koristi referentne podatke iz stvarnog sveta.
Da bi uspeli, prvo su sintetizovali i usavršili algoritam koristeći kompjuterski model, a zatim ga preneli na dva robopsa iz stvarnog sveta. Zatim, u procesu koji se naziva učenjem pojačanja, roboti su pokušali da krenu napred na bilo koji način koji su smatrali prikladnim i bili su nagrađeni na osnovu toga koliko su dobro uradili. Ovako algoritam na kraju uči na najbolji način da pristupi novom izazovu.
U praksi, većina postojećih sistema nagrađivanja učenja sa pojačavanjem uključuje previše varijabli da bi bili efikasni, usporavajući računarske performanse. To je ono što pojednostavljeni proces nagrađivanja za robopas parkour čini izuzetnim i iznenađujuće jednostavnim.
“To je zapravo prilično jednostavno”, rekao je Fin. „Uglavnom smo ga zasnivali na tome koliko se robot kreće napred i količini napora koji je uložio da to uradi. Na kraju, robot uči složenije motoričke veštine koje mu omogućavaju da napreduje.”
Tim je izveo opsežne eksperimente koristeći robopse iz stvarnog sveta kako bi demonstrirao svoj novi pristup agilnosti u posebno izazovnim okruženjima koristeći samo računare, vizuelne senzore i sisteme napajanja tih robopasa.
Novi i poboljšani robopsi su bili u stanju da se penju na prepreke više od jedne i po puta njihove visine, da preskaču razmake veće od jedan i po puta njihove dužine, da puze ispod barijera tri četvrtine njihove visine, i naginju se da bi se provukli kroz prorez tanji od njihove širine.
Zatim, tim se nada da će iskoristiti napredak u 3D viziji i grafici kako bi dodao podatke iz stvarnog sveta u svoja simulirana okruženja kako bi svom algoritmu doneo novi nivo autonomije u stvarnom svetu.
Izvor: techbriefs.com