DeepMind: Kad AI samostalno savladava komplikovane igre
Još se 2018. godine pisalo o tome da bi profesionalni šahisti, ali i oni koji šah igraju iz zabave, mogli da dobiju novog rivala, budući da se u to vreme pojavila AI platforma AlphaZero koju su opisali kao šahovskog majstora budućnosti. Kompanija je pre toga objavila i AlphaGo koji je mogao da igra igru Go, a svi sistemi su unapred znali pravila igra za koje su napravljeni. Sada se pojavio i MuZero, koji ne mora da zna pravila da bi se upustio u igranje šaha, igara Go i Shogi, te izabrane Atari kolekcije.
Nalik ljudskom mozgu
AlphaZero iz 2018. je proizvod kompanije DeepMind Technologies, a pored šaha igra i shogi i Go – još dve igre koje u podjednako teške, ako ne i teže od šahovskih partija. Platforma je došla nakon nekoliko godina istraživanja, kao naslednik AlphaGo Zero iz 2017. godine. Od svog prethodnika se razlikuje po tome što joj nije bila potrebna ljudska pomoć u učenju igre, te je proces od temelja savladala potpuno samostalno.
Naime, neuralna AI mreža je proučavala igru, a preko procesa koji su slični onome kako funkcioniše ljudski mozak, budući da neuralne mreže prilično podsećaju na neurone. Tako je AlphaZero šah trenirala devet sati, shogi 12 sati, i Go 13 dana, i iznova ponavljala iste poteze, što je na kraju dovelo do toga da savlada sve tri igre. Procesi su bili osnaženi i jakim hardverom, kojeg stručnjaci opisuju kao „Mac Pro na steroidima“, a koji ima pet hiljada TPU-a koji služe samo za treniranje.
Novi MuZero se zasniva na algoritmima koji mogu da se prilagode situaciji u kojoj ne znaju pravila igre. U procesu je korišćen pristup „lookahead search“, u okviru kojeg algoritam može da „razmotri buduća stanja i u skladu sa tim planira sledeći potez“. Sistem tako funkcioniše slično poput ljudskih igrača, te u razmatranje uzima i poteze protivnika. Može da planira nekoliko poteza unapred, te prednost daje onima za koje smatra da bi mogli da ga odvedu do pobede.
Izvor: Engadget