Google predstavlja novu generaciju čipova za veštačku inteligenciju i superračunar u oblaku
Nova verija čipa nosi naziv cloud TPU v5p.
Novi čip ima znatno poboljšane performanse
Bez sumnje, 2023. godina je bila godina generativne veštačke inteligencije. Google obeležava završetak ove godine sa još više novina u domenu veštačke inteligencije.
Kompanija je najavila svoj najmoćniji TPU-a (Tensor Processing Units) pod nazivom Cloud TPU v5p. Takođe, stiže i novi AI superračunar koji će biti deo Google Cloud platforme. Amin Vahdat, inženjer iz Google-a, istakao je da je porast u generativnim AI modelima doveo do značajnog povećanja parametara unutar tih modela. Sve to sada zahteva veće resurse za obuku i podešavanje tih modela.
Cloud TPU v5p je specijalni čip koji će se koristi za obučavanje AI modela. Google je dizajnirao Cloud TPUs namenski kako bi efikasno radio sa modelima koji zahtevaju velike resurse, imaju dugačke periode obuke, pretežno se sastoje od matematičkih izračunavanja i nemaju prilagođene operacije unutar glavnog procesa obuke, kao što su TensorFlow ili JAX.
Svaka TPU v5p jedinica sistema sadrži 8.960 čipova. Cloud TPU v5p predstavlja novu generaciju TPU-a koja sledi prethodne verzije poput v5e i v4. Prema izveštajima Google-a, TPU v5p ima značajno poboljšane performanse u poređenju sa TPU v4. Ta poboljšanja uključuju dvostruko veći FLOPs i četiri puta veću skalabilnost kada se uporedi FLOPs po jedinici u odnosu na TPU v4.
TPU v5p može da obučava LLM modele 2,8 puta brže u odnosu na TPU v4. Takođe, TPU v5p može brže da primeni već obučene modele na zadatke u realnom vremenu u poređenju sa svojim prethodnikom, TPU v4. Konkretno, TPU v5p je 1,9 puta efikasniji u odnosu na TPU v4.
Ova poboljšanja u brzini i performansama čine TPU v5p značajno moćnijim i efikasnijim u radu sa veštačkom inteligencijom i pri obuci modela u poređenju sa prethodnim verzijama.
Superračunar: Flex Start Mode i Calendar Mode
Takođe, tu je i novi AI superračunar. Novi AI superračunar uključuje integrisani sistem sa otvorenim softverom, hardverom optimizovanim za performanse, okvirima za mašinsko učenje i fleksibilnim modelima potrošnje. Ideja je da će ovaj proces poboljšati produktivnost i efikasnost u poređenju sa situacijom kada bi svaki deo bio posmatran odvojeno. Hardver optimizovan za performanse AI superračunara koristi „Jupiter“ tehnologiju Google-ovog data centra.
Google omogućuje programerima otvoren softver sa „obimnom podrškom“ za različite okvire za mašinsko učenje kao što su JAX, PyTorch i TensorFlow. Ova podrška uključuje širok spektar alata i resursa koji pomažu programerima da koriste ove okvire za razvoj veštačke inteligencije.
Google-ova najava dolazi nakon formiranja AI saveza koji su sklopili Meta i IBM. Kompanije su postavile fokus na otvoreni kod. Međutim, Google nije direktno uključen u taj savez.
AI superračunar, donosi dva nova modela Flex Start Mode i Calendar Mode. Obe varijante pružaju različite načine rada i konfiguracije. Na ovaj način će se olakšati korišćenje veštačke inteligencije u različitim situacijama prema različitim potrebama korisnika.
Google je objavio ovu vest zajedno sa predstavljanjem Gemini-ja. Gemini je novi AI model koji kompanija naziva svojim “najvećim i najmoćnijim,” AI modelom. Novi AI model će biti dostupan u tri varijante: Gemini Pro, Gemini Ultra i Gemini Nano.
Izvor: Engadget