Najbrži AI čip na svetu učiniće da današnji napredak deluje sporo
Bilo da smatrate AI neverovatnim alatom sa ogromnim koristima ili društvenom bolešću koja koristi samo ogromnim alatima, moćni novi čip može ih obučiti brže nego ikada.
Cerebras Systems je predstavio najbrži AI čip na svetu
Cerebras Systems je predstavio najbrži AI čip na svetu – Wafer Scale Engine 3 (WSE-3), koji pokreće Cerebras CS-3 AI superkompjuter sa maksimalnom performansom od 125 petaFLOPS-a. I može se skalirati do neverovatnih razmera.
Pre nego što AI sistem može da generiše sladak, ali čudan video snimak mačke koja budi svog vlasnika, mora da bude obučen na zaista ogromnoj količini podataka, trošeći pri tome energiju koja bi mogla da napaja preko 100 domaćinstava. Ali novi čip, i računari izgrađeni sa njim, pomoći će da se ovaj proces ubrza i učini efikasnijim.
Svaki WSE-3 čip, veličine pizze, sadrži neverovatnih četiri biliona tranzistora, pružajući dvostruku performansu u odnosu na prethodni model kompanije (koji je takođe bio prethodni svetski rekorder) po istoj ceni i potrošnji energije. Kada se ovi čipovi ugrupišu u CS-3 sistem, navodno mogu pružiti performanse sobe punih servera unutar jedne jedinice veličine mini-frižidera.
Cerebras kaže da CS-3 ima 900.000 AI jezgara i 44 GB on-chip SRAM-a, pružajući do 125 petaFLOPS-a maksimalne AI performanse. U teoriji, to bi trebalo da bude dovoljno snage da ga svrsta među deset najbržih superkompjutera na svetu – mada naravno nije testiran na tim benchmarkovima, tako da ne možemo biti sigurni koliko bi se dobro zaista pokazao.
Da bi sačuvao sve te podatke, opcije za eksternu memoriju uključuju 1,5 TB, 12 TB ili masivnih 1,2 petabajta (PB), što je 1.200 TB. CS-3 može obučiti AI modele koji uključuju do 24 biliona parametara – u poređenju, većina AI modela trenutno ima milijarde parametara, pri čemu se procenjuje da će GPT-4 imati oko 1,8 biliona. Cerebras tvrdi da bi CS-3 trebalo lako da obuči model sa jednim bilionom parametara, baš kao što trenutni GPU bazirani računari obučavaju model sa jednim milijardom parametara.
Zahvaljujući procesu proizvodnje vafera WSE-3 čipova, CS-3 je dizajniran da bude skalabilan, omogućavajući da se do 2.048 jedinica grupiše u jedan kompjuter koji je jedva zamisliv. Ovo bi bilo sposobno za do 256 eksaFLOPS-a, dok su najbrži superkompjuteri na svetu trenutno tek malo preko jednog eksaFLOP-a. Ta vrsta moći bi mu omogućila da obuči Llama 70B model od nule za samo jedan dan, tvrdi kompanija.
Već sada se čini da se AI modeli razvijaju strašnom brzinom, ali ovakva tehnologija će samo još više povećati dotok informacija. Bez obzira na posao koji obavljate, čini se da će AI sistemi brže nego ikad doći po vaše poslove, a možda čak i vaše hobije.
Izvor: Newatlas