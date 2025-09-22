Google je na konferenciji Hot Chips 2025 završio sesije o mašinskom učenju predstavljanjem svog najnovijeg tenzorskog procesora – Ironwood TPU.

Ironwood TPU donosi 1,77 petabajta memorije i novi svetski rekord

Ovaj čip, prvi put otkriven na događaju Google Cloud Next ’25 u aprilu 2025, označava sedmu generaciju TPU hardvera i prvi je koji je primarno osmišljen za inference zadatke velikih razmera, a ne za treniranje modela.

Snaga Ironwood čipa

Svaki Ironwood čip integriše dva računarska jezgra i postiže čak 4.614 TFLOPS FP8 performansi. Osam slojeva HBM3e memorije donosi 192 GB kapaciteta po čipu uz protok od 7,3 TB/s.

Dodatno, čip poseduje 1,2 TB/s I/O protoka, što omogućava skaliranje sistema do 9.216 čipova po jednom „podu“ bez potrebe za dodatnom logikom. U toj konfiguraciji dostiže se impresivnih 42,5 eksaflopsa ukupnih performansi.

Rekordna memorija

Ironwood ne donosi samo sirovu procesorsku snagu, već i novi svetski rekord u memorijskim kapacitetima. Na nivou celog poda, ovaj TPU nudi 1,77 petabajta direktno adresabilne HBM memorije.

Ovo je prvi put da je sistem sa zajedničkom memorijom za više CPU jedinica dostigao ovakav nivo. Ključ za ovakav podvig leži u optičkim kola-prekidačima, koji povezuju rackove i omogućavaju ogromnu propusnost uz stabilnost sistema.

Stabilnost, pouzdanost i otpornost

Google je u arhitekturu ugradio brojne mehanizme za povećanje pouzdanosti:

on-chip root of trust za bezbednost,

ugrađene self-test funkcije,

tehnologije za zaštitu od „tihe“ (silent) korupcije podataka,

logičke funkcije za popravku, koje poboljšavaju iskorišćenost čipova u proizvodnji.

Sistem je sposoban da se sam rekonfiguriše oko otkazalih čvorova i da obnavlja radna opterećenja iz prethodnih tačaka (checkpoint restore). U celom dizajnu naglašena je filozofija RAS (reliability, availability, serviceability) – pouzdanost, dostupnost i servisabilnost.

Efikasnost i hlađenje

Ironwood koristi treću generaciju Google-ove tečne infrastrukture za hlađenje, sa cold plate rešenjem koje omogućava da čipovi ostanu stabilni pod velikim opterećenjima. U poređenju sa prethodnikom, Trillium TPU-om, Ironwood nudi dvostruko bolje performanse po vatu. Pored toga, koristi dinamičko podešavanje napona i frekvencije (DVFS) za dodatnu energetsku efikasnost pri različitim tipovima radnih opterećenja.

AI u dizajnu čipa

Zanimljivo je da Ironwood u svom razvoju koristi i veštačku inteligenciju. AI tehnike su pomogle u optimizaciji ALU kola i rasporeda komponenti na čipu, čime je postignuta bolja efikasnost i stabilnost.

Dodata je i četvrta generacija SparseCore procesora, specijalizovana za ubrzavanje zadataka poput embeddings operacija i kolektivnih računanja, što je posebno značajno za sisteme preporuka i pretragu.

Već u upotrebi

Ironwood TPU je već u masovnom raspoređivanju unutar Google Cloud data centara. Međutim, važno je napomenuti da TPU ostaje interna platforma i nije direktno dostupna spoljnim korisnicima.

Reakcije stručnjaka

Na događaju Hot Chips 2025, Ryan Smith sa portala ServeTheHome prokomentarisao je:

„Ovo je bila fantastična prezentacija. Google je još pre mnogo generacija shvatio potrebu za visokokvalitetnim AI hardverom. Sada kompanija inovira na svakom nivou – od čipova, preko međusobnog povezivanja, pa sve do fizičke infrastrukture. Iako je bila poslednja prezentacija na konferenciji, publika je ostala prikovana uz binu gledajući šta Google pokazuje.“

Zaključak

Sa Ironwood TPU-om, Google je postavio novi standard u oblasti superračunara i AI infrastrukture. Rekordnih 1,77 petabajta memorije, uz ogromnu procesorsku moć i energetski efikasniji dizajn, čini ga ključnim korakom ka budućnosti u kojoj će obrada podataka i AI modeli postati još veći i moćniji.

Ovim potezom, Google jasno pokazuje da trka u razvoju AI hardvera nije ni blizu završetka – naprotiv, tek ulazi u novu fazu.

Izvor: Techradar