AMD cilja Nvidiu sa Instinct MI325X GPU od 288 GB koji dolazi ove godine

AMD planira da pusti novi Instinct GPU za data centre kasnije ove godine sa značajno većom memorijom velike propusnosti nego MI300X čip ili Nvidia H200, omogućavajući serverima da obrađuju veće generativne AI modele nego pre.

PCPress.rs Image

Ažuriranje mape puta: Novi GPU za data centre svake godine

Na Computexu 2024 u Tajvanu, očekivalo se da kompanja otkrije Instinct MI325X GPU. Predviđeno da stigne u četvrtom kvartalu, pružaće značajno unapređenje u kapacitetu memorije i propusnosti u odnosu na MI300X, koji je postao jedan od AMD-ovih proizvoda sa najbržim rastom nakon lansiranja u decembru. Dok MI300X ima 192 GB HBM3 memorije velike propusnosti i propusnost memorije od 5,3 TB/s, MI325X će imati do 288 GB HBM3e i 6 TB/s propusnosti, prema AMD-u. Osam ovih GPU-ova će stati u ono što se naziva Instinct MI325X Platforma, koja ima istu arhitekturu kao MI300X platforma koja ide u servere koje dizajniraju OEM-ovi. Dizajner čipova je rekao da MI325X ima više prednosti u odnosu na Nvidia H200, koji se očekivao da počne sa isporukom u drugom kvartalu kao naslednik H100. Za početak, kapacitet MI325X od 288 GB je više nego dvostruko veći od H200 sa 141 GB HBM3e, a njegova propusnost memorije je 30 procenata brža od H200 sa 4,8 TB/s, prema AMD-u. Kompanija je rekla da su vrhunski teoretski propusti za 8-bitne (FP8) i 16-bitne floating point (FP16) 2,6 petaflopsa i 1,3 petaflopsa, respektivno. Ove cifre su 30 procenata veće od onoga što H200 može postići, rekao je AMD.

Pročitajte i:  AI botovi kao kuriri u svemiru

Pored toga, MI325X omogućava serverima da obrade model sa 1 trilion parametara u celosti, dvostruko više nego što je moguće sa H200, prema kompaniji.

Ažuriranje: Novi GPU za data centre svake godine

AMD je najavio detalje kao deo novootkrivenog plana da izdaje novi GPU za data centre svake godine počevši sa MI325X, koji, kao i MI300X, koristi kompanijinu CDNA 3 arhitekturu koja je izričito dizajnirana za aplikacije u data centrima. U proširenoj mapi puta, AMD je rekao da će pustiti MI325X kasnije ove godine. Zatim će 2025. godine izdati sledeću generaciju Instinct GPU-a koji će koristiti CDNA 4 arhitekturu kako bi pružio povećane računske performanse i “liderstvo u memoriji”, prema AMD-u. Sledeći GPU koji koristi sledeću generaciju CDNA arhitekture će uslediti 2026. godine. Kao i MI325X, sledeća generacija Instinct GPU-a sa CDNA 4 arhitekturom koja dolazi sledeće godine će doći sa 288 GB HBM3e. Čip će se proizvoditi koristeći 3-nanometarski proces—značajno smanjenje tranzistora u odnosu na 5nm i 6nm čvorove korišćene za MI300 čipove—and dodati podršku za 6-bitne i 4-bitne floating point formate podataka. Andrew Dieckmann, šef AMD-ovog poslovanja sa GPU-ovima za data centre, rekao je da su napori dizajnera čipova u oblasti GPU-ova za data centre već dobili podršku od više OEM-ova i pružalaca usluga u oblaku, uključujući Dell Technologies, Lenovo, Hewlett Packard Enterprise, Microsoft i Oracle. Još jedan značajan pristalica je matična kompanija Facebook-a, Meta. Takođe je naglasio da je AMD izgradio solidnu osnovu podrške za popularne generativne AI modele poput OpenAI GPT-4, Meta Llama 3 i Mistral AI sa MI300X. Kompanija je takođe pokazala svoju posvećenost open-source inovacijama sa svojim ROCm softverom, koji podržava više od 700,000 modela hostovanih na Hugging Face, okvirima i bibliotekama kao što su PyTorch i TensorFlow, i OpenAI Triton programskim jezikom.

Pročitajte i:  Pesma koju je napisao AI postala viralna

“Ne odmaramo na lovorikama sa MI300X, i [nastavljamo] da guramo inovacije napred tempom za koji verujemo da će biti vrlo konkurentan i omogućiti nam da zadržimo lidersku poziciju u nekim ključnim metrima koje smo uspeli da uspostavimo sa MI300X proizvodom”, rekao je Dieckmann na brifingu sa novinarima.

AMD je optimističan u vezi suprotstavljanja Nvidia Blackwell GPU-ovima

Iako se AMD fokusirao na H200 za svoje konkurentske uporedbe sa MI325X, kompanija će se suočiti sa činjenicom da Nvidia planira da izda moćniju generaciju GPU-ova za data centre koristeći novu Blackwell arhitekturu kasnije ove godine. Nvidia planira da izda Blackwell-bazirane GPU-ove kao deo nove strategije najavljene prošle godine da izdaje akceleratorske čipove svake dve godine umesto jednom godišnje.

Uprkos ubrzanim planovima mape puta Nvidia, Dieckmann je rekao da se kompanija oseća dobro u vezi sa “jakom konkurentskom pozicijom” protiv tih proizvoda između MI325X i CDNA 4-baziranog Instinct GPU-a koji će uslediti 2025. godine.

“Postoji mala međusobna igra između tajminga, ali CDNA 4, to je značajan korak napred u svim dimenzijama naše konkurentnosti”, rekao je on.

Pročitajte i:  AI mapira 3D prostor pomoću 2D kamera 

Izvor: Crn

Facebook komentari:
Računari i Galaksija
Tagovi: ,

Leave a Reply

Your email address will not be published. Required fields are marked *