Grafičke karte: Silicijum, AI, bez video trake
Početak ove godine bio je veoma zanimljiv u oblasti procesora, kako grafičkih tako i centralnih. NVIDIA i AMD predstavili su skoro u isto vreme nova GPU rešenja, Blackwell odnosno RDNA4, i to na veoma intrigantan način. Spekulacije oko cena, performansi, potrošnje energije, neispravnosti i još koječega stižu sa svih strana, pa da vidimo kako stvari stoje…
Počnimo ipak od procesora, pošto su tu stvari relativno jednostavne. Kada je AMD prošlog leta predstavio Zen5 arhitekturu, mnogi su požurili s negativnom ocenom jer je rast performansi u odnosu na prethodnu generaciju bio zanemarljiv. U realnosti je situacija bolja: korisnici za gotovo isti novac kupuju noviji procesor koji nudi bolje performanse i termalnu efikasnost, a te performanse su još malo povećane optimizacijama BIOS-a i operativnih sistema jer Zen5 ima svoje specifičnosti. One su se najviše pokazale testiranjem pod Linux-om, gde je Zen5 pokazivao bitno unapređenje. Svi su čekali X3D varijante Zen5 procesora.
Prevrnuti keš
Kada se konačno pojavio Ryzen 7 9800X3D kao prvi Zen5 X3D procesor, očekivanja su bila ispunjena. Novi procesor je osetno brži od prethodnika, čime je napravljena mnogo jasnija razlika između Zen4 i Zen5 generacija sa 3DV keš memorijom. Najveća razlika u arhitekturi ovih procesora je pozicioniranje 3DV keš memorije u odnosu na core kompleks jezgara. Kod ranijih X3D modela, dodatna L3 keš memorija se nalazila preko jezgra, što je uz dodatne elemente za potporu donosilo prepreke za odvođenje toplote koje stvara CPU kompleks od osam jezgara. Iako su mnogi smatrali da je 3DV L3 keš taj osetljivi element, u stvari je termalna problematika ograničavala performanse.
Kod X3D Zen5 je sve okrenuto naglavačke. Sada se dodatni L3 keš nalazi ispod kompleksa jezgara, pa je CPU sada u direktnom kontaktu sa aluminijumskim poklopcem koji treba da odvodi toplotu. Pitanje je zašto ovakvo rešenje nije upotrebljeno odmah, a odgovor je prost – planiranje. Kada se X3D keš prvi put pojavio u Zen3 arhitekturi, AMD je jurio za Intel-om, pa se tražilo rešenje kojim će se konkurencija što pre stići. Dodatni L3 keš se pokazao kao veoma efikasno rešenje za značajno povećanje performansi, posebno u igrama, pa je kod Zen3 procesora on bukvalno dodat na već postojeće rešenje arhitekture. Pošto je Zen4 u tom momentu već bio u odmaklom razvoju, ponovo nije bilo mogućnosti da se ovaj način pakovanja X3D keš memorije promeni. Tek sa Zen5 je bilo vremena da se napravi ova veoma značajna korekcija.
AMD Navi 48 nudi kvalitet renderinga koji je uporediv sa onim što nudi NVIDIA Blackwell. RT performanse su tačno tamo gde se i ciljalo – između RTX5070 i RTX4070Ti modela
Rezultat je da se sada procesor mnogo bolje hladi, što ostavlja prostor za upotrebu više energije pa se ostvaruju i bolje performanse. Tako 9800X3D ima 500 MHz veći osnovni radni takt i 200 MHz veći boost u odnosu na 7800X3D, što zajedno s boljom IPC efikasnošću omogućava novom procesoru znatno bolje performanse. Pored toga, prvi put je na X3D procesorima omogućen overkloking, pa sa 9800X3D moguće relativno lako ostvariti dodatnih 200 MHz ubrzanja.
Prema šestom gigahercu
Upotreba 3DV keš memorije i performanse koje se dobijaju ukazuju na određena ograničenja koja ima deo Zen5 jezgra (Infinity Fabric), gde te probleme veći L3 keš uspešno maskira i umanjuje. Slična problematika se mogla primetiti i kod većih Zen4 procesora sa 12 ili 16 jezgara koji su koristili „hibridnu“ konfiguraciju. Kod ovih procesora jedan kompleks jezgara bio je sa X3D keš memorijom, a drugi bez nje. Ideja je da se ovom kombinacijom dobije najbolje od oba jezgra, gde će X3D ponuditi maksimalne gaming performanse (igre teško da mogu efikasno da upotrebe više od osam jezgara), dok će „klasična“ jezgra ostvariti veći takt za sve ostale primene.
Jasno je kako NVIDIA želi da gledamo na Blackwell performanse, ali u realnosti nije baš tako. Upotreba AI generisanih frejmova drastično povećava kašnjenje prikaza i odziva
Jedini problem bio je softverski menadžment, jer je operativni sistem zajedno sa čipset/CPU drajverom morao da usmeri zadatke ka odgovarajućem kompleksu jezgara. Takozvano parkiranje jezgara nije uvek idealno radilo, pa se od korisnika zahtevalo dodatno podešavanja za specifični scenario. Sa skoro predstavljenim Ryzen 9 9950X3D (16/32) i 9900X3D (12/24) procesorima, čitava ova ideja mnogo bolje radi. 9950X3D i 9900X3D koriste sva prethodna Zen5 i X3D unapređenja, uz dalju upotrebu dva odvojena kompleksa jezgra – jedno sa X3D kešom u novoj konfiguraciji i jedno standardno Zen5 jezgro.
Kombinacija ovih unapređenja omogućava da 9950X3D ima radni takt od 4,3 GHz uz boost na 5,7 GHz, što je isto brzinu koju ima 9950X bez 3DV keš memorije uz isti TDP od 170 W (najveći kod aktuelnih AMD procesora). Pri maksimalnom opterećenju, uz kvalitetno vodeno hlađenje, temperature su oko 80 stepeni. Imajući u vidu snagu procesora, ovo je sasvim razumna temperatura koja je opet znatno manja u odnosu na bilo šta što Intel može da ponudi. Tako Ryzen 9 9950X3D u ovom momentu predstavlja najbolji desktop procesor koji se može kupiti. Uz Ryzen 7 9800X3D, Zen5 ponuda je kompletirana pa AMD u svakom bitnom segmentu ima trenutno nepobedivo rešenje. Intel sada samo nižom cenom može pokušavati da privuče korisnike, što je nekada bila AMD-ova taktika. Kako su se uloge obrnule u veoma
kratkom intervalu…
NVIDIA i Blackwell varke
Kada je NVIDIA (dosta unapred) najavljivala novu generaciju grafičkih procesora, sve je zvučalo dobro. Očekivalo se da će Blackwell doneti skok performansi koji će biti približan ili veći nego odnos između 3000 i 4000 GPU generacije. Iako je bilo određenih problema, Ada Lovelace serija bila je veoma uspešna, jer su performanse bile odlične, a konkurencija nije mogla da ponudi rešenje ni iole sličnih mogućnosti. Blackwell GPU serija trebalo je samo tu da nastavi i da dodatno poveća veliku prednost koju NVIDIA ima. U principu, Blackwell jeste nastavio Ada Lovelace putanju, ali ne baš najbolje i ne mnogo daleko.
Nakon par odlaganja nove GPU generacije, kada je na zvaničnom predstavljanju NVIDIA CEO rekao sada već čuvenu rečenicu: „5070 će imati 4090 performanse po ceni od 599 dolara“, počeli smo da brinemo. Najava zvuči dobro, ali su svi koji poznaju tematiku znali da to nikako ne može biti istina, i da se negde u pozadini krije AI. Tako su sve tada predstavljene performanse podrazumevale korišćenje DLSS 4 (Deep Learning Super Sampling) tehnologije za povećanje rezolucija prikaza i generisanje AI frejmova (MFG). DLSS3 u 4000 generaciji mogao je da generiše po jedan dodatni AI frejm, dok DLSS4 u Blackwell-u daje mogućnost stvaranja čak tri „veštačka“ frejma.
NVIDIA ne može ili ne želi da isporuči dovoljne količine GPU-ova na tržište, a rezultat su dva ili tri puta veće cene od nominalnih
Jasno je kako NVIDIA želi da mi gledamo na Blackwell performanse, ali u realnosti nije baš tako. Upotreba AI generisanih frejmova drastično povećava kašnjenje prikaza i odziva. GPU renderuje dva prava frejma i mora da odloži prikaz dok između ta dva ne generiše tri nova kroz AI kalkulaciju, i tek onda prikazuje sekvencu frejmova. Dodatno kašnjenje u odzivu se odmah primećuje i čini upotrebu veoma neprijatnom. Ovo je mnogo više primetno kada se broj frejmova u sekundi od 30 množi sa AI generisanim frejmovima, a tu bi efekat trebao da bude najkorisniji. Ukoliko se već ima brzina od 140 frejmova, tu je mnogo manje bitno da li se ima tih 140 ili 350, koji verovatno prelaze frekvenciju osvežavanja monitora.
Novo vs. izgubljeno
Možda MFG nije baš koristan, ali ostatak DLSS4 tehnologije jeste – on donosi primetno unapređenje u odnosu na DLSS3. Koliko god da je GPU brz, 1440p i 4K rezolucije s ray-tracing efektima imaju koristi od DLSS4 algoritma za povećanje rezolucije s manjih na veće, s veoma malim gubitkom na kvalitetu prikaza. Uz nove tehnologije, neke stare su nestale, recimo podrška za PhsyX, nekada jedna od glavnih NVIDIA specifičnosti. Budući da Blackwell nema hardversku podršku za ove instrukcije, stare PhsyX igre (na primer Batman serijal) radiće mnogo sporije nego GTX 1070. Za ovo ne postoji rešenje, pa će korisnici morati da prihvate situaciju takvu kakva jeste.
Ryzen 9 9950X3D u ovom momentu predstavlja najbolji desktop procesor koji se može kupiti. Intel može pokušavati da privuče korisnike nižom cenom, što je nekada bila AMD-ova taktika
Izgleda da određeni Blackwell čipovi na karticama nisu u potpunosti ispravni. Primećeno je da na nekim 5090, 5080 pa i 5070 modelima nedostaje nekoliko ROP jedinica. ROP su Raster Operation Pipelines kojih RTX5090 treba da ima 176, a defektni modeli imaju 168. Jedna ROP jedinica ima osam jezgara, pa ukoliko jedna nije ispravna, to se manifestuje kao osam manje. Rezultat toga mogu biti i do 10 odsto slabije performanse, što nikako ne može biti prihvatljivo, posebno imajući u vidu cenu RTX5000 serije grafičkih kartica. NVIDIA je priznala da postoji problem, ali da je broj defektnih GPU-ova relativno mali. To sigurno neće usrećiti Blackwell vlasnike koji su se jedva dokopali ovih kartica, i to po ko zna kojoj ceni.
Cene RTX5000 drastično odstupaju od onih „početnih“ koje su objavljene. NVIDIA ne može ili ne želi da isporuči dovoljne količine GPU-ova na tržište, a rezultat su dva ili tri puta veće cene od nominalnih. Na primer, jedna od najvećih maloprodajnih radnji računarske opreme u Americi, MicroCenter, dobio je oko 250 primeraka za sve svoje radnje zajedno. Zbog toga nakon par sekundi od početka prodaje više nije bilo moguće kupiti RTX5090 ili 5080. I sada je slična situacija, pa se neko može smatrati srećnim ukoliko nađe da kupi neku od ovih kartica i po dva puta većoj ceni od one koja bi trebalo da bude.
Kupac koji se dokopa nekog primerka može se takođe smatrati srećnim ukoliko relativno brzo ne oseti miris spaljene plastike. Nesrećni 12VHPWR naponski konektor je počeo da pravi probleme na 4090 karticama, koje su imale deklarisanu potrošnju od 450 W. Dotični konektor može maksimalno da pruži 600 W, a to je upravo zahtev RTX5090 modela. RTX3090 je poslednji model koji je imao „rezonski“ dizajn naponske jedinice, jer je sistem mogao da prati opterećenje na tri ulaza posebno s 12VHPWR konektora. Tada nije bilo problema i zbog toga što su naponski zahtevi prosto bili manji. S Blackwell generacijom, naponska jedinica nema način da zna opterećenje linija preko 12VHPWR konektora.
Dizajn konektora je diskutabilan, jer su pin-kontakti manjih dimenzija, što automatski smanjuje sposobnost konektora da istrpi opterećenje. Rezultat svega toga je opasnost da ovaj konektor ne ostvaruje dobar kontakt s pinovima na kartici. GPU i dalje vuče deklarisanu struju preko pinova koji imaju kontakt, i to može da dovede do topljenja konektora i na kraju spaljivanja izuzetno skupe grafičke kartice. Kako RTX5090 „vuče“ 600 W zahteve koji se poklapaju s maksimalnim mogućnostima 12VHPWR konektora, korisnicima ostaje samo da ulože maksimalnu pažnju pri povezivanju, izboru napajanja i adaptera, i da prate temperaturu konektora. Sve ovo ne ostavlja dobar utisak na one koji planiraju da ulože veliki novac u NVIDIA GPU iz Blackwell serije. To je, nažalost, uvek tako kada neka kompanija nema odgovarajuću konkurenciju.
AMD Radeon R9070XT
AMD je tokom poslednjih par godina uspeo da uradi nezamislivo – da Intel procesore ukloni s liste preporučenih, i to gotovo na svim platformama. Na GPU frontu nisu postigli takav rezultat. RDNA3 arhitektura na kojoj je bila bazirana RX7000 generacija grafičkih procesora pokušala je sa 7900XTX da konkuriše jačim NVIDIA modelima, ali to nije urodilo plodom. Performanse nisu bile dovoljno dobre, posebno kada je Ray Tracing u pitanju, dok je cena bila sasvim konkurentna. Iako Ray Tracing ne pruža baš drastično bolji kvalitet prikaza, pa nije bio toliko bitan na početku, sada se pojavljuju igre koje zahtevaju RT podršku. Zbog toga RT performanse postaju sve značajnije. Ovoga je svestan i AMD, pa je jedan od fokusa RND4 arhitekture bio povećanje RT performansi.
RDNA4 arhitektura uvodi značajne korekcije u odnosu na prethodnika. Glavni RDNA3 Navi 31 čip se proizvodio u kombinaciji 5-nm i 6-nm proizvodnog procesa, imao je 58 milijardi tranzistora i površinu jezgra od 357 kvadratnih milimetara. RDNA4 s Navi 48 jezgrom se pravi u 4-nm procesu, ima 54 milijarde tranzistora na površini od 357 milimetara. Iz ovoga se vidi koliko je unapređeno pakovanje čipa, jer se na kudikamo manjoj površini nalazi gotovo isti broj tranzistora. Kao i uvek, ovo omogućava bolje iskorišćenje silicijumske osnove, više radne taktove, manje zagrevanja i potrošnje energije.
Navi 48 koristi PCI Express 5.0 x16 interfejs sa 256-bitnom memorijskom magistralom ka GDDR6 memoriji (640 GB/s). Integrisan je 64 MB Infinity keš i unapređeni memorijski menadžment (Out-of-Order Memory Queuing). Navi 48 ima 64 Compute jedinica (Compute Units) raspoređenih preko 4 Shader jedinica, a svaki CU ima još 64 stream procesora. Tu su još 128 posebnih AI, 64 RT. 256 TMU i 128 ROP jedinica. AI jedinice su potpuno novog dizajna, i omogućavaju dve 16-bitne i četiri 8-bitne matrice, uz dodatne optimizacije kako bi sve to procesiranje trošilo manje energije. RT jedinice s novim funkcijama značajno približavaju Ray Tracing performanse onome što nudi NVIDIA. Kako je upravo ovo bila jedan od slabih tačaka Radeon-a, RT unapređenja su veoma značajna. Druga slaba tačka je FSR3 sistem za optimizaciju, rendering i upscaling, pa je i to potpuno redizajnirano sa FSR4. Sada ceo ovaj sistem radi mnogo bolje i nudiće vizuelni kvalitet prikaza koji je veoma blizu onome što nudi najnoviji NVIDIA DLSS. Tako sada Navi 48 nudi kvalitet renderinga koji je potpuno uporediv sa onim što nudi NVIDIA Blackwell.
Gledajući u sve ove elemente, može sa naslutiti koliko je kompleksan dizajn nove GPU generacije, koji treba da konkuriše srednjoj kategoriji NVIDIA kartica. Ukoliko isključimo RT i FSR4 performanse, i pogledamo „čistu brzinu rastera“ – RX7900XTX je još uvek najbrži AMD GPU. Razlika je veoma mala, posebno kada se ima u vidu da Navi 31 ima mnogo veću površinu jezgra. Kada se u kalkulaciju ubaci Ray Tracing, novi RX9070XT je za oko 15 procenata brži. Kada ovo uporedimo s NVIDIA čipovima, RT performanse su tačno tamo gde se i ciljalo – između RTX5070 i RTX4070Ti modela. Slična situacija je i kada se pogledaju standardne ne-RT performanse, gde je RX9070XT malo bliže svojim glavnim „zelenim“ konkurentima. Uz veoma dobru energetsku efikasnost i temperature pri maksimalnom opterećenju (u proseku oko 65 stepeni), jasno je da je AMD RDNA4 izuzetno dobra GPU alternativa.
Glavni pobednik je TSMC
Računica svih performansi obavezno uključuje i cenu, a to je trenutno glavna nepoznanica. NVIDIA od Blackwell predstavljanja nije u mogućnosti da tržištu isporuči ni približno zadovoljavajući broj kartica. Zbog toga su sve preporučene cene gotovo udvostručene, pa su se RTX5090 kartice prodavale i za 4000 evra. RTX5080 i 5070 varijanti ima nešto više, cene su niže, ali se i do njih teško dolazi. Kako je proizvodnja starih modela odavno ugašena, korisnici se ne mogu nadati ni da će stare modele kupiti po nekoj povoljnijoj ceni. Uz sve pomenute probleme koje NVIDIA ima, Blackwell generacija se teško može preporučiti.
Ryzen 7 9800X3D, prvi Zen5 X3D procesor, je osetno brži od prethodnika, čime je napravljena mnogo jasnija razlika između Zen4 i Zen5 generacija sa 3DV keš memorijom
Tu se otvorio prostor za AMD, ali je i tu početak bio malo trapav. Prvo predstavljanje je podrazumevalo samo najavu modela, bez bilo kakvih detalja. Kasnije je ponovljena prezentacija, izneti su detalji, ali bez cena, pa je početak prodaje odložen za početak marta. Čekali su da NVIDIA prva objavi cene RTX5070 modela, pa da onda AMD može da prilagodi svoju ponudu. AMD je najzad preporučio cenu 600 dolara za RX9070XT i 550 dolara za RX9070. Za prodaju su pripremili solidne količine kartica, ali ni to nije bilo dovoljno. Tako su se „preporučeni“ modeli brzo rasprodali, a ono što je ostalo na policama skuplje je i za 50 odsto. Do RDNA4 generacije kartica se trenutno može lakše doći, ukoliko ste spremni da platite dosta veću cenu od deklarisane. AMD tvrdi da ih je toliko interesovanje iznenadilo, te da će snabdevanje biti normalizovano u maju. Ukoliko to bude slučaj, RX9070XT će biti veoma lako preporučiti. NVIDIA za sada nema neke konkretne najave o stabilizaciji ponude, verovatno jer je to i ne interesuje previše. Tek ukoliko kompanija AMD bude prodavala dosta RDNA4 karti, NVIDIA će možda reagovati.
Zašto je toliko teško napraviti dovoljno kartica? Proizvodni kapaciteti su ograničeni. AMD odavno koristi TSMC za proizvodnju svih svojih čipova, pa možda računaju na nešto povoljnije uslove i veće alocirane kapacitete. NVIDIA takođe koristi TSMC, što uključuje i sve varijante za data centre i AI primenu. Jedna od najvećih Intel-ovih prednosti jesu sopstvene fabrike, ali aktuelna generacija Intel procesora takođe koristi TSMC proizvodni proces. A ko pravi Snapdragon? Opet TSMC. Iako TSMC pokušava da poveća kapacitete, jasno je da jedna kompanija ne može da zadovolji potrebe svih vodećih svetskih proizvođača procesora. Imajući ovo u vidu, mogli bismo da se zapitamo šta bi se desilo ukoliko TSMC iz nekog razloga kaže „nećemo više ovo da vam pravimo“. Ili hoćemo, ali po toj i toj ceni. Zanimljivo.