Megdan na vrhu
Iako interesovanje za nova grafička rešenja nije na nekadašnjem nivou, NVIDIA i AMD se trude da tržištu ponude bolje i štedljivije grafičke procesore. Pogledajmo šta donose grafičke kartice NVIDIA 6xx i AMD 7xxx generacije.
Situacija na tržištu grafičkih kartica ima svoju prilično očiglednu CPU paralelu, s tim što je borba između dva primarna proizvođača znatno oštrija. AMD vodi borbu na oba fronta, ali na polju grafičkih kartica ima daleko bolju tržišnu poziciju, pošto su nove generacije AMD‑ovih grafičkih procesora uvek pomerale granicu performansi. NVIDIA se trudi da ne zaostane, pa se tako grafički procesori ova dva proizvođača smenjuju na vodećim mestima kroz sve cenovne klase.
Početkom godine AMD je veoma agresivno promovisao HD7000 seriju, nudeći novi GPU (kodna oznaka Tahiti) koji je efikasno zamenio prethodnu generaciju Cypress i Cayman GPU‑ova. NVIDIA je odgovorila tek nešto kasnije, modelom GTX680 koji je nudio slične performanse, uz nešto manju potrošnju energije i, što je još bitnije, bio nešto jeftiniji. AMD je odgovorio HD7970 modelima i… desila se uobičajena smena na vrhu planine performansi.
Kada sa high‑end platoa pogledamo malo naniže, situacija je slična i nije lako izabrati optimalnu varijantu u zadatom cenovnom razredu. Cilj ovog testa je poređenje najnovije generacije grafičkih procesora, i to najviše u rasponu od srednjeg pa do vrhunskog segmenta ponude.
AMD…
HD7000 serija grafičkih procesora zasnovana je na 28 nm proizvodnom procesu. AMD već izvesno vreme koristi sistem obeležavanja GPU‑ova po južnim i severnim egzotičnim ostrvima, pa ova serija modela podrazumeva grafičke procesore sa kodnim imenima Tahiti, Pitcairn i Cape Verde. Tahiti čip se nalazi na Radeon HD7900 modelima, Pitcairn na HD7800 seriji, a Cape Verde na HD7700 grafičkim karticama. Sistem je sličan kao i kod procesora. Kod modela s manje jezgara isključuju se neispravni segmenti GPU‑a i na taj način se dobijaju modeli s manje stream procesora. Naravno, to se radi u početku, jer se kasnije proizvodni proces usavršava pa je sve manje materijala za jeftinije GPU modele. Pojavila se mogućnost da se kod nekih modela odgovarajućom softverskom intervencijom otključaju jezgra koja su funkcionalna, ali nisu prošla strogu kontrolu kvaliteta.
HD7000 serijom AMD je predstavio novu GPU arhitekturu GCN, Graphic Core Next. Time je, umesto stream procesora, uveden termin SPU (Stream Processing Unit). AMD je koristio VLIW princip (Very Low Instruction Word) koji je podrazumevao određeni broj stream procesora koji paralelno izvršavaju male setove instrukcija. Konkretnije, obrađivale su se grupe od 64 piksela, a glavna prednost je mogućnost simultane obrade pet instrukcija koje nisu međusobno zavisne.
Problem sa VLIW principom nastaje kada treba izvršiti više instrukcija koje jesu međuzavisne, pošto tada nije moguće istovremeno zaposliti sve raspoložive stream procesore. U realnim game engine situacijama ovo nije bilo izraženo, a uz pomoć dobrog kompajlera (koji je veoma važan u organizaciji instrukcija kod VLIW arhitekture) bilo je moguće izvući dosta iz svih prethodnih generacija grafičkih procesora.
AMD je razmatrao kompletan Fusion i GPGPU princip, želeći da GPU bude sposoban za mnogo više od same grafike, čime bi se dobila bolja iskorišćenost oba procesora u CPU/GPU okruženju. AMD sa GCN tehnologijom prelazi na SIMD dizajn, ostavljajući VLIW iza sebe. Oba principa podrazumevaju paralelni rad više jedinica, ali je razlika u principu izvršavanja. VLIW podrazumeva izvršavanje paralelnih instrukcija (ILP ‑ Instruction Level Parallelism), dok je kod GCN tehnologije primarna stvar paralelno izvršavanje thread‑ova (TLP ‑ Thread Level Parallelism). Zato je VLIW dobar za grafiku, ali ne i za GPU computing, koji postaje sve bitniji element GPU jedinica.
…ili NVIDIA
Značajno poboljašanje arhitekture koje je usledilo sa Fermi generacijom GPU‑ova ove godine nastavlja se Kepler generacijom grafičkih procesora, a NVIDIA nastavlja sa označavanjem generacije GPU modela koristeći imena poznatih svetskih fizičara. Kepler donosi novi 28 nm proizvodni proces, kojim se povećava energetska efikasnost. NVIDIA je ostala na staroj baznoj arhitekturi, ali to opet ne smeta Kepler čipovima da budu veoma efikasni po pitanju čistih grafičkih performansi. U Kepler seriju GPU‑ova spadaju (za sada) tri varijante čipa, GK104, GK106 i GK107. GK104 se koristi za udarne GTX680, GX670 i GTX660Ti modele, uz razliku u broju dostupnih shader procesora. Sistem „kreiranja“ slabijih GK104 varijanti je isti, pa se neispravni delovi GPU‑a fabrički isključuju i tako nastaju jeftinije grafičke kartice.
Jedna od značajnijih novih tehnologija je GPU Boost, preslikana s procesorske Turbo funkcije, koja ima zadatak da prema potrebi poveća radni takt da bi se postigle bolje performanse. GK104 radi na standardnom taktu od 1.000 MHz, ali će se taj takt automatski povećati na 1.100 MHz (ili čak na 1.200 MHz) ukoliko drajver detektuje da GPU nije dovoljno opterećen (ne koriste se sve CUDA jedinice). Na ovaj način se performanse dodatno povećavaju bez intervencije korisnika.
NVIDIA uvodi još jednu automatsku funkciju koja se tiče kvaliteta 3D prikaza u igrama. Uz Adaptive VSync, grafička kartica automatski aktivira ili gasi VSync opciju u zavisnosti od framerate‑a. Ukoliko je fps veći od 60, VSync će biti uključen, a ako je manji od 60 fps, VSync se automatski gasi. Kepler generacija donosi i značajno poboljšani anti‑aliasing algoritam koji nosi naziv TXAA, a čiji je glavni zadatak da poboljša kvalitet izglađivanja ivica uz minimalni pad performansi.
Svi ovi noviteti nisu toliko značajni kao 28 nm proizvodni proces. Tako Kepler u odnosu na Fermi troši znatno manje energije, što na kraju znači i činjenicu da je potrebno manje napajanje, ali i manje hlađenje kartice, pa Kepler bazirane karte generišu manje buke.
Gigabyte i NVIDIA
Za test smo izabrali NVIDIA Gigabyte kartice. S WindForce sistemom za hlađenje, dostupnim na svakom modelu, uz dodatne overkloking mogućnosti Gigabyte modeli su odličan izbor, ako ste se odlučili za NVIDIA grafički procesor.
GTX650Ti je najslabiji model među testiranim NVIDIA rešenjima, ali se radi o najnovijoj kartici na tržištu. Njena osnova je GK106 čip kao i kod GTX660, ali GTX650Ti ima manje CUDA jezgara, a memorijska magistrala je svedena na 128 bita. NVIDIA specifikacija predviđa 1 GB memorije, ali je Gigabyte stavio 2 GB na nominalnom radnom taktu 1.350 MHz (5.400 MHz). Gigabyte je fabrički overklokovao GPU sa 925 MHz na 1032 MHz, što za desetak procenata podiže performanse. U WindWorce kuleru su upotrebljena dva 75 mm ventilatora koji su dosta tihi, a opet veoma efikasno hlade overklokovani GPU. Za oni koji žele još malo više, moguće je izvući još koji MHz iz GPU‑a i memoriju podići na 6.000 MHz.
GTX660 je baziran na istom GK106 čipu, ali ima 960 CUDA jezgara i veću propusnu moć memorije, što garantuje bolje performanse. Podrazumeva se 2 GB memorije, kao i lagano povećanje radnog takta kod OC verzije, a moguće je izvući dodatnih deset procenta performansi kroz overkloking.
Modelom GTX660Ti prelazimo u višu klasu, jer je u pitanju GK104 verzija GPU‑a koja nudi znatno veći broj CUDA i texture jedinica, te 192‑bitnu memorijsku magistralu. Na raspolaganju je i OC varijanta koja radi na 1.033 megaherca, naspram 915 megaherca koliko je deklarisala NVIDIA, ali opet možete računati i na dodatni overkloking od skoro deset procenata.
GTX670 nudi gotovo maksimalan broj od 1.344 CUDA i 112 texture jedinica, sa 256‑bitnom memorijskom magistralom. Osnovni radni taktovi su 915 MHz za GPU i 6.008 MHz za memoriju, uz GPU Boost opciju koja brzinu podiže na 980 MHz. Gigabyte i ovde koriguje radni takt u OC verziji i to na 1.033 MHz, uz maksimalni boost klok od 1.111 MHz, dok memorija ostaje na istoj frekvenciji. Dobitak se može očekivati i kroz „ručni“ overkloking, gde GPU takt ide do 1.080 a memorije do 6.500 MHz. I ovde se ogroman WindForce sistem brine za adekvatno hlađenje.
GTX680 je vrh ponude, s maksimalnim brojem CUDA, teksturnih i ROP jedinica i memorijom na 256‑bitnoj magistrali. Nominalni GPU radni takt je 1.006 MHz, što ostavlja manje prostora za fabrički overkloking. Gigabyte je ponudio GTX680 u OC varijanti s radnim taktom na 1.071 MHz, a zahvaljujući impozantnom WindForce kuleru može se ostvariti GPU takt 1.160 MHz, dok je memoriju moguće podići na očekivanih 6.550 MHz.
Sapphire i AMD
Kartice s druge strane barikade na našem tekstu će prestavljati Sapphire. Izbor je logičan, jer je Sapphire odavno primarni AMD‑ov partner kada su grafičke karte u pitanju. Na raspolaganju je opet bila gotovo kompletna lepeza, koja nam je pružila važnu mogućnost jasnog uvida u performanse nove generacije AMD grafičkih procesora.
HD7750 je bazični model serije 7000, koja je zasnovana na Cape Verde varijanti GPU‑a, radi na 800 MHz i ima 1 GB Hynix GDDR5 memorije na 4.500 MHz. Kartica je kompaktnih dimenzija, a prostora za overkloking ima dosta. Zbog manjeg GPU‑a i manjeg zagrevanja, HD7750 ide čak do 1.200 MHz, dok se takt Hynix memorije može podići do 5.700 MHz. Ovako veliki overklok zahteva ubrzanje ventilatora na maksimalnu brzinu, što podrazumeva i dosta buke.
HD7770 nudi više stream procesora, pa u ovoj varijanti Cape Verde čip sa 1 GHz radnim taktom znači i nominalno bolje performanse. Ova kartica je znatno veća od 7750, i ume da povuče oko 80 W, što znači da je dovoljan jedan dodatni 6‑pinski naponski konektor. Od nominalnih 1.000 MHz GPU takta može se stići do 1.120 MHz, što je u okviru očekivanih deset procenata, dok se memorijski takt može podići sa 4.500 na 5.200 MHz. Naravno, brzina ventilatora će i u ovom slučaju biti automatski podešena na maksimum.
Značajan skok u jaču mid‑end klasu donosi Sapphire Radeon HD7870. Zasnovan je na Pitcairn grafičkom procesoru koji nudi dosta više snage u odnosu na Cape Verde – na raspolaganju je 1.280 stream procesora, 80 TMU (Texture Memory Unit) jedinica i 32 ROP (Raster Operations) jedinica, sve na 256‑bitnoj memorijskoj magistrali. Nominalni radni takt je 1 GHz, dok memorija radi na 5.000 MHz. Realne granice overklokinga su na oko 1.200 MHz za GPU i 5.500 MHz za memoriju.
Finalne dve kartice nalaze se pri vrhu AMD ponude, a u pitanju su modeli s najjačim Tahiti čipom. 7950 i 7970 se međusobno razlikuju samo po broju stream procesora i nominalnom radom taktu. 7950 ima 1.792 stream procesora naspram 2.048 kod HD7970 modela, dok je radni takt 860 naspram 925 MHz za GPU, odnosno 5.000 MHz naspram 5.500 MHz za memoriju. Sa overklokingom u igri HD7950 ima potencijale da u nekim situacijama čak i nadmaši HD7970. Realni limit su 1.025 MHz za GPU (što je blizu nominalnom HD7970 taktu), dok memorija može ići i preko 7.000 MHz. Naravno, i 7970 model se može ubrzati, ali u nešto manjem procentu, jer je prostor za dodatno ubrzanje manji.
Cena performansi
Pošto svi testirani grafički procesori uglavnom pripadaju jačem segmentu tržišta, testirali smo ih u adekvatno teškim uslovima, a FullHD rezolucija je nešto ispod čega se danas ne ide. Jedini izuzetak je 3DMark11 test, koji je vršen u nominalnom režimu da biste lakše poredili rezultate s hardverom koji trenutno imate. Ostali testovi rađeni su s maksimalnim ×16 anisotropic filtriranjem i 4x antialiasing opcijom, pri maksimalnim detaljima koje neka igra podržava. Fokus je bio na novijim DirectX 11 naslovima, uz dodatni Heaven 3.0 test koji je imao aktivnu teselaciju, a tu je i Crysis Warehead koji je kao DirectX 10 naslov pokazao koje se performanse mogu očekivati u starijim igrama. Sniper Elite je odabran kao test najnovije DirectX 11 igre s visokim nivoom detalja, a F1 2012 test sa EGO 2.0 engine‑om tu je kao demonstracija mogućnosti kada su u pitanju DirectX11 igre koje su već izvesno vreme aktuelne. Na kraju, tu je i OpenGL Maya test kao dodatna informacija za one kojima je bitan i profesionalni deo primene grafičkih kartici.
Ako krenemo od top‑modela, lako se može videti da je 7970 u većini slučajeva brža opcija. U testovima gde lagano zaostaje za GTX680, ta razlika je svega par frejmova, kao što je to slučaj u Heaven 3.0 testu ili u F1 2012 igri. U Sniper Elite testu, HD7970 u najvećoj meri pokazuje svoju moć, gde se vidi kako Tahiti efikasno obrađuje veoma težak DirectX11 scenario, a ne treba zaboraviti i nešto bolje OpenGL performanse koje profesionalcima mogu biti od značaja.
Odnos snaga u sledećoj klasi modela pokazuje malo drugačiju situaciju. GTX670 je u svim test-scenarijima brži, a jedini izuzetak je OpenGL test. U ovoj klasi nikako ne treba zaboraviti GTX660Ti model koji po istoj ceni nudi slične nominalne performanse. Razlika u odnosu na GTX670 realno postoji, ali nije
baš drastična.
Stepenica niže nas vodi ka GTX660 i HD7870 modelima vrlo približne cene. U većini test-scenarija, HD7870 predstavlja brže rešenje, a GTX660 jedinu prednost ostvaruje u F1 2012 testu. U donjem domu, tj. kod modela čije se cene kreću između 160 i 100 evra, GTX650 se, kao najnoviji predstavnik serije, trudi da dobrim odnosom cene i performansi privuče kupce, a to isto čini i AMD sa HD7770 modelom. GTX650 je brži, tako da se može reći da u ovom momentu NVIDIA nudi nešto bolje rešenje, ali to rešenje košta nešto više od konkurenta.
Konačni izbor
Nova generacija grafičkih kartica predstavlja značajan korak napred, i po novim tehnologijama, i po performansama. Naš test scenario bio je dosta težak. Ono što se traži jeste minimum 30 frejmova, dok je ideal konstantni prikaz preko 60 frejmova s uključenom VSync opcijom za maksimalni kvalitet prikaza. Jasno je da samo skuplji modeli mogu da ispune ove kriterijume u FullHD rezoluciji s maksimalnim detaljima u najzahtevnijim igrama, ali se ispostavilo da su i nešto pristupačnije karte dovoljno brze.
Odlučite, dakle, koliko novca želite da izdvojite za grafičku kartu, a u drugom koraku je izbor kojem se taboru prikloniti. U najjačoj klasi AMD ima bolju ponudu, pa HD7970 košta znatno manje od GTX680, a performanse su slične ili čak malo bolje u korist Tahiti GPU‑a. Kada je u pitanju najbolji odnos cene i brzine, GTX660Ti i HD7950 predstavljaju optimalan izbor. Na nominalnim taktovima performanse su slične, cena je takođe približna, pa će verovatno presuditi lični afinitet ka NVIDIA, odnosno AMD rešenjima. U nižem mid‑end segmentu, nova GTX650 karta predstavlja dobar izbor zbog solidnog odnosa cene i performansi. I AMD ovde ima dobar proizvod u obliku HD7770 modela koji jeste sporiji od GTX650, ali i košta manje.
Što se tiče potrošnje energije, NVIDIA je značajno iskoračila Kepler čipom i 28 nm proizvodnim procesom, pa i NVIDIA i AMD modeli imaju sličnu potrošnju u istim klasama, ali napajanje od bar 600 W je i dalje potrebno za srednje i jače modele, pa pri investiciji u novu grafičku kartu treba obratiti pažnju i na tu činjenicu.
Gigabyte GTX650 | Gigabyte GTX660 | Gigabyte GTX660 Ti | Gigabyte GTX670 | Gigabyte GTX680 | Sapphire Radeon HD7750 | Sapphire Radeon HD7770 | Sapphire Radeon HD7870 | Sapphire Radeon HD7950 | Sapphire Radeon HD7970 | |
SPU | 768 | 960 | 1344 | 1344 | 1536 | 512 | 640 | 1280 | 384 | 2048 |
memorija | 1 GB | 2 GB | 2 GB | 2 GB | 3 GB | 1 GB | 1 GB | 2 GB | 3 GB | 3 GB |
BUS | 128 bit | 192 bit | 192 bit | 256 bit | 256 bit | 128 bit | 128 bit | 256 bit | 384 bit | 384 bit |
radni takt CPU/MEM (MHz) | 1032 / 5400 | 980 / 6008 | 1033 / 6008 | 980 / 6008 | 1071 / 6008 | 800 / 4500 | 1000 / 4500 | 1050 / 5000 | 810 / 5000 | 925 / 5000 |
3DMark11 score / graph score | 4996 / 4810 | 6571 / 6705 | 7112 / 8471 | 8710 / 9095 | 9422 / 10099 | 3053 / 3218 | 4465 / 4144 | 7413 / 7342 | 7962 / 8088 | 9399 / 10177 |
Heaven 3.0 FPS | 32.9 | 52.6 | 62.4 | 71.1 | 76.2 | 23.38 | 30 | 53 | 61.1 | 74.2 |
Sniper Elite FPS | 17.1 | 25.4 | 31.6 | 35.5 | 37.8 | 12.2 | 16.3 | 33.1 | 41.2 | 52.1 |
F1 2012 FPS | 51 | 98 | 102 | 104 | 107 | 35 | 44 | 75 | 82 | 94 |
Crysis Warhead FPS | 26.65 | 41.25 | 49.75 | 55.04 | 59.56 | 21.47 | 24.75 | 43.39 | 50.85 | 62.41 |
SpecViewPerf11 Maya OpenGL | 11.27 | 11.68 | 12.28 | 12.32 | 12.62 | 13.29 | 13.63 | 13.9 | 13.95 | 14.16 |
okvirna cena (evra) | 160 | 200 | 300 | 385 | 500 | 100 | 110 | 200 | 300 | 400 |
Miloš Stamenković