Frontier – Najsnažniji računar na svetu
Za svet informacionih tehnologija, kao i za celokupnu svetsku nauku, jedan od najznačajnijih događaja tekuće godine biće puštanje u rad najmoćnijeg superkompjutera u svetu. Njegovo ime je Frontier.
Frontier je projekat američkog ministarstva energetike, a nalazi se u nacionalnoj laboratoriji ovog ministarstva ORNL (Oak Ridge National Laboratory) u državi Tenesi. Iako je pandemija usporila njegovu montažu, očekuje se da posao bude završen tokom proleća ove godine, kada će Frontier otpočeti sa rešavanjem svojih prvih zadataka.
Egzaskalna generacija superkompjutera
Računarstvo visokih performansi (HPC – High Performance Computing) zasnovano je na paralelnoj obradi ogromne količine podataka. Počev od šezdesetih i sedamdesetih godina 20. veka, kada su se pojavili prvi superkompjuteri sa nekoliko procesora, računarstvo visokih performansi prešlo je dug razvojni put i dostiglo nezamislivu brzinu obrade podataka, reda petaflopsa – 1015 flopsa (floating point operations per second – broj operacija u pokretnom zarezu izvršenih u jednoj sekundi). To je tzv. petaskalna generacija superkompjutera, čiji je razvoj otpočeo 2008. godine.
Pre par godina pojavili su se i novi superkompjuterski giganti, koji će pripadati tzv. egzaskalnoj (exascale) generaciji, što znači da će pri obradi podataka dostići brzinu reda 1018 flopsa. Najpre je najavljen superkompjuter Aurora, čija će brzina biti 1 egzaflops. U očekivanju Aurore, čitava javnost bila je iznenađena pojavom novog konkurenta, sistema Frontier, koji će dostići još veću brzinu od 1,5 egzaflopsa. Iako je planirano da oba superkompjutera budu u potpunosti realizuju 2021. godine, finalizacija Aurore stopirana je na neko vreme, pa će u ovoj godini startovati samo najsnažniji – Frontier.
ORNL projekti
Projekat razvoja Frontier‑a otpočeo je na osnovu ugovora američkog ministarstva energetike i kompanija AMD i Cray za izgradnju egzaskalnog superkompjutera u ORNL laboratoriji. Frontier je sistem baziran na kombinaciji tradicionalnih procesora sa grafičkim procesorskim jedinicama za ubrzavanje performansi naučnih superkompjutera. Takav pristup je razvio i uspešno demonstrirao ORNL, zajedno sa svojim partnerima.
ORNL već ima dugu tradiciju u razvoju HPC sistema. Od 2005. godine u ovoj laboratoriji napravljeni su superkompjuteri Jaguar, Titan i Summit, svaki od njih najsnažniji superkompjuter u svoje vreme. Po ugovoru, u razvoj novog sistema Frontier uloženo je više od 600 miliona dolara. Ugovor uključuje finansiranje razvoja tehnologije, realizaciju nekoliko sistema za isporuku u početku projekta, realizaciju glavnog Frontier sistema, kao i višegodišnju podršku sistemu.
Novi egzaskalni superkompjuter Frontier će Americi povratiti lidersku poziciju u računarstvu visokih performansi i veštačkoj inteligenciji. On će biti najmanje tri puta snažniji od trenutno najsnažnijeg superkompjutera u svetu (japanski Fugaku), koji teoretski ima snagu od 0,5 egzaflopsa (do sada je praktično ostvareno 442 petaflopsa, odnosno 0,442 egzaflopsa). Fugaku je trenutno još uvek prvi na listi najsnažnijih kompjutera u svetu Top 500, formiranoj u novembru 2020. Nalazi se u japanskom RIKEN centru za računarske nauke u Kobeu.
Data centar Frontier
Montaža Frontier‑a otpočela je u leto 2018. godine u data centru ORNL laboratorije, u kojoj se nalazio jedan od njegovih prethodnika – Titan (soba 102, zgrada 5600). Titan je demontiran nekoliko dana pre toga, 1. avgusta 2018, nakon sedam godina „služenja“. Demontirane su sve njegove komponente vredne 430.000 funti i uklonjene za reciklažu. Postupak demontaže za mesec dana izvelo je oko stotinu tehničara iz kompanije Cray.
Odmah nakon toga pristupilo se radovima na preuređenju prostorije od oko 37.400 kvadratnih metara kako bi se ona prilagodila novim zahtevima infrastrukture za Frontier. Napravljene su odgovarajuće mehaničke, električne i strukturne transformacije prostora. To je podrazumevalo preuređenje prostorije kako bi se ona prilagodila znatno masivnijem sistemu.
Frontier će biti sastavljen preko 100 Cray Shasta sistema povezanih Slingshot tehnologijom. Čvorovi su bazirani na AMD‑ovim EPYC procesorima i Radeon Instinct grafičkim jedinicama. Četiri grafičke jedinice povezuju se sa jednim procesorom
Posebne zahteve trebalo je ispuniti oko energetike. Titan je trošio oko 10 megavata snage, dok je Frontier‑u potrebno oko 30 megavata. Zbog toga je bio neophodan složeniji sistem rashladnih uređaja i njihove infrastrukture (sa 40 MW rashladnog kapaciteta), pa je napravljen poseban građevinski objekat kao centralno energetsko postrojenje sistema za napajanje i hlađenje.
Arhitektura Frontier‑a
U Frontier, kao budući najsnažniji i najbrži superkompjuter, biće ugrađene nove tehnologije kompanija Cray i AMD, koje će omogućiti novu egzaskalnu eru superkompjutera. Nju karakterišu, kako kaže predsednik i generalni direktor kompanije Cray Peter Ungaro, intenzivno radno opterećenje podacima i konvergencija modeliranja, simulacije, analitike i veštačke inteligencije u oblasti naučnih istraživanja, inženjeringa i digitalnih transformacija.
Frontier će biti sastavljen od više od stotinu Cray Shasta sistema (čvorova) zasnovanih na superkompjuterskoj arhitekturi, sa Slingshot tehnologijom povezivanja (mrežne strukture). Svaki čvor će imati jedan interkonekcioni mrežni port Cray Slingshot za svaku grafičku jedinicu, sa pojednostavljenom komunikacijom između GPU‑a i mreže, kako bi se omogućile optimalne performanse za računarstvo visokih performansi i veštačku inteligenciju.
Čvorovi sistema bazirani su na AMD‑ovim EPYC procesorima i Radeon Instinct grafičkim jedinicama, dizajniranim upravo za exsascale superračunarstvo. Podržavaju ubrzanje 4:1 (četiri grafičke jedinice povezuju se sa jednim procesorom). Uz pomoć napredne veštačke inteligencije, sva ta snaga biće usmerena na rešavanje naučnih zadataka koji zahtevaju obradu ogromne količine podataka.
Novi superkompjuterski giganti će pripadati egzaskalnoj (exascale) generaciji, što znači da će pri obradi podataka dostići brzinu reda 1018 flopsa
Da bi sve te performanse bile pogodne za korišćenje od strane programera, Cray i AMD su zajedno dizajnirali i razvili poboljšane, optimizovane GPU programske alate. To uključuje nove mogućnosti u Cray programskom okruženju i AMD‑ovoj ROCm platformi (Radeon Open Compute Platform), kao softverskoj podršci za Radeon grafičke jedinice radi ubrzanja, tj. poboljšanja performansi.
Početna i buduća primena
Za period pre prelaska Frontier‑a u režim rada punih performansi, ORNL je kreirala CAAR (Center for Accelerated Application Readiness) program. On obuhvata rešavanje osam velikih naučnih problema, sa kodnim nazivima Cholla, CoMet, GESTS, LBPM, LSMS, NAMD, NuCCOR i PIConGPU. Najzahtevniji od tih zadataka je Cholla, simulacija čitave galaksije (po veličini slične našem Mlečnom putu). Kreirao ga je astrofizičar sa univerziteta Prinston. To će, zapravo, biti prvi program koji će biti pokrenut na Frontier‑u. Do sada je radio na superkompjuteru Titan.
U 2022. godini, Frontier će obavljati i druge poslove za sve zainteresovane korisnike. Očekuje se da će Frontier, kao i drugi superkompjuteri egzageneracije, biti namenjen za naučne primene i inovacije. Bliska integracija veštačke inteligencije sa analitikom podataka, modeliranjem i simulacijom drastično će skratiti vreme otkrića automatskim prepoznavanjem uzoraka u podacima i vođenjem simulacija izvan granica tradicionalnih pristupa. Primena u oblasti veštačke inteligencije posebno će biti dizajnirana za process tzv. dubokog učenja (deep learning).
Na taj način će se omogućiti unapređenje nauke i praktična primena u oblastima kao što su sistemska biologija, nauka o materijalima, proizvodnja energije, nacionalna i energetska sigurnost, ekonomska konkurentnost, aditivna proizvodnja i nauka o zdravstvenim podacima. Podrazumeva se i primena za istraživanje novih tehnologija veštačke inteligencije, simulacije najkompleksnijih klimatskih modela i modeliranje klimatskih promena, gradivnih delova atoma, genoma i drugih važnih naučnoistraživačkih problema, a jedna od funkcija biće i simulacija nuklearnih eksplozija.
Autor: Nadežda Veljković