Bizit 2025

Nvidia ostvaruje napredak u obuci najvećih AI sistema

Najnoviji Nvidia čipovi pokazali su poboljšanja u obuci velikih sistema veštačke inteligencije, pokazuju novi podaci. Pri tome je broj čipova potrebnih za obuku velikih jezičkih modela značajno smanjen.

PCPress.rs Image

Blackwell čipovi

MLCommons je neprofitna organizacija koja objavljuje rezultate testiranja performansi AI sistema. Kompanija je objavila nove podatke o čipovima Nvidije i kompanije Advanced Micro Devices (AMD.O). Između ostalih, za obuku, u kojoj se AI sistemima daje veliki obim podataka za učenje. Iako je fokus tržišta prešao na tržište AI inferencije (kada AI sistemi odgovaraju na pitanja korisnika), broj čipova potreban za obuku sistema ostaje ključni konkurentski faktor.

Villager Quix robotske kosilice

Kineska kompanija DeepSeek tvrdi da može napraviti konkurentan chatbot koristeći znatno manji broj čipova nego američki rivali. Ovo su prvi rezultati koje je MLCommons objavio o tome kako su čipovi radili na obuci AI sistema poput Llama 3.1 405B. LIama je AI model kompanije Meta Platforms (META.O) sa dovoljno velikim brojem tzv. “parametara” da daju indikaciju o performansama na nekim od najsloženijih zadataka obuke u svetu, koji mogu uključivati trilione parametara.

Pročitajte i:  Zašto se pravi ljudi pretvaraju da su AI?

Nvidia i njeni partneri bili su jedini koji su dostavili podatke o obuci tog velikog modela. Podaci pokazuju da su novi Blackwell čipovi kompanije Nvidia, po čipu, više nego dvostruko brži od prethodne generacije Hopper čipova. U najbržim rezultatima, 2.496 Blackwell čipova završilo je test obuke za 27 minuta. Potrebno je bilo više od tri puta više čipova prethodne generacije da bi se postiglo kraće vreme, prema podacima.

Chetan Kapoor je direktor proizvoda kompanije CoreWeave. Ova kompnija je sarađivala sa Nvidijom na nekim rezultatima. On je naveo da postoji trend u AI industriji da se manje grupe čipova povezuju u podsisteme za različite AI zadatke obuke, umesto da se prave homogeni sistemi sa 100.000 i više čipova.

“Korišćenjem takve metodologije, oni mogu da nastave da ubrzavaju ili smanjuju vreme obuke za neke od ovih neverovatnih modela sa više triliona parametara,” rekao je Kapoor.

Izvor: Reuters

Facebook komentari:
Tagovi: ,

Leave a Reply

Your email address will not be published. Required fields are marked *