Top50 2024

Dobijanje potpuno optičkog AI sistema za rad sa nelinearnom matematikom

Standardna digitalna kamera u automobilima za funkcije poput kočenja u nuždi ima perceptivnu latenciju nešto više od 20 milisekundi.

Umesto da detektujemo fotone i obrađujemo rezultate, zašto ne bismo obrađivali same fotone?

PCPress.rs Image

To je vreme potrebno da kamera pretvori fotone koji udaraju u njen otvor u električne signale koristeći CMOS ili CCD senzore. Ovo ne uključuje dodatne milisekunde potrebne da se te informacije prenesu na računar u vozilu ili obrade tamo.

Tim istraživača sa MIT-a zaključio je da bi čip koji može direktno obrađivati fotone mogao eliminisati čitav korak digitalizacije i omogućiti izvođenje proračuna samim fotonima. To bi moglo drastično ubrzati proces.

„Fokusirani smo na vrlo specifičnu metriku, a to je latencija. Ciljamo na primene gde je najvažnije koliko brzo možete proizvesti rešenje. Zato nas interesuju sistemi u kojima možemo sve proračune obavljati optički“, kaže Saumil Bandjopadjaj, istraživač na MIT-u. Tim je implementirao celokupnu duboku neuronsku mrežu na fotonskom čipu, postigavši latenciju od 410 pikosekundi. Za poređenje, Bandjopadjajev čip može obraditi celu neuronsku mrežu 58 puta u okviru jednog takta standardnog procesora od 4 GHz.

Matrice i nelinearnost

Neuronske mreže funkcionišu sa više slojeva računskih jedinica koje deluju kao neuroni. „Svaki neuron može primiti ulaz, a ti ulazi mogu, na primer, biti brojevi“, kaže Bandjopadjaj. Ti brojevi se množe konstantama koje se nazivaju težine ili parametrima pre nego što se proslede sledećem sloju neurona. Svaki sloj uzima ponderisanu sumu prethodnih slojeva i prosleđuje je dalje. Ovaj proces je ekvivalent linearnom algebarskom množenju matrica. Međutim, AI modeli se često koriste za pronalaženje složenih obrazaca u podacima gde izlaz nije uvek proporcionalan ulazu. Zbog toga su potrebne i nelinearne funkcije pragova koje prilagođavaju težine između slojeva neurona. „Ono što čini duboke neuronske mreže tako moćnim jeste sposobnost mapiranja vrlo složenih odnosa u podacima kombinovanjem linearnih operacija i nelinearnih funkcija pragova između slojeva“, objašnjava Bandjopadjaj. Problem je što ovakve operacije zahtevaju masivne paralelne proračune koji, kada se obavljaju na standardnim računarima, troše mnogo energije i vremena. Bandjopadjajev tim smatra da se ovaj problem može rešiti izvođenjem tih operacija pomoću fotona umesto elektrona. Na fotonskim čipovima informacije se mogu kodirati u optička svojstva poput polarizacije, faze, amplitude, frekvencije i talasnog vektora. Iako bi ovo bilo izuzetno brzo i energetski efikasno, izrada takvih čipova nije jednostavna.

Pročitajte i:  Google povukao obećanje da neće koristiti AI za pravljenje oružja

Usmeravanje svetlosti

„Fotonski sistemi su posebno dobri u linearnim matričnim operacijama“, tvrdi Bandjopadjaj. Grupa sa MIT-a, koju vodi profesor Dirk Englund, koautor studije, demonstrirala je fotonski čip koji u potpunosti obavlja matrično množenje pomoću svetlosti još 2017. godine. Međutim, glavni izazov bilo je implementiranje nelinearnih funkcija u fotonici.

Do sada se problem rešavao tako što su se linearne algebarske operacije izvodile na fotonskim čipovima, dok su se nelinearne funkcije prebacivale na eksterne elektronske uređaje. Ovo je povećavalo latenciju jer je bilo potrebno konvertovati informacije iz svetlosnih u električne signale, obraditi ih i vratiti nazad u svetlost. „Smanjenje latencije je glavni razlog zašto želimo da neuronske mreže radimo fotonski“, kaže Bandjopadjaj.

Da bi rešio ovaj problem, njegov tim je dizajnirao i napravio prvi čip na svetu koji može izvesti celokupnu duboku neuronsku mrežu, uključujući linearne i nelinearne operacije, koristeći fotone. Proces započinje spoljnom laserskom modulacijom koja uvodi svetlost u čip preko optičkog vlakna. „Na taj način električne ulaze pretvaramo u svetlost“, objašnjava Bandjopadjaj.

Pročitajte i:  Microsoft pregledač u sistemu Windows 11 

Svetlost se zatim razdvaja na šest kanala i uvodi u sloj sa šest neurona koji obavljaju linearno množenje matrica koristeći niz uređaja nazvanih Meha-Cenderovi interferometri. „Oni su programabilni razdjelnici snopa, koji mešaju dva optička polja kako bi proizveli dva izlazna optička polja“, kaže on.

Nakon množenja matrica, informacije prolaze kroz jedinicu odgovornu za nelinearne funkcije. Ceo čip je imao tri sloja neurona i dve jedinice za nelinearne funkcije, što mu omogućava rad sa 132 parametra.

Skromni počeci

Bandjopadjajev čip trenutno cilja na AI modele sa do 100.000 parametara, daleko manje od 1 triliona parametara u modelima poput Chat GPT-4. Međutim, tim veruje da će čipovi ovog tipa naći primenu u aplikacijama gde je ključna brzina reakcije, kao što su autonomni automobili ili sistemi za klasifikaciju lidar signala.

Bandjopadjaj smatra da bi fotonski čipovi mogli zameniti standardne kamere u autonomnim vozilima, omogućavajući direktnu obradu optičkih signala bez pretvaranja u električne. „Sve je stvar inženjeringa sistema“, zaključuje on.

Izvor: Arstechnica

Facebook komentari:
Računari i Galaksija
Tagovi: ,

Leave a Reply

Your email address will not be published. Required fields are marked *