Nauka je postala jednostavna: Šta je mašinsko učenje?
Mašinsko učenje je proces korišćenja računara za otkrivanje obrazaca u masivnim skupovima podataka, a zatim predviđanje na osnovu onoga šta računar uči iz tih obrazaca. Ovo čini mašinsko učenje specifičnom i uskom vrstom veštačke inteligencije. Potpuna veštačka inteligencija uključuje mašine koje mogu da izvode sposobnosti koje povezujemo sa umovima ljudskih bića i inteligentnih životinja, kao što su opažanje, učenje i rešavanje problema.
Mašinsko učenje za otkrivanje raka
Svo mašinsko učenje je zasnovano na algoritmima. Generalno, algoritmi su skupovi specifičnih instrukcija koje računar koristi za rešavanje problema. U mašinskom učenju, algoritmi su pravila za analizu podataka pomoću statistike. Sistemi mašinskog učenja koriste ova pravila da identifikuju odnose između ulaznih podataka i željenih izlaza odnosno predviđanja.
Za početak, naučnici daju sistemima za mašinsko učenje skup podataka za obuku. Sistemi primenjuju svoje algoritme na ove podatke da bi se obučili kako da analiziraju slične ulazne podatke koje dobijaju u budućnosti.
Jedna oblast u kojoj mašinsko učenje pokazuje veliko obećanje je otkrivanje raka u kompjuterskoj tomografiji (CT). Prvo, istraživači sastavljaju što je moguće više CT slika koje mogu koristiti kao podatke za obuku. Neke od ovih slika prikazuju tkivo sa ćelijama raka, a neke zdrava tkiva.
Istraživači takođe prikupljaju informacije o tome šta treba tražiti na slici da bi identifikovali rak. Na primer, ovo može uključivati kako izgledaju granice kancerogenih tumora. Zatim stvaraju pravila o odnosu između podataka na slikama i onoga što lekari znaju o identifikaciji raka. Zatim daju ova pravila i podatke o obuci sistemu mašinskog učenja. Sistem koristi pravila i podatke obuke da bi se naučio kako da prepozna kancerogeno tkivo.
Preciznija predviđanja u budućnosti
Konačno, sistem dobija CT slike novog pacijenta. Koristeći ono što je naučio, sistem odlučuje koje slike pokazuju znake raka, brže nego što bi bilo koji čovek mogao. Lekari bi mogli da koriste predviđanja sistema da pomognu u odluci o tome da li pacijent ima rak i kako da ga leče.
Način na koji se postavljaju podaci za obuku deli sisteme mašinskog učenja na dva široka tipa: nadgledani i nenadgledani. Ako su podaci o obuci označeni, sistem se nadgleda.
Označeni podaci govore sistemu šta su podaci. Na primer, CT slike mogu biti označene da ukazuju na kancerogene lezije ili tumore pored tkiva koja su zdrava. U osnovi, to znači da sistem mašinskog učenja uči na primeru. Označavanje podataka može biti dugotrajno za velike količine podataka potrebnih za skupove podataka za obuku.
Ako podaci o obuci nisu označeni, sistem mašinskog učenja je bez nadzora. U primeru skeniranja raka, sistemu za mašinsko učenje bez nadzora dat bi ogroman broj CT skeniranja i informacija o tipovima tumora, a zatim bi ostavljen da sam nauči šta da traži da bi prepoznao rak. Ovo oslobađa ljudska bića od potrebe da označavaju podatke koji se koriste u procesu obuke. Nedostatak učenja bez nadzora je taj što rezultati možda neće biti toliko tačni zbog nedostatka eksplicitnih oznaka.
Neki sistemi mašinskog učenja mogu poboljšati svoje sposobnosti na osnovu povratnih informacija dobijenih o predviđanjima. Oni se nazivaju sistemi mašinskog učenja za pojačavanje. Sistemu bi se mogli reći rezultati drugih testova lekara o tome da li pacijenti imaju rak ili ne. Sistem bi tada mogao da podesi svoje algoritme kako bi proizveo preciznija predviđanja u budućnosti.
Činjenice
Mašinsko učenje omogućava naučnicima da analiziraju količine podataka koji su ranije bili nedostupni.
Istraživači koje finansira DOE u Sjedinjenim Američkim Državama koristili su mašinsko učenje da bi razvili novi skrining raka, bolje razumeli svojstva vode i autonomno upravljali eksperimentima.
Mašinsko učenje zasnovano na fizici koristi duboke neuronske mreže koje se mogu obučiti da inkorporiraju specifične zakone fizike za rešavanje zadataka nadgledanog učenja i naučnih problema.
Razvoj sistema za mašinsko učenje je podložan ljudskim greškama i predrasudama i zahteva isti pažljiv dizajn kao softverski inženjering.
DOE kancelarija za nauku doprinosi mašinskom učenju
Kancelarija za nauku odeljenja za energetiku podržava istraživanje o mašinskom učenju kroz svoj program naprednih naučnih računarskih istraživanja (ASCR). ASCR ima portfolio upravljanja podacima, analize podataka, računarske tehnologije i srodnih istraživanja koja svi doprinose mašinskom učenju i veštačkoj inteligenciji. Kao deo ovog portfolija, DOE poseduje neke od najsposobnijih svetskih superkompjutera.
Kancelarija za nauku DOE u celini je posvećena korišćenju mašinskog učenja za podršku naučnim istraživanjima. Nauka zavisi od velikih podataka, a korisnički objekti kancelarije za nauku kao što su akceleratori čestica i izvori rendgenskog svetla stvaraju dosta toga.
Koristeći mašinsko učenje, istraživači identifikuju obrasce ili dizajne u podacima iz ovih objekata koje je ljudima teško ili nemoguće otkriti, pri brzinama koje su stotine do hiljade puta brže od tradicionalnih tehnika analize podataka.
Izvor: SciTechDaily