AI i novi standardi obećavaju da će naučne podatke učiniti korisnijima
Svaki put kada naučnik pokrene eksperiment, ili društveni naučnik uradi anketu, ili naučnik iz humanističkih nauka analizira tekst, oni generišu podatke.
AI će podatke učiniti višekratnim i dostupnim
Nauka se zasniva na podacima – bez njih ne bismo imali zapanjujuće slike svemirskog teleskopa Džejms Veb, vakcine za sprečavanje bolesti ili evoluciono drvo koje prati loze celog života. Sve ovo generiše nezamislivu količinu podataka – pa kako istraživači to prate? I kako se postaraju da su dostupni i ljudima i mašinama? Da bi poboljšali i unapredili nauku, naučnici moraju da budu u stanju da reprodukuju tuđe podatke ili kombinuju podatke iz više izvora da bi naučili nešto novo.
Svaka vrsta deljenja zahteva upravljanje. Ako vaš komšija treba da pozajmi alat ili sastojak, morate da znate da li ga imate i gde ga držite. Podaci istraživanja mogu biti na laptopu diplomiranog studenta, zakopani u USB kolekciji profesora ili trajnije sačuvani u onlajn repozitorijumu podataka.
Upravljanje podacima istraživanja
Upravljanje istraživačkim podacima je oblast učenja koja se fokusira na otkrivanje i ponovnu upotrebu podataka. Kao oblast, obuhvata usluge istraživačkih podataka, resurse i sajber infrastrukturu. Na primer, jedna vrsta infrastrukture, skladište podataka, daje istraživačima mesto da deponuju svoje podatke za dugotrajno skladištenje kako bi ih drugi mogli pronaći. Ukratko, upravljanje istraživačkim podacima obuhvata životni ciklus podataka od kolevke do groba do reinkarnacije u sledećoj studiji. Pravilno upravljanje istraživačkim podacima takođe omogućava naučnicima da koriste podatke koji već postoje, umesto da se sećaju podataka koji već postoje, što štedi vreme i resurse.
Sa sve većom politizacijom nauke, mnoge nacionalne i međunarodne naučne organizacije podigle su svoje standarde odgovornosti i transparentnosti. Federalne agencije i drugi veliki finansijeri istraživanja kao što je Nacionalni institut za zdravlje sada daju prioritet upravljanju istraživačkim podacima i zahtevaju od istraživača da imaju plan upravljanja podacima pre nego što mogu da dobiju bilo kakva sredstva. Naučnici i menadžeri podataka mogu zajedno da rade na redizajniranju sistema koje naučnici koriste da bi olakšali otkrivanje i očuvanje podataka. Konkretno, integracija AI može učiniti ove podatke pristupačnijim i višekratnim.
Veštački inteligentno upravljanje podacima
Mnogi od ovih novih standarda za upravljanje istraživačkim podacima takođe potiču od povećane upotrebe veštačke inteligencije, uključujući mašinsko učenje, u oblastima vođenim podacima. AI čini veoma poželjnim da bilo koji podaci budu mašinski obrađeni – to jest, da ih mogu koristiti mašine bez ljudske intervencije. Sada, naučnici mogu da posmatraju mašine ne samo kao alate, već i kao potencijalne autonomne ponovne korisnike podataka i saradnike.
Ključ za mašinske podatke su metapodaci. Metapodaci su opisi koje naučnici postavljaju za svoje podatke i mogu uključivati elemente kao što su kreator, datum, pokrivenost i predmet. Minimalni metapodaci su minimalno korisni, ali ispravni i potpuni standardizovani metapodaci čine podatke korisnijim i za ljude i za mašine. Potreban je kadar istraživačkih menadžera podataka i bibliotekara da bi podaci koji se mogu primeniti na mašini postali stvarnost. Ovi informacioni profesionalci rade na olakšavanju komunikacije između naučnika i sistema obezbeđivanjem kvaliteta, potpunosti i doslednosti zajedničkih podataka.
Principi FAIR podataka, koje je kreirala grupa istraživača pod nazivom FORCE11 2016. godine i koji se koriste širom sveta, pružaju smernice o tome kako da se omogući ponovna upotreba podataka od strane mašina i ljudi. FAIR podaci su dostupni, interoperabilni i ponovo upotrebljivi – što znači da imaju robusne i potpune metapodatke.
Planovi upravljanja podacima
Ali još uvek postoji jedan deo upravljanja istraživačkim podacima koji AI ne može da preuzme. Planovi upravljanja podacima opisuju šta, gde, kada, zašto i ko upravlja podacima istraživanja. Naučnici ih popunjavaju i navode uloge i aktivnosti za upravljanje istraživačkim podacima tokom i dugo nakon završetka istraživanja. Odgovaraju na pitanja poput: „Ko je odgovoran za dugoročno očuvanje“, „Gde će podaci živeti“, „Kako da zaštitim svoje podatke“ i „Ko sve to plaća?“
Predlozi za grantove za skoro sve agencije za finansiranje širom zemalja sada zahtevaju planove upravljanja podacima. Ovi planovi signaliziraju naučnicima da su njihovi podaci vredni i dovoljno važni da ih zajednica deli. Takođe, planovi pomažu finansijskim agencijama da prate istraživanje i istraže svako potencijalno nedolično ponašanje. Ali što je najvažnije, oni pomažu naučnicima da osiguraju da njihovi podaci ostanu dostupni dugi niz godina.
Učiniti da svi istraživački podaci budu što fer i otvoreni, poboljšaće naučni proces. A pristup većem broju podataka otvara mogućnost za bolje informisane diskusije o tome kako promovisati ekonomski razvoj, poboljšati upravljanje prirodnim resursima, unaprediti javno zdravlje i kako odgovorno i etički razviti tehnologije koje će poboljšati živote. Sva inteligencija, veštačka ili neka druga, imaće koristi od bolje organizacije, pristupa i korišćenja istraživačkih podataka.
Izvor: Nextgov