Na ovom web-sajtu se čuvaju sadržaji koji su nastali pre veštačke inteligencije
U vremenskim kapsulama se obično čuvaju uspomene, sitnice. Tako je bar bilo pre nego što je AI ušao u igru. Jedna takva kapsula je nastala da bi sačuvala sadržaje koji su nastali pre 2022 godine, pre nego što su ChatGPT i AI izašli na scenu.

Mnogi nisu ni svesni koliko su dragocene stvari koje je čovek smislio i stvorio bez pomoći botova – posebno kada su tekst i umetnost u pitanju. John Graham-Cumming, bivši izvršni direktor kompanije Cloudflare, nije jedan od njih, pa je valjda zato i lansirao web-sajt lowbackgroundsteel.ai.
U pitanju je mesto na kojem se sadržaji koje je mislio čovek tretiraju kao retke dragocenosti. Ideja je da se skrene pažnja na originalne izvore – na tekstove, fotografije i slike na kojima su mnogi AI alati trenirani, na originalne sadržaje čije svežine izgleda u ovom trenutku nismo svesni. Cilj je da se sačuva ono što ljude čini ljudima.
Sajt je dobio ime po naučnom fenomenu iz vremena Hladnog rata – nakon što se 1945. godine počelo s testiranjem nuklearnog oružja radijacija je uticala na novoproizvedeni čelik širom sveta. Zato su naučnici, kojima je nekompromitovani metal bio potreban za pravljenje osetljivih instrumenata, decenijama tražili i prikupljali „čist“ čelik iz olupina koje su proizvedene pre Drugog svetskog rata. Takav čelik su zvali „low-backround steel“.
AI možda nije opasan kao nuklearno oružje (bar za sada), ali je naučnicima od 2022. godine sve teže da na internetu pronađu sadržaje za koje sa sigurnošću mogu da tvrde da su nastali bez mešanja AI alata. ChatGPT je posebno zaslužan za lavinu tekstova koji su preplavili sajtove, a sve je više istraživačkih projekata koji se gase zbog korišćenja ovakvih izvora.
Jedan od ugašenih projekata je i wordfreq, Python biblioteka koju je kreirao istraživač Robyn Speer. U okviru njega se istraživala učestalost korišćenja reči u 40 jezika. Analizirani su milioni izvora, uključujući tekstove s Wikipedia-e, filmske naslove, vesti, postove na društvenim mrežama. Alatku su koristili profesori, stručnjaci, istraživači i svi eksperti koji su se bavili time kako jezik evoluira, a služila je i za razumevanje jezika potrebno za kreiranje aplikacija za obradu govora i teksta. Projekat je u septembru 2024. godine zaustavljen, a u obrazloženju piše da „je inernet ugušen muljem koji su stvorili veliki jezički modeli (LLM), tekstovima koje nije napisao čovek i koji ne služe ničemu jer ne komuniciraju ništa“.
Tu su i drugi problemi, a jedan od većih je to što neki AI modeli već treniraju na sadržajima koje su sami stvorili, što još više pogoršava kvalitet. Taj fenomen se naziva „kolaps modela“. Vremenska kapsula s sadržajima koje su stvorili ljudi nije zamišljena kao rešenje za to, već kao podsetnik na to šta možemo da izgubimo ako prestanemo da se oslanjamo na sebe i potpuno se okrenemo botovima.
Sajt lowbackgroundsteel.ai nudi putokaze ka drugim velikim arhivama pre-AI sadržaja, na primer Wikipedia dump koja je nastala 2022, ili foto-arhivi biblioteke Kongresa, te GitHub-ovom Arctic Code Vault. Prihvataju se prijave za druge slične arhive, a preko Tumblr stranice sajta. Nadamo se da će ih biti što više, jer je važno da zapamtimo da su ljudi jednom bili kreativni.