Komentar: Piraterija najvišeg nivoa
Često čujemo da nekog korisnika Interneta kažnjavaju zato što je piratovao neki softver ili film. Ali šta onda reći na tvrdnju – koju praktično niko i ne osporava – da je Meta, koristeći torrent-e download-ovala preko 80 terabajta zakonom zaštićenih knjiga da bi pomoću tog teksta trenirala svoje AI modele?

Kompanija Meta, „majka“ Facebook-a i Instagram-a, se trenutno pred američkim sudom bori protiv veoma ozbiljne grupne tužbe izdavača da je koristila popularne… pa… ne baš naročito legalne sajtove kao što su LibGen (libgen.is), Anna’s Archive (annas-archive.org) i Z-Library (z-library.sk) da preuzima knjige i naučne radove kako bi taj tekst koristila za treniranje svojih LLaMA modela veštačke inteligencije. Preuzeli su čak 81.7 terabajta knjiga, a dokazi za to su prilično ubedljivi. Sud je zahtevao uvid u prepisku rukovodilaca kompanije Meta, koja je počela u oktobru 2022.
Neko (ime nije objavljeno) je rekao „ne treba da koristimo piratovani materijal, treba tu da povučemo liniju“ na šta je sam Zuckerberg odgovorio „Moramo da pokrenemo stvari unapred… da nađemo način da to odblokiramo“. Kako sada stoje stvari, izgleda da su našli način da te podatke prenose, ali da to ne bude sa korporativne mreže. Sve u svemu, Meta je možda koristila aktivne mere da zaobiđe zakone o autorskim pravima.
Otkud knjige na Internetu?
Čovek koji pošteno kupuje knjige na Amazon.com-u ili na Novinarnica.net sa pravom će se zapitati otkud tolike piratovane knjige „na izvol’te“ i kakvi su to uopšte sajtovi? Pokazuje se da LibGen, Anna’s Archive i Z-Library zaista sadrže gotovo sve iole popularne knjige objavljene na raznim jezicima, u EPUB, PDF i drugim formatima, i da se bilo koja od njih može potpuno besplatno preuzeti, uz nekoliko klikova i malo čekanja na prenos. Osim knjiga, na raspolaganju su i naučni radovi, čak i oni iz najuglednijih časopisa, koji se inače pojedinačno prodaju na sajtu izdavača ili zahtevaju plaćanje neke visoke pretplate, kakve svojim profesorima i asistentima obično obezbeđuju njihovi univerziteti.
Moglo bi se tvrditi da i AI modeli koriste knjige isključivo da bi učili i da dalje ne distribuiraju taj tekst, nego stečeno znanje koriste za rešavanje životnih problema – kao što to rade i ljudi
Kako ti sajtovi opstaju već decenijama? Moram da priznam da ni meni to nije jasno, kao što mi nije jasno kako do sada nije onesposobljen thepiratebay.org, jedan od najstarijih sajtova koji sakuplja torrent-e za softver, filmove, knjige i druge materijale. Neki kažu da izdavači tiho veruju da im čak i taj kanal ilegalne distribucije materijala na neki način pomaže da njihova izdanja dođu do šire publike, što kasnije uspevaju da monetizuju. A možda su i autori tih sajtova toliko vešti da im nije moguće „stati na rep“
To ipak ne znači da je preporučljivo „tek tako“ krasti knjige, a posebno ne u većim količinama. Poznat je slučaj kada je Aaron Swartz, programer, haker i Internet aktivista, 2013. godine koristio mrežu MIT-ja da preuzme oko 70 GB naučnih radova koji su pod kopirajtom – stavio je laptop u neki ormarić i tako prenosio PDF fajlove. MIT-jeva interna policija je to otkrila, prijavila ga je „pravoj“ policiji i on je optužen po raznim zakonima, pa mu je pretila kazna do 35 godina u federalnom zatvoru. Kada njegovi advokati nisu uspeli da se nagode sa tužiocem, Aaron nije izdržao pritisak i izvršio je samoubistvo. Sada je Meta download-ovala 1000 puta više podataka, ali na kraju verovatno neće snositi nikakve posledice ili će se sve završiti na nekoj novčanoj nagodbi. Pa posle kažite da smo pred zakonom svi jednaki
Od knjige do znanja
Brojne su logičke i pravne dileme korišćenja informacija objavljenih u knjigama. Pojam biblioteke je mnogo stariji od Interneta, pa je svakom malo starijem čitaocu ovih redova blizak koncept da učenik ili student ode u biblioteku, pozajmljuje i čita knjige ne plaćajući za tu privilegiju ništa osim možda neke skromne godišnje članarine, i tako stiče znanje. Autoru knjige neće platiti ni dinara za znanje koje je stekao. Štaviše, autori i izdavači su često slali svoje knjige bibliotekama besplatno, da bi ih ljudi što više čitali.
Moglo bi se tvrditi da i AI modeli koriste knjige isključivo da bi učili i da dalje ne distribuiraju taj tekst, nego stečeno znanje koriste za rešavanje životnih problema – kao što to rade i ljudi. Ova dilema još nije stigla do nekog sudskog rešenja – udruženja pisaca i The New York Times su još 2023. godine tužili OpenAI što koriste njihove knjige bez dozvole, a kasnije je i NVIDIA uključena u spor zbog 196,640 knjiga korišćenih za razvoj NeMo modela. Sada se sprema i tužba protiv DeepSeek-a koji je koristio literaturu, ali i podatke koje je već (nelegalno?) pribavio OpenAI. Život uvek ide ispred pravne regulative, pa ćemo sledećih godina verovatno puno čitati o problemima ove vrste.
Autor: dr Sava Zdravković