Nvidia AI tim je koristio YouTube i Netflix video snimke bez dozvole
Po svemu sudeći, došli smo do još jedne neovlašćene upotrebe kopirajtovanog materijala za AI trening. Jedna od najvrednijih kompanija na svetu, Nvidia, izgleda da je zahtevala od radnika da preuzimaju video snimke sa YouTube-a, Netflix-a i drugih video izvora za razvoj svojih komercijalnih AI projekata. Proizvođač grafičkih kartica se tako pridružio drugim tehnološkim kompanijama koje su „zaobišle“ etičke barijere u trci za dominantnom pozicijom u AI sferi poslovanja.
U svojoj odbrani na ove navode, kompanija je navela da su njena istraživanja u potpunosti u skladu sa duhom zakona o autorskim pravima. Takođe, ona tvrdi da zakoni o intelektualnoj svojini štite specifične izraze, ali ne i „činjenice, ideje, podatke ili informacije“. Pravnici kompanije su izjednačili ovu praksu sa pravom osobe da „nauče činjenice, ideje, podatke ili informacije iz drugog izvora i da ih koristi kao sopstvene“. Oni su naveli „čovek, kompjuter… u čemu je razlika?“
YouTube se ne slaže sa takvim stavom. Prema njihovom stavu, upotreba YouTube video snimaka za treniranje AI modela predstavlja „čisto kršenje“ autorskih prava. Ovo je bio slučaj i sa OpenAI Sora text-to-video generatorom, koji je treniran na YouTube video snimcima, bez dozvole.
Zaposlenima u Nvidia-i koji su bili zabrinuti u vezi ove prakse, navodno su njihovi menadžeri rekli da je ona odobrena na najvišim nivoima kompanije.
Pored YouTube i Netflix videa, Nvidia je koristila i movie trailer bazu podataka MovieNet, interne biblioteke snimaka video igara, GitHub video dataset WebVid… Neki od videa koji su upotrebljeni za treniranje označeni su za upotrebu u akademsku (odnosno, nekomercijalnu) upotrebu. Nvidia je video snimke preuzimala putem virtuelnih mašina, na kojima su menjane IP adrese, kako bi se sprečilo blokiranje. To je rađeno tako što su virtuelne mašine koje se nalaze na AWS-u, restartovane, čime su im dodeljivane nove javne IP adrese…
Izvor: Engadget