Sada možete blokirati OpenAI veb popisivač
OpenAI vam sada omogućava da blokirate njegov veb popisivač da skrapa vašu veb lokaciju kako biste pomogli u obuci GPT modela.
U postu na blogu, OpenAI je rekao da operateri veb-sajtova mogu posebno da zabrane njegov GPTBot pretraživač na datoteci Robots.tkt svoje veb lokacije ili da blokiraju njenu IP adresu. „Veb stranice popisane pomoću GPTBot korisničkog agenta mogu potencijalno da se koriste za poboljšanje budućih modela i filtriraju se kako bi se uklonili izvori koji zahtevaju pristup platnom zidu, za koje se zna da prikupljaju lične informacije (PII) ili imaju tekst koji krši naše smernice“, navodi OpenAI u postu na blogu. Za izvore koji ne odgovaraju isključenim kriterijumima, „omogućavanje GPTBotu da pristupi vašoj veb lokaciji može pomoći da modeli veštačke inteligencije postanu precizniji i da poboljšaju svoje opšte mogućnosti i bezbednost“.
Blokiranje GPTBot-a može biti prvi korak u OpenAI-u koji omogućava korisnicima interneta da odustanu od korišćenja njihovih podataka za obuku njegovih velikih jezičkih modela. Prati neke rane pokušaje stvaranja zastave koja bi isključila sadržaj iz obuke, poput oznake „NoAI“ koju je DeviantArt osmislio prošle godine. Ne uklanja retroaktivno sadržaj koji je prethodno izvučen sa sajta iz ChatGPT-ovih podataka o obuci.
Internet je obezbedio veliki deo podataka o obuci za velike jezičke modele kao što su OpenAI GPT modeli i Google Bard. Međutim, OpenAI neće potvrditi da li je svoje podatke dobio putem objava na društvenim mrežama, dela zaštićenih autorskim pravima ili koje delove interneta je pronašao u potrazi za informacijama. A izvor podataka za obuku AI postaje sve sporniji. Sajtovi, uključujući Reddit i Twitter, su se zalagali za suzbijanje besplatnog korišćenja postova svojih korisnika od strane kompanija sa veštačkom inteligencijom, dok su autori i drugi kreativci tužili zbog navodne neovlašćene upotrebe njihovih dela. Zakonodavci su se takođe bavili pitanjima privatnosti podataka i saglasnosti na nekoliko saslušanja u Senatu o regulaciji veštačke inteligencije prošlog meseca.
Kako je izvestio Axios, kompanije poput Adobe-a iznele su ideju o označavanju podataka kao da nisu za obuku kroz zakon protiv lažnog predstavljanja. Kompanije za veštačku inteligenciju, uključujući OpenAI, potpisale su sporazum sa Belom kućom o razvoju sistema vodenih žigova kako bi ljudi znali da li je nešto generisala veštačka.
Izvor: TheVerge