OpenAI tvrdi da može da klonira glas na osnovu snimaka od 15 sekundi
OpenAI je upravo najavio da je nedavno sproveo mali pregled novog alata pod nazivom Voice Engine. Ovo je tehnologija kloniranja glasa koja može da imitira bilo koji zvuk analizom audio uzorka od 15 sekundi. Kompanija kaže da generiše „govor koji zvuči prirodno“ sa „emotivnim i realističnim glasovima“.
API postoji od 2022. godine
Tehnologija je zasnovana na kompanijinom već postojećem API-ju za pretvaranje teksta u govor i radi od 2022. OpenAI već koristi verziju skupa alata za napajanje unapred podešenih glasova dostupnih u trenutnom pretvaranju teksta u govor i funkcija Read Aloud. Postoji gomila uzoraka na zvaničnom blogu kompanije i oni zvuče jezivo blizu prave stvari. Podstičemo vas da ih saslušate i zamislite mogućnosti, i dobre i loše.
OpenAI kaže da vide da je ova tehnologija korisna za pomoć pri čitanju, prevod jezika i pomoć onima koji pate od iznenadnih ili degenerativnih stanja govora. Kompanija je pokrenula pilot program Univerziteta Braun koji je pomogao pacijentu sa problemima s govorom tako što je kreirao klon Voice Enginea izvučen iz audio zapisa za školski projekat.
Uprkos potencijalnim prednostima, loši akteri bi sigurno zloupotrebili ovu tehnologiju da bi se upustili u neku ozbiljnu lažnu glupost, što je već problem. Imajući ovo na umu, Voice Engine nije sasvim spreman za udarno vreme, jer postoje ozbiljni problemi u vezi sa privatnošću koji se moraju rešiti pre potpunog uvođenja.
Pored toga, svako ko koristi tehnologiju moraće da otkrije svojoj publici da su glasovi generisani AI. OpenAI je primenio bezbednosne mere, kao što je vodeni žig za praćenje porekla bilo kakvog zvuka i „proaktivno praćenje“ načina na koji se sistem koristi. Kada se proizvod zvanično pojavi, postojaće „no-go glasovna lista“ koja otkriva i sprečava zvukove generisane veštačkom inteligencijom koji su previše slični javnim ličnostima.
Što se tiče toga kada će se to uvođenje dogoditi, OpenAI ostaje zatvoren.
Izvor: Engadget