Stiže nam Sora, OpenAI model za kreiranje video snimaka na osnovu tekstualnih upita
OpenAI je u četvrtak najavio Sora, potpuno novi model koji generiše video zapise visoke definicije dužine do jednog minuta iz tekstualnih upita. Sora, što na japanskom znači „nebo“, uskoro neće biti dostupna široj javnosti. Umesto toga, OpenAI ga čini dostupnim maloj grupi akademika i istraživača koji će proceniti štetu i njen potencijal za zloupotrebu.
U toku faza testiranja zbog potencijalnih zloupotreba
Sora je u stanju da generiše složene scene sa više likova, specifičnim tipovima pokreta i tačnim detaljima subjekta i pozadine. Model razume ne samo šta je korisnik tražio u promptu, već i kako te stvari postoje u fizičkom svetu.
OpenAI kaže da model funkcioniše kao rezultat „dubokog razumevanja jezika“, što mu omogućava da tačno tumači tekstualne upite. Ipak, kao u osnovi svi AI generatori slika i video zapisa koje smo videli, Sora nije savršena. Sora nije prvi model za pretvaranje teksta u video. Druge kompanije su ili zadirkivale alate za pretvaranje teksta u video ili su ih učinile dostupnim javnosti. Ipak, nijedan drugi alat trenutno ne može da generiše video zapise od 60 sekundi.
Porast alata za pretvaranje teksta u video izazvao je zabrinutost zbog njihovog potencijala da lakše kreiraju lažne snimke realnog izgleda. OpenAI je rekao da radi sa stručnjacima u oblastima kao što su dezinformacije, sadržaj mržnje i pristrasnost na testiranju alata pre nego što ga učini dostupnim javnosti. Kompanija takođe gradi alate koji mogu da detektuju video zapise koje generiše Sora i uključi metapodatke u generisane video zapise radi lakšeg otkrivanja.
Izvor: Engadget