Novi Nvidia AI audio model pravi zvukove koji nikada nisu postojali

26. 11. 2024.26. 11. 2024. Milan Živković

Svako ko se bar malo zanima za AI već zna za generativne modele koji mogu da prave snimke s govorom ili muzikom. Ti sadržaji nastaju na osnovu tekstualnih unosa korisnika, ali su zvukovi obično poznati. Nvidia ide malo dale, budući da je predstavila AI model koji proizvodi zvukove koje niko pre nije čuo.

Model Fugatto dakle ide korak dalje, a zbog toga što je treniran na poseban način. Zahvaljujući tome može da proizvodi svakojake zvukove, muziku, čak ljudske glasove koji se ne baziraju na tuđim glasovima. Još uvek nije dostupan javnosti, ali na web-sajtu sa uzorcima već može da se čuje šta sve može. Neki primeri su bolji, drugi lošiji, ali su svi dokaz da je ono što se iz Nvidia-e tvrdi tačno: „Fugatto je sposoban da napravi bilo koji zvuk“.

Kreiranje „nepostojećih“ zvukova je moguće zahvaljujući sistemu “ComposableART” (Audio Representation Transformation). Kada dobije tekstualni i/ili audio prompt ovaj sistem počinje sa proizvodnjom glasova, a u tom procesu nezavisno kontroliše kreiranje zvukova koji se zasnivaju i na elementima koje nije dobio tokom treninga. Može dakle da kombinuje različite stvari koje je naučio, a na dosad neviđene (nečuvene) načine, zahvaljujući čemu stvara nove glasove.

Pročitajte i: AI i metasurfaces: bežični signal koji zaobilazi prepreke

U kompaniji Nvidia ističu da je „istorija muzike i istorija tehnologije“, pa je vrlo verovatno da će se zahvaljujući AI mogućnostima pojaviti novi žanrovi, zvukovi o kojima nismo ni sanjali.

Facebook komentari:

Možda će vas zanimati:

Tagovi: AI, audio, Nvidia

Podelite s prijateljima

Možda će vas zanimati: