Google text-to-image AI koji kreira fotorealistične slike
Google je objavio svoj sistem veštačke inteligencije koji je u stanju da kreira slike na osnovu tekstualnih uputstava. Ideja koja stoji iza ove tehnologije je da korisnik može da opiše situaciju kakvu želi, a da AI te informacije pretvori u sliku. Tehnologiju je osmislio i realizovao Brain Team u Google Research-u.
Ovo nije prva tehnologija text-to-image modela. Već postoje DALL-E, VQ-GAN+CLIP i još neki sistemi koji rade to isto. Međutim, Imagen, kako se Google-ov AI zove, je na osnovu DrawBench benchmarka najbolje ocenjen od strane ljudi koji su ih testirali. Suštinski, radi se o listi od 200 opisa, na osnovu kojih svaki AI generiše slike, koje zatim ocenjuju ljudi, i to po osnovu dva kriterijuma – kvalitet slike i tačnost predstavljanja opisa.
Inače, Imagen još uvek nije javno dostupan, jer Google smatra da još uvek nije dovoljno dobar da precizno predstavi sve grafičke opise. Jedan od razloga je i što je AI treniran na osnovu velikog broja fotografija preuzetih sa Interneta, što bi teoretski u realnim uslovima moglo da prouzrokuje različite probleme. Iz Google-a kažu da su se trudili da uklone neprikladne fotografije, kao što su pornografija ili brutalne scene, ali da uvek postoji šansa da je neka takva slika izbegla cenzuru i da se našla u bazi.
Budući razvoj Imagen-a biće na polju istraživanja kako da se na odgovoran način iskoriste slike iz baze, odnosno kako napraviti optimalan balans između slobodnog pristupa i uklanjanja neprikladnih slika. Za sada se eksperimentiše sa ograničenim ključnim rečima, ali to u perspektivi predstavlja veliki ograničavajući faktor.
Izvor: Engadget