OpenAI nudi rani pogled na DALL-E API, prikazuje slučaj text-to image upotrebe
DALL-E API neće biti zvanično objavljen do kasnije ove jeseni, prema OpenAI-ju, ali danas je kompanija podelila detalje o klijentu koji već koristi DALL-E API za određeni slučaj upotrebe.
Pomoć da ideje pretvorite u prilično detaljna istraživanja onoga što pokušavate da napravite
Cala sa sedištem u Njujorku, startup koji sebe smatra „prvim svetskim operativnim sistemom za modu“, nudi digitalnu platformu (uključujući mobilnu aplikaciju lansiranu u martu) koja omogućava kreatorima da dizajniraju i proizvode linije odeće, objedinjujući proces od ideja proizvoda kroz ispunjenje porudžbine. Uz dodatak DALL-E alata za generisanje teksta u sliku, korisnici mogu da generišu nove ideje vizuelnog dizajna iz opisa prirodnog teksta ili otpremljenih referentnih slika – za koje kompanija kaže da su prve mogućnosti ove vrste za modnu industriju .
„Od trenutka kada smo videli da DALL-E stiže, znali smo da ovo zaista odlično odgovara našem poslovanju i načinu na koji radimo“, rekao je Dilan Pajl, tehnički direktor kompanije Cala, koji je dodao da se implementacija DALL-E API dogodila tek u poslednjih nekoliko nedelja. „Mi ovo zaista vidimo kao povećanje ljudskih dizajnera – pomažemo vam da ove ideje pretvorite u prilično detaljna istraživanja onoga što pokušavate da napravite…pojednostavljujući i čineći ceo proces bržim, efikasnijim i efikasnijim.“ Luk Miler, menadžer proizvoda DALL-E API-ja u OpenAI-u, rekao je da istraživačka kompanija već ima veliku bazu programera koji koriste svoje API-je, tako da je ponudila DALL-E API određenim kompanijama.
„Bilo je malo oportunistički, jer nalazimo kreativne i zanimljive slučajeve upotrebe dok testiramo proizvod. Naš tim je bio veoma uzbuđen što će raditi sa Cala-om na ovom veoma specifičnom slučaju upotrebe, na neki način da je super-pokretao njihov kreativni proces i ugradio ga u pravu poslovnu aplikaciju”. Da bi koristio DALL-E alatke, korisnik bira između desetina šablona proizvoda, kao što su dukserica, haljina ili jakna, i dodaje termine kao što su „tamno, delikatno i somot“ u odeljak za prideve i fraze kao što su „šiven logo zakrpe” u odeljak za ukrase i karakteristike. Cala zatim generiše šest primera dizajna proizvoda. Korisnik može da nastavi sa generacijom dizajna na osnovu originalnog upita ili da nastavi dalje modifikovanje određenog dizajna. Kreatori takođe mogu da otpreme svoje dizajne i DALL-E će vratiti šest slika sa malo drugačijim varijacijama.
Pajl je istakao da Cala vidi DALL-E API kao način da pomogne u jačanju procesa kreativne inspiracije, bez obzira da li je kreator iskusan dizajner ili ne. Miler je dodao da DALL-E API omogućava programerima da uzmu DALL-E tehnologiju i izgrade prilagođena rešenja specifična za njihove aplikacije. „Očigledno je da je model koji generiše slike na kraju dana DALL-E … ali mi ih transformišemo u uputstva koja smo razvili za svaku kategoriju proizvoda da bismo usmeravali rezultate DALL-E na način na koji smatramo da ima najviše smisla. Bili smo oduševljeni koliko je to lako… i dalje morate imati tu vrstu kreativnog upravljanja ulazima i interpretirati rezultate na razuman način. Ali uz samo malo pravca, možete dobiti zaista sjajne rezultate. To je gotovo odmah pogodilo našem timu.”
Na pitanje da li korisnici Cala mogu da koriste upite kao što su popularna imena dizajnera ili logotipi, Miler je odgovorio da postoje zaštitne ograde oko načina na koji korisnici mogu da unose DALL-E upite i da API prati politiku sadržaja OpenAI – koja zabranjuje sadržaj koji se odnosi na različite kategorije uključujući mržnju, uznemiravanje, nasilje, seksualno i političko. „Sigurno nismo zainteresovani da ohrabrujemo ili omogućavamo bilo kakve takve pristupe“, dodao je Pajl. „Pokušavamo da zadržimo fokus na vrsti dizajnerskih elemenata koji vaše ideje čine jedinstvenim.
Izvor: Venturebeat