Wystarczy opis, a sztuczna inteligencja namaluje obraz. Niezwykłe narzędzie w akcji

DALL-E 2 to narzędzie oparte na sztucznej inteligencji, które jest w stanie tworzyć obrazki na podstawie opisów tekstowych.
Wystarczy opis, a sztuczna inteligencja namaluje obraz. Niezwykłe narzędzie w akcji

Względem poprzedniej wersji ta najnowsza generuje swoje dzieła w wyższej rozdzielczości. Efekty jej działania są naprawdę imponujące, ponieważ SI nie tylko tworzy obrazy, ale również dodaje nowe elementy do tych istniejących i umożliwia spojrzenie na nie z nowej perspektywy. 

Pierwowzór został wydany na początku ubiegłego roku, a jego nazwa miała stanowić hołd dla słynnego malarza, Salvadora Dali oraz nawiązanie do animacji WALL-E. Początkowo narzędzie tworzyło proste obrazy, ukazujące na przykład manekina we flanelowej koszuli, ale z czasem przeszło do znacznie bardziej skomplikowanych koncepcji, takich jak rzodkiewka spacerująca z psem, delfin orbitujący wokół Saturna bądź astronauta jadący na koniu. 

Drugą, nie mniej imponująca opcją oferowaną przez DALL-E2 jest nanoszenie własnych elementów na istniejące już obrazy. W tym przypadku idealnym przykładem jest gumowy flaming, którego można dodawać nowe bądź usuwać z obrazu ukazującego basen. 

Aby nadawać efektowi końcowemu realizmu, narzędzie dopasowuje też cienie do obiektów, które zniknęły z oryginalnych dzieł lub zostały do nich dodane. DALL-E 2 bazuje na komputerowym systemie rozpoznawania obrazów zwanym CLIP. Oprogramowanie to zostało opracowane przez OpenAI i zaprezentowane w 2021 roku. 

​​​​​​W poprzedniej wersji narzędzie wykorzystywało proste podejście, za sprawą którego obrazy były kompresowane i zamieniane na słowa, a oprogramowanie zostało przeszkolone tak, by przewidywało, jak odwracać ten proces samodzielnie. Realizm powstających w ten sposób dzieł był stosunkowo niski. DALL-E2 patrzy na sprawę w znacznie bardziej ludzki sposób. 

Narzędzie nie zostanie udostępnione do publicznego użytku. Ma jednak trafić do innych naukowców, którzy chcieliby wykorzystać je w swoich badaniach. Jest też zabezpieczone tak, by nie mogło generować pewnych treści, na przykład ukazujących przemoc lub treści dla dorosłych. Poza tym ograniczone będą jego możliwości w zakresie odtwarzania faktycznie istniejących twarzy.