Wystarczy opis, a sztuczna inteligencja namaluje obraz. Niezwykłe narzędzie w akcji

Względem poprzedniej wersji ta najnowsza generuje swoje dzieła w wyższej rozdzielczości. Efekty jej działania są naprawdę imponujące, ponieważ SI nie tylko tworzy obrazy, ale również dodaje nowe elementy do tych istniejących i umożliwia spojrzenie na nie z nowej perspektywy.

Pierwowzór został wydany na początku ubiegłego roku, a jego nazwa miała stanowić hołd dla słynnego malarza, Salvadora Dali oraz nawiązanie do animacji WALL-E. Początkowo narzędzie tworzyło proste obrazy, ukazujące na przykład manekina we flanelowej koszuli, ale z czasem przeszło do znacznie bardziej skomplikowanych koncepcji, takich jak rzodkiewka spacerująca z psem, delfin orbitujący wokół Saturna bądź astronauta jadący na koniu.

Our newest system DALLE 2 can create realistic images and art from a description in natural language. See it here: https://t.co/Kmjko82YO5 pic.twitter.com/QEh9kWUE8A

— OpenAI (@OpenAI) April 6, 2022

Drugą, nie mniej imponująca opcją oferowaną przez DALL-E2 jest nanoszenie własnych elementów na istniejące już obrazy. W tym przypadku idealnym przykładem jest gumowy flaming, którego można dodawać nowe bądź usuwać z obrazu ukazującego basen.

Aby nadawać efektowi końcowemu realizmu, narzędzie dopasowuje też cienie do obiektów, które zniknęły z oryginalnych dzieł lub zostały do nich dodane. DALL-E 2 bazuje na komputerowym systemie rozpoznawania obrazów zwanym CLIP. Oprogramowanie to zostało opracowane przez OpenAI i zaprezentowane w 2021 roku.

oprzedniej wersji narzędzie wykorzystywało proste podejście, za sprawą którego obrazy były kompresowane i zamieniane na słowa, a oprogramowanie zostało przeszkolone tak, by przewidywało, jak odwracać ten proces samodzielnie. Realizm powstających w ten sposób dzieł był stosunkowo niski. DALL-E2 patrzy na sprawę w znacznie bardziej ludzki sposób.

Narzędzie nie zostanie udostępnione do publicznego użytku. Ma jednak trafić do innych naukowców, którzy chcieliby wykorzystać je w swoich badaniach. Jest też zabezpieczone tak, by nie mogło generować pewnych treści, na przykład ukazujących przemoc lub treści dla dorosłych. Poza tym ograniczone będą jego możliwości w zakresie odtwarzania faktycznie istniejących twarzy.