Google Gemini ma nowe możliwości. Daj mu kilka grafik i czekaj na efekt

Sztuczna inteligencja Google Gemini zyskała nową umiejętność przy generowaniu grafik. Niektórzy użytkownicy już mogą ją przetestować w swoich aplikacjach.
Google Gemini

Źródło: Solen Feyissa / Unsplash

Nowość związana jest z generowaniem grafik przez AI Google Gemini. Warto wspomnieć, że podobną funkcję ma już ChatGPT, więc tym samym asystent Google dogonił poważnego konkurenta… no prawie, bo użytkownicy, którzy mają dostęp do tej funkcji, nie są szczególnie zadowoleni z jej działania.

Gemini przyjmie kilka grafik w jednym zapytaniu

Nowa funkcja AI pozwala generować grafiki na podstawie kilku zdjęć, podanych przez użytkownika. Na razie dostępna jest dla wąskiego grona użytkowników płatnej wersji aplikacji Google Gemini Advanced. Można ją znaleźć tylko w przeglądarce, jeszcze nie trafiła do apki mobilnej.

Czytaj też: Konkurencja dla ChatGPT i Gemini? Nowa aplikacja Meta AI już dostępna

Przykład działania nowej funkcji został pokazany przez użytkownika Reddita. Poprosił on o umieszczenie trzech postaci, znanych w kulturze popularnej, w tym samym barze. Oto efekt:

google gemini generowanie grafik
Źródło: Gaiden206 / Reddit

Za wygenerowanie powyższego obrazu odpowiada model Gemini Flash 2.0. To model najszybszy i najbardziej wszechstronny z dostępnych w aplikacji Google Gemini. Model ten współpracuje z Imagen 3. W komentarzach na Reddicie widać mieszane opinie na temat jakości generowanych obrazów. Nie wszyscy są z nich zadowoleni. Wadą są też proporcje – Imagen 3 umożliwia tworzenie jedynie grafik kwadratowych.

Nowość jest wprowadzana stopniowo, jak to często bywa w przypadku funkcji rozwojowych w aplikacjach Google. Można jednak bezpiecznie założyć, że jej dostępność dla wszystkich to tylko kwestia czasu. Nie wiemy jeszcze, czy trafi także na darmowe konta Google, jak długo będzie zarezerwowana tylko dla użytkowników płatnego Gemini Advanced. Wiemy za to, że z czasem trafi także do aplikacji mobilnej Google Gemini. W kodzie aplikacji już znalazły się wzmianki o tym.

Warto dodać, że w ostatnim tygodniu kwietnia Google wprowadził do aplikacji przeglądarkowej i aplikacji mobilnej możliwość łatwej modyfikacji grafik – zarówno tych wysłanych do AI przez użytkownika, jak i wygenerowanych wcześniej. Można między innymi zmienić tło, dodać i usunąć elementy i wykonać tym podobne operacje. Ta funkcja również jest wprowadzana stopniowo w 45 krajach. Google zaprezentował przykładowe zastosowanie: AI została poproszona o dodanie kwiatów na stół, a następnie zmianę ich koloru:

W innym przykładzie przepis został połączony z ilustracjami, a więc na grafikach zostały pokazane kolejne etapy przygotowywania potrawy. Google zapewnia, że Gemini Flash 2.0 łączy tu zrozumienie świata z umiejętnością generowania obrazów, by nie dawać użytkownikowi totalnych bzdur. To górnolotna obietnica – zobaczymy, czy oprogramowanie stanie na wysokości zadania.

Czytaj też: Google włączył myślenie. Nowy model Gemini 2.5 Flash robi to szybko i tanio

Jeśli chcesz skorzystać z AI go analizy i generowanie grafik, na razie ChatGPT wciąż prowadzi. Choćby dlatego, że generowanie obrazków z pomocą kilku plików graficznych jest dostępna w wersji darmowej. Niemniej Google Gemini nadrabia zaległości. Na tym przykładzie widać, że asystenty AI mają coraz więcej możliwości… i wciąż nie zastąpią człowieka w pełni.