Google włączył myślenie. Nowy model Gemini 2.5 Flash robi to szybko i tanio

Google udostępnił właśnie nowy model AI – Gemini 2.5 Flash. To kolejna iteracja modelu Gemini 2.0 Flash z poprawionymi możliwościami wyciągania wniosków, ale niezmiennie nastawiona na niski koszt pracy.
Google Gemini

Źródło: Google

Nowy model AI firmy Google to pierwszy program wnioskujący hybrydowo. Oznacza to, że korzystający z niego deweloperzy mogą włączać i wyłączać rozumowanie – proces „myślenia” – zależnie od potrzeb. Możliwe jest także ustalenie budżetu tokenów dla tego procesu. Dzięki temu można osiągnąć równowagę między czasem oczekiwania na odpowiedź, kosztem utrzymania aplikacji i trafnością odpowiedzi w docelowym kontekście.

„Myślący” model Gemini 2.5 Flash

Modele AI z serii Gemini 2.5 zaliczają się do modeli „myślących”. Oznacza to, że zanim wygenerują finalną odpowiedź, przetwarzają pytanie, rozkładają złożone zdania i planują strukturę odpowiedzi. To przydatne między innymi przy rozwiązywaniu wieloetapowych zadań matematycznych (na przykład gdy Gemini musi określić kolejność działań z treści zadania) i przeprowadzaniu analiz danych. Dzięki temu można uzyskać bardziej szczegółowe o wyczerpujące odpowiedzi. W tej dziedzinie lepszy będzie tylko model Gemini 2.5 Pro.

Czytaj też: Google wprowadza udostępnianie ekranu i kamery w Gemini Live na Androidzie dla wszystkich

Jednocześnie nowy model jest relatywnie mały i tani w utrzymaniu. Co ważne, model został wytrenowany tak, by po otrzymaniu pytania określał samodzielnie, jak długo musi nad nim „myśleć”. Ten krok pozwala zaoszczędzić zasoby przy prostych zapytaniach (na przykład „ile województw ma Polska”). Jeśli deweloperzy aplikacji ustalą maksymalny budżet na „myślenie” (zakres od 0 do 24576 tokenów), Gemini 2.5 Flash nie wykorzysta całości, jeśli nie jest to konieczne do dostarczenia odpowiedzi.

Google zapewnia, że Gemini 2.5 Flash będzie dorównywał szybkością Gemini 2.0 Flash, niezależnie od parametrów pracy. Gdy „myślenie” zostanie wyłączone (budżet tokenów: 0), będzie szybszy od poprzednika. Google twierdzi, że to najtańszy i najszybszy z dostępnych obecnie modeli Gemini. Przy tym nowy model ma dostarczać poprawne wyniki rozumowania w złożonych, wieloetapowych czynnościach.

Jak skorzystać z Gemini 2.5 Flash?

Gemini 2.5 Flash jest już dostępny dla wszystkich w aplikacji Gemini. By z niego skorzystać, trzeba wybrać odpowiedni model z menu w górnej części aplikacji. Model ten jest oznaczony jako eksperymentalny.

Ponadto Gemini 2.5 Flash jest dostępny dla zewnętrznych aplikacji przez Gemini API. Można z niego skorzystać w Google AI Studio oraz w Vertex AI. Jest już dostępny także między innymi w funkcji Canvas, gdzie może pomóc w poprawianiu kodu i dokumentów tekstowych.

Google zapowiedział już, że model Gemini 2.5 Flash będzie ulepszany „w locie”, a więc można założyć, że trenowanie go nie zostało jeszcze zakończone.