Gemini z kolejnym ulepszeniem – Ty nucisz, AI rozpoznaje piosenkę

Chyba każdy (i to nie raz) miał taką sytuację, że usłyszał jakąś piosenkę, a potem odtwarzał ją w głowie, nie znając tytułu. Ratunkiem w takich sytuacjach są różne aplikacje, takie jak Shazam. Ale po co nam kolejna apka, skoro można dołożyć taką funkcję do czegoś, co już jamy na swoim smartfonie? Google wyszedł właśnie z takiego założenia, integrując tę zdolność bezpośrednio z Gemini. Wystarczy, że zanucimy, zagwiżdżemy lub zaśpiewamy fragment piosenki, a AI pomoże nam ją zidentyfikować.
Gemini Live

Źródło: Google

Google nie ustaje w ulepszaniu Gemini

Funkcjonalność, którą jako pierwsi zauważyli redaktorzy 9to5Google, jest wdrażana w wersji Gemini na Androida. Chociaż Gemini już wcześniej potrafiło rozpoznawać utwory odtwarzane w tle (bazując na istniejących możliwościach Androida, znanych z Google Assistant), nowa opcja pozwala na bardziej intuicyjną interakcję. Wystarczy zapytać AI „Co to za piosenka?”, a pojawi się interfejs, który zachęci Cię do „zagrania, zaśpiewania lub zanucenia piosenki”. Nie ma się co martwić, nawet jeśli nie jesteśmy w tym mistrzami, sztuczna inteligencja powinna sobie z tym poradzić, a przynajmniej podsunąć jakiś kierunek poszukiwań.

Czytaj też: Google prezentuje kolejny model z rodziny Gemini 2.5

To rozwinięcie funkcji „zanuć, by wyszukać”, którą Google wprowadził już w październiku 2020 roku, co sugeruje, że algorytm został dopracowany i zintegrowany z nową generacją AI. Odkrywanie muzyki to w końcu jedno z prostszych zadań dla sztucznej inteligencji. Warto też wspomnieć, że w zeszłym roku gigant dodał rozpoznawanie piosenek także do Circle to Search, więc sztuczna inteligencja firmy jest już obeznana w identyfikowaniu utworów.

Czytaj też: Rewolucja w płatnościach zbliżeniowych. Nowy standard NFC czterokrotnie zwiększa zasięg i wygodę

Na nuconych melodiach Google nie poprzestaje. W tym tygodniu, do użytkowników Gemini na Androidzie i iPhone’ach trafia kolejna przydatna funkcja: możliwość przesyłania klipów wideo do promptów AI. Wyobraźmy sobie, że jesteś na koncercie lub na wycieczce, słuchając, jak ktoś gra na miejskim rynku i nagrywamy filmik, ale nie rozpoznajemy utworu. Teraz możemy przesłać ten klip do Gemini i poprosić AI o identyfikację muzyki grającej w tle. Jeśli Gemini potrafi rozpoznać muzykę z nuconych melodii czy Circle to Search, to analiza wideo również powinna działać bez zarzutu.

Czytaj też: Reklamy na WhatsAppie jeszcze nie dla nas. W UE nie pojawią się tak szybko

Warto jednak pamiętać, że funkcja przesyłania wideo nie jest wyłącznie dedykowana odkrywaniu muzyki i z pewnością okaże się nieoceniona w wielu scenariuszach, gdy klip wideo lepiej pomoże AI zrozumieć kontekst zapytania niż sam tekst. Ta nowość jest dostępna zarówno dla darmowych, jak i premium użytkowników Gemini, co dodatkowo zwiększa wszechstronność asystenta AI.