Google nie ustaje w ulepszaniu Gemini
Funkcjonalność, którą jako pierwsi zauważyli redaktorzy 9to5Google, jest wdrażana w wersji Gemini na Androida. Chociaż Gemini już wcześniej potrafiło rozpoznawać utwory odtwarzane w tle (bazując na istniejących możliwościach Androida, znanych z Google Assistant), nowa opcja pozwala na bardziej intuicyjną interakcję. Wystarczy zapytać AI „Co to za piosenka?”, a pojawi się interfejs, który zachęci Cię do „zagrania, zaśpiewania lub zanucenia piosenki”. Nie ma się co martwić, nawet jeśli nie jesteśmy w tym mistrzami, sztuczna inteligencja powinna sobie z tym poradzić, a przynajmniej podsunąć jakiś kierunek poszukiwań.
Czytaj też: Google prezentuje kolejny model z rodziny Gemini 2.5
To rozwinięcie funkcji „zanuć, by wyszukać”, którą Google wprowadził już w październiku 2020 roku, co sugeruje, że algorytm został dopracowany i zintegrowany z nową generacją AI. Odkrywanie muzyki to w końcu jedno z prostszych zadań dla sztucznej inteligencji. Warto też wspomnieć, że w zeszłym roku gigant dodał rozpoznawanie piosenek także do Circle to Search, więc sztuczna inteligencja firmy jest już obeznana w identyfikowaniu utworów.
Czytaj też: Rewolucja w płatnościach zbliżeniowych. Nowy standard NFC czterokrotnie zwiększa zasięg i wygodę
Na nuconych melodiach Google nie poprzestaje. W tym tygodniu, do użytkowników Gemini na Androidzie i iPhone’ach trafia kolejna przydatna funkcja: możliwość przesyłania klipów wideo do promptów AI. Wyobraźmy sobie, że jesteś na koncercie lub na wycieczce, słuchając, jak ktoś gra na miejskim rynku i nagrywamy filmik, ale nie rozpoznajemy utworu. Teraz możemy przesłać ten klip do Gemini i poprosić AI o identyfikację muzyki grającej w tle. Jeśli Gemini potrafi rozpoznać muzykę z nuconych melodii czy Circle to Search, to analiza wideo również powinna działać bez zarzutu.
Czytaj też: Reklamy na WhatsAppie jeszcze nie dla nas. W UE nie pojawią się tak szybko
Warto jednak pamiętać, że funkcja przesyłania wideo nie jest wyłącznie dedykowana odkrywaniu muzyki i z pewnością okaże się nieoceniona w wielu scenariuszach, gdy klip wideo lepiej pomoże AI zrozumieć kontekst zapytania niż sam tekst. Ta nowość jest dostępna zarówno dla darmowych, jak i premium użytkowników Gemini, co dodatkowo zwiększa wszechstronność asystenta AI.