Cicha konwersacja z Gemini Live? Google wprowadza napisy na żywo i otwiera nowe możliwości

Google nieustannie rozwija możliwości Gemini, swojego asystenta AI, chcąc, by stał się on nieodłączną częścią naszego życia. Po niedawnym rozszerzeniu dostępności funkcji udostępniania kamery i ekranu w aplikacji Gemini Live na Androida i iOS, gigant z Mountain View wprowadza kolejną, bardzo przydatną nowość: napisy generowane w czasie rzeczywistym podczas sesji z konwersacyjnym modelem AI.
Cicha konwersacja z Gemini Live? Google wprowadza napisy na żywo i otwiera nowe możliwości

Gemini Live dostaje funkcję, którą powinien mieć od samego początku

W przeciwieństwie do standardowej wersji asystenta, Gemini Live jest modelem konwersacyjnym, nastawionym przede wszystkim na rozmowy. Możemy korzystać z niego do porządkowania myśli, przygotowywania się do egzaminu czy po prostu zabicia czasu, na przykład podczas długiej jazdy samochodem. Wersja Live, podobnie jak prawdziwy rozmówca, ma zapamiętywać nasze słowa i rozumieć ich kontekst, choć jak to zwykle z AI bywa, nie oczekujmy tego na poziomie ludzkim. 

Czytaj też: Pełnoprawny Photoshop na Androidzie w końcu dostępny. Rusza darmowa beta z funkcjami AI

Od czasu wprowadzenia latem 2024 roku Google stale ulepszał ten konwersacyjny model, dodając nie tylko funkcje, ale też wsparcie dla kolejnych języków. Jednak przy tych wszystkich usprawnieniach firma zapomniała o jednej bardzo ważnej i tak naprawdę dość podstawowej funkcjonalności – napisach na żywo. Gemini Live w obecnej wersji dostarcza transkrypcje rozmowy, jednak dopiero po opuszczeniu trybu mówienia. Musimy więc zakończyć ten etap rozmowy, by zobaczyć napisane odpowiedzi. 

Czytaj też: Microsoft udostępnia Bing Video Creator za darmo w mobilnej aplikacji

Ponadto, jeśli chodzi o samo rozpoczęcie rozmowy, nie da się z nią ruszyć, gdy głośność jest wyciszona lub zbyt niska. Bywają jednak sytuacje, gdy można krótko przemówić do telefonu, ale nie można odtwarzać dźwięku na głos (np. gdy nie mamy słuchawek). Właśnie dla takich sytuacji Google przygotował napisy na żywo. Funkcja ta została ostała zapowiedziana już na początku tego roku i jest teraz sukcesywnie wdrażana, choć, jak wynika z doniesień użytkowników Reddita, nie jest jeszcze szeroko dostępna. Nowy przycisk napisów na żywo jest widoczny w wersji 16.21.57 aplikacji Google.

Źródło: Reddit

W prawym górnym rogu pełnoekranowego interfejsu Gemini Live pojawił się nowy przycisk transkrypcji (z tą samą prostokątną ikoną, co w funkcji Napisy na żywo na Androidzie). Dotknięcie go spowoduje wyświetlenie półprzezroczystej nakładki z napisami na środku ekranu. Google dodało również opcje personalizacji, które pomogą użytkownikom zmieniać styl i rozmiar napisów. Dostęp do nich można uzyskać, przechodząc do ustawień Gemini i wybierając “Preferencje napisów”.

Czytaj też: Meta w końcu bierze się za aplikacje na iPada. Teraz przyszedł czas na Instagrama

To znaczące ułatwienie dla użytkowników, którzy chcą korzystać z Gemini Live w hałaśliwym otoczeniu lub po prostu preferują tekstową formę komunikacji. Nie wiemy jeszcze, kiedy dokładnie nowość trafi do wszystkich, ale skoro jest już udostępniana, może być to kwestią nadchodzących tygodni.