Robot, który przewiduje przyszłość. NVIDIA wprowadza technologię Cosmos Policy

Robot, który, zanim chwyci szklankę z wodą, już “widzi” w swojej wyobraźni kilka najbliższych sekund i wie, co się stanie, jeśli przesunie dłoń o centymetr za daleko? To nie jest opis sceny z filmu o Terminatorze, ale rzeczywistość, którą serwuje nam NVIDIA na początku nowego roku.

Do tej pory roboty działały głównie reaktywnie – widziały obraz i natychmiast próbowały dopasować do niego zaprogramowany ruch. Teraz gigant z Krzemowej Doliny udostępnił technologię Cosmos Policy, która sprawia, że maszyny zaczynają myśleć strategicznie, łącząc postrzeganie świata z planowaniem przyszłych zdarzeń w ramach jednego, potężnego modelu AI. To fundamentalna zmiana, która może sprawić, że humanoidalni asystenci w końcu przestaną być niezdarni.

Koniec z układankami z modułów — jeden system, by wszystkimi rządzić

W tradycyjnej robotyce sterowanie maszyną przypominało budowanie z klocków, które nie zawsze do siebie pasowały. Trzeba było stworzyć osobny model do rozpoznawania obrazu, kolejny do planowania trasy ruchu i jeszcze jeden do samej kontroli silników. To sprawiało, że systemy były ociężałe i wymagały tysięcy godzin nagrań, by nauczyć się choćby najprostszej czynności w nowym otoczeniu. Oczywiście w ostatnich latach zaczęło się to zmieniać, a jedną z firm, która znacznie uprościła cały proces, jest NVIDIA. Zamiast budować wszystko od zera, inżynierowie wzięli na warsztat swój model Cosmos Predict – gigantyczną sieć, która nauczyła się fizyki świata, oglądając miliony godzin nagrań wideo.

Dzięki procesowi zwanemu „post-trainingiem”, ten model świata został wzbogacony o dane z konkretnych pokazów robotycznych. W efekcie powstało Cosmos Policy, czyli zintegrowany mózg, który traktuje akcje robota, jego stany fizyczne i przewidywane skutki jako jedną, spójną historię. Kiedy robot używa tej technologii, nie produkuje tylko następnego, natychmiastowego ruchu palcem. On generuje i ocenia kilka różnych scenariuszy działania naraz. Przewiduje ich wyniki, szacuje nagrodę (sukces zadania) i wybiera tę ścieżkę, która z największym prawdopodobieństwem doprowadzi go do celu w dłuższej perspektywie. Dzięki temu maszyna nie tylko reaguje na to, co widzi, ale aktywnie planuje, jak uniknąć porażki.

Czytaj też: Koniec ery sztywnych maszyn. Robot zyska nowe umiejętności dzięki aplikacji

Co to oznacza w praktyce? Wyniki testów są co najmniej obiecujące. Na standardowych benchmarkach manipulacji robotycznej Cosmos Policy osiągnęło bardzo wysokie wskaźniki sukcesu w zadaniach wieloetapowych, które wymagają długofalowego “rozumowania”. Co więcej, model ten potrzebuje znacznie mniej danych treningowych niż dotychczasowe metody. W świecie robotyki dane z prawdziwego świata są niesamowicie drogie i trudne do pozyskania, więc każda oszczędność na tym polu to milowy krok w stronę masowej produkcji inteligentnych maszyn. Co najważniejsze, technologia ta sprawdza się nie tylko w symulacjach, ale i w rzeczywistych testach z udziałem robotów o dwóch ramionach, które wykonują złożone zadania bazując wyłącznie na obrazie z kamer.

Czytaj też: Architektura oczami maszyny. Ai-Da projektuje swój pierwszy dom

NVIDIA pozycjonuje Cosmos Policy jako część szerszego ekosystemu, który ma stać się standardem dla całej branży. Zamiast pisać osobny kod dla każdego typu robota, producenci będą mogli korzystać z gotowej infrastruktury, która pozwala maszynom rozumieć i przewidywać fizyczny świat. Warto jednak zaznaczyć, że Cosmos Policy to fundament techniczny – kwestie bezpieczeństwa, etyki czy zgodności z przepisami nadal pozostają w gestii nadrzędnych systemów oraz regulatorów, którzy mają pełne ręce roboty przy certyfikowaniu autonomicznych pomocników.

Czytaj też: Armia robotów wychodzi z pudeł. LimX Dynamics pokazuje przyszłość logistyki

Jeśli ta technologia faktycznie się upowszechni, wkrótce będziemy świadkami wdrożenia humanoidów, które radzą sobie w naszych domach i fabrykach z naturalną zwinnością, omijając przeszkody jeszcze zanim realnie staną im one na drodze.

Robot, który przewiduje przyszłość. NVIDIA wprowadza technologię Cosmos Policy

Koniec z układankami z modułów — jeden system, by wszystkimi rządzić