
Symulacja zwycięża ludzką kontrolę — sekret systemu DoorMan
Podstawą projektu jest robot Unitree G1, który dzięki przystępnej cenie, stał się popularną platformą testową w wielu ośrodkach badawczych. NVIDIA wykorzystała go do pokazania możliwości swojego oprogramowania DoorMan, które nie tylko pozwala robotowi otworzyć drzwi, ale czyni go w tej czynności sprawniejszym od człowieka. System osiągnął o 31% lepszy czas i wyższy wskaźnik powodzenia (83%) niż doświadczeni operatorzy sterujący zdalnie (80%). Niedoświadczone osoby radziły sobie znacznie gorzej, z sukcesem na poziomie 60% prób.
Czytaj też: Ratunek dla Wielkiej Rafy. Australia testuje robotyczny system do precyzyjnego sadzenia koralowców
Zadanie, określane jako „loco-manipulation”, wymaga od robota jednoczesnego utrzymania równowagi podczas chodzenia, precyzyjnego chwycenia klamki i zastosowania odpowiedniej siły do pociągnięcia drzwi. Człowiek robi to nieświadomie, ale dla maszyny każdy z tych elementów jest osobnym, skomplikowanym problemem do rozwiązania. Testy pokazały, że ludzie, nawet doświadczeni, często mieli kłopot z wyczuciem oporu drzwi przez interfejs wirtualnej rzeczywistości, co prowadziło do utraty równowagi lub nieudanej manipulacji.

Najbardziej obiecującym aspektem całego przedsięwzięcia jest sposób trenowania systemu. DoorMan został w pełni wytrenowany w symulacji NVIDIA Isaac Lab, a następnie przeniesiony na fizycznego robota bez żadnych dodatkowych poprawek czy dostrajania w realnym świecie. Takie podejście, zwane zero-shot transfer, jest uważane za bardzo pożądane w robotyce, ponieważ znacząco obniża koszty i czas wdrożenia.
Czytaj też: Od niezdarnego chodu do biegu w zaledwie półtora roku. Robot Optimus od Tesli zwinny jak człowiek
Robot opiera się wyłącznie na obrazie z konwencjonalnych kamer RGB, bez użycia czujników głębi czy systemów motion-capture. Musiał więc nauczyć się interpretować świat w sposób podobny do ludzkiego wzroku. Aby tego dokonać, inżynierowie musieli rozwiązać dwa kluczowe problemy. Pierwszy dotyczył efektywnego trenowania długiej sekwencji działań. Zastosowali mechanizm staged-reset, który zapamiętywał momenty częściowego sukcesu (np. poprawne chwycenie klamki), pozwalając treningom rozpoczynać się od tego punktu zamiast od zera.

Drugi problem był bardziej subtelny: klamka często znikała z pola widzenia robota podczas manipulacji. Rozwiązano to za pomocą metody Group Relative Policy Optimization, która „zachęcała” algorytm do przyjmowania takich pozycji ciała i ruchów, które utrzymywały kluczowy element w kadrze. Robot nauczył się więc nie tylko mechaniki otwierania, ale też poprawnej obserwacji.
Sukces DoorMana opiera się na różnorodności danych symulacyjnych
Sekretem dobrej adaptacji do realnego świata okazała się niezwykła różnorodność wirtualnego treningu. Zamiast uczyć robota na jednym modelu drzwi, wygenerowano miliony różnych wariantów. Wirtualne drzwi różniły się sztywnością i tłumieniem zawiasów, geometrią, rozmiarem, masą oraz kształtem klamki. Taka gigantyczna skala danych pozwoliła systemowi wypracować uniwersalny, adaptacyjny styl interakcji. Dla robota każda nowa klamka nie była zupełną niewiadomą – miał za sobą doświadczenie z milionami podobnych, choć nieidentycznych obiektów. To zasadnicza różnica w porównaniu z człowiekiem, który w wirtualnym interfejsie musiał niemal zgadywać, jak mocno pociągnąć.
Czytaj też: Chińska ofensywa. RobotEra zbiera 140 milionów dolarów, by zbudować armię humanoidów do pracy w fabrykach
Podejście NVIDIA reprezentuje szerszy trend w robotyce, gdzie ciężar prac rozwojowych przenosi się z kosztownych i czasochłonnych demonstracji w fizycznym świecie na masowy trening w symulacjach. Skalowalność tej metody jest jej główną zaletą.
Czy to już przełom?
DoorMan jest bez wątpienia imponującą demonstracją technologii, która pokazuje, jak daleko zaszło uczenie maszynowe w robotyce. Sukces w tak specyficznym, lecz niezwykle praktycznym zadaniu, daje do myślenia. Logika podpowiada, że jeśli tę samą metodologię da się zastosować do innych złożonych zadań manipulacyjnych, tempo rozwoju autonomicznych robotów może znacząco przyspieszyć. Warto jednak pamiętać, że otwieranie drzwi w kontrolowanych warunkach laboratorium to wciąż bardzo wąski wycinek rzeczywistości, z jaką musiałyby się mierzyć roboty w domach czy fabrykach. Mimo to, projekt NVIDIA pokazuje wyraźną ścieżkę, którą może podążać robotyka: od masowego uczenia w wirtualnych światach do sprawnych działań w tym realnym.