Компания Boston Dynamics представила новый уровень развития человекоподобных роботов на примере модели Atlas. Робот теперь способен не только передвигаться, но и выполнять длительные и сложные манипуляции с объектами под управлением обучаемых больших поведенческих моделей (LBMs), созданных совместно с Toyota Research Institute (TRI).
Обучение моделей ведётся на основе данных с реального Atlas и компьютерных симуляций. Нейросети способны понимать текстовые команды, позволяя роботу самостоятельно определять оптимальный порядок действий для выполнения задач.
Главный подход заключается в использовании единой нейросети, которая обрабатывает данные операторов, управляющих Atlas через VR-гарнитуры в реальном времени, и синтетические данные из симуляций. Благодаря этому робот может выполнять комплекс действий по общему алгоритму, реагируя на ошибки и непредвиденные ситуации.
Процесс разработки проходит четыре этапа: ручное управление Atlas и сбор данных, аннотирование информации для обучения нейросети, самообучение и тестирование результатов.
Система позволяет осваивать задачи разной сложности — от работы пальцами и с небольшими объектами до переноски тяжёлых деталей и взаимодействия с окружением. Новые варианты поведения можно запускать без перепрошивки, достаточно обновить модели.
Демонстрации показали, что Atlas координирует движения, собирает и перемещает детали, исправляет ошибки при падении предметов. Модель с 450 миллионами параметров учитывает текстовые команды и данные сенсоров положения и усилий конечностей. Совместная работа с тестовым стендом Atlas MTS позволяет обучать нейросети одновременно на реальных и синтетических данных.
По словам разработчиков, новая система ускоряет выполнение ряда задач в 1,5–2 раза, без потери надежности. Это приближает возможности совместной работы человека и робота и открывает перспективу массового применения гуманоидов в быту, промышленности и сервисной сфере. Проект получил престижную отраслевую награду RBR50 Robotics Innovation Award 2024.
Главная инновация заключается в том, что большие поведенческие модели позволяют быстро расширять спектр задач и добавлять новые навыки, делая роботов универсальными.