Компания Google презентовала инновационную модель Gemini Robotics-ER 1.6, которая радикально меняет принципы взаимодействия роботов с окружающим миром.
В основе разработки лежит концепция embodied reasoning (воплощенное рассуждение), позволяющая машинам не просто следовать шаблонам, а анализировать физическую среду, разбивать сложные задачи на этапы и самостоятельно проверять качество выполнения работы.
Новая версия значительно улучшила пространственное восприятие и научилась обрабатывать данные одновременно с нескольких камер, собирая ракурсы в единую картину. Это критически важно в реальных рабочих условиях, где обзор часто бывает ограничен. Модель точнее распознает объекты, умеет их считать и понимает связи между ними, что упрощает перемещение в загроможденных помещениях.
Одним из ключевых обновлений стала функция чтения приборов: благодаря совместной работе с Boston Dynamics, точность распознавания показаний манометров и дисплеев выросла с 23% до 93%.
Кроме того, Gemini Robotics-ER 1.6 стала самой безопасной системой в линейке Google — она лучше соблюдает ограничения при работе с потенциально опасными объектами.
Разработчики уже получили доступ к модели через Gemini API и Google AI Studio, что позволит создавать приложения, где робот должен не просто выполнять команды, но и полноценно осознавать происходящее вокруг.