Сегодня 28 ноября 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Hardware

Boston Dynamics рассказала, как человекоподобный робот Atlas «видит» окружающий мир

Большое количество задач, которые может выполнять человекоподобный робот на заводе, складе или дома, требует понимания геометрических и семантических свойств окружающих его предметов, таких как формы и контекст объектов взаимодействия. Инженеры компании Boston Dynamics поделились подробностями относительно того, как их робот Atlas «видит» мир благодаря гибкой и адаптивной системе восприятия.

 Источник изображений: Boston Dynamics

Источник изображений: Boston Dynamics

Даже простая на первый взгляд задача — подобрать деталь автомобиля и установить её в нужное место — разбивается на несколько этапов, выполнение каждого из которых требует обширных знаний об окружающем пространстве. Сначала Atlas обнаруживает и идентифицирует объект. Многие детали на заводе блестящие или же малоконтрастные и тёмные, поэтому камерам робота трудно их различать. Затем роботу нужно определить, где находится объект, чтобы схватить его. Нужный объект может лежать на столе, находиться в контейнере с ограниченным пространством и др. Когда Atlas определяется с выбором объекта, он решает, куда его установить и как его доставить в нужное место.

В конечном счёте Atlas должен с высокой точностью разместить объект в определённом месте и отклонение даже на пару сантиметров может привести к тому, что предмет, с которым взаимодействует робот, будет установлен неправильно или упадёт. Чтобы избежать этого Atlas должен быть способен вносить корректировки в свои действия, если что-то пойдёт не так. Например, если не удалось установить деталь и она упала на пол, робот может поднять её, используя систему на основе компьютерного зрения.

Выполнение таких задач требуют внедрения новых методов и влияют на всю систему восприятия Atlas, которая включает в себя качественно откалиброванные сенсоры, современные ИИ-алгоритмы с машинным обучением, систему оценки состояния и др. Восприятие начинается с того, что находится вокруг робота и есть ли на его пути какие-то препятствия. Для идентификации окружающих объектов инженеры Boston Dynamics задействовали систему обнаружения, которая предоставляет данные о предметах в виде идентификаторов, ограничительных рамок и точек интереса.

В процессе работы на автомобильном производстве Atlas обнаруживает стеллажи, на которых хранятся разные автомобильные детали. Стеллажи могут быть разной формы и размера, поэтому робот должен знать не только их тип, но и местоположение, чтобы избежать столкновений с ними. Наряду с обнаружением стеллажей робот идентифицирует их углы как точки интереса, за счёт чего окружающее пространство удаётся привести в соответствие с внутренней картой.

Ключевые точки представляют собой двумерные пиксельные точки двух типов: внешние (зелёные) и внутренние (красные). Внешние точки отражают объекты, которые следует огибать в процессе работы. Внутренние более разнообразны и многочисленны, они могут отражать распределение полок на стеллаже, расположение ящиков, а также позволяют точно локализовать отдельные объекты. Для классификации крупных объектов и прогнозирования расположения точек интереса Atlas использует облегчённую сетевую архитектуру, позволяющую достичь компромисса между производительностью и восприятием, что важно для обеспечения манёвренности робота.

Перед проведением манипуляций с объектами внутри подсвеченных точками пространств Atlas определяет своё местоположение, для чего задействуется модуль локализации объекта по ключевым точкам. Система оценивает положение объекта и его ориентацию по отношению к другим объектам, находящимся поблизости. Система локализации получает данные о внутренних и внешних точках интереса из конвейера обнаружения объектов и выравнивает их в соответствии с предварительной моделью их распределения в пространстве. В дополнение к этому задействована кинематическая одометрия для определения движений робота, чтобы свести воедино положение объектов и повысить надёжность прогнозирования расположения точек интереса.

Навыки Atlas в манипулировании предметами основаны на точности восприятия окружающего пространства в режиме онлайн. Система отслеживания положения SuperTracker объединяет разные потоки информации: кинематику робота, компьютерное зрение и др. Кинематическая информация, получаемая от энкодеров суставов Atlas, позволяет определить расположение захватов робота в пространстве. Объединение кинематических данных позволяет преодолевать ситуации, когда нужный объект скрыт или не находится в поле зрения камер.

Когда объект находится в поле зрения камер, Atlas задействует модель оценки положения объекта, которая использует рендеринг и сравнение для оценки положения по монокулярным изображениям. Модель обучена на большом массиве синтетических данных и обобщает данные с нулевого кадра для новых объектов с использованием CAD-модели. При инициализации с использованием 3D-изображения модель уточняет его вид, чтобы минимизировать расхождения между визуализированной CAD-моделью и изображением с камеры. В качестве альтернативы система оценки может работать на основе 2D-модели области интереса, например, маски объекта. После этого генерируется пакет гипотез, которые анализируются специальным алгоритмом для выбора оптимальной. Система оценки Atlas надёжно работает на сотнях заводских объектов, которые предварительно были смоделированы и текстурированы.

Система SuperTracker получает визуальные оценки позы робота в формате 3D. В сценариях с манипуляциями визуальные оценки позы могут быть неоднозначными, например, из-за неполной видимости или плохого освещения. Для проверки точности оценки в этих случаях используются специальные фильтры.

При выполнении точных манипуляций, включающих в себя несколько действий, важное значение имеет точная калибровка датчиков, системы компьютерного зрения и др. Инженеры отмечают, что точная калибровка является ключевым фактором, который позволяет обеспечить высокопроизводительное манипулирование и автономность на основе восприятия окружающего пространства.

В дальнейшем Boston Dynamics планирует повышать точность действий и адаптивность Atlas. Команда сосредоточена на продвижении к созданию единой базовой модели для Atlas. Разработчики намерены выйти за рамки достигнутого, когда восприятие и действие не являются отдельными процессами.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Steam наконец стал 64-битным — 32-битному клиенту осталось чуть больше месяца 2 ч.
Airbus уже семь лет переезжает с Microsoft Office на Google Workspace, но полностью отказаться от Excel и Word всё не получается 6 ч.
Трассировка лучей на ПК, «Новая игра +» и прокачка «Легенды»: для Dying Light: The Beast вышло самое крупное обновление с релиза 6 ч.
Лучше поздно, чем никогда: спустя почти десять лет Ubisoft наконец добавила достижения для Rainbow Six Siege в Steam 7 ч.
Спустя семь лет разработки Light No Fire до сих пор занимается «крошечная команда» — No Man's Sky остаётся приоритетом Hello Games 8 ч.
Слухи: датамайнеры нашли в файлах Assassin’s Creed Shadows название ремейка Assassin’s Creed IV: Black Flag 9 ч.
Премьера финального сезона «Очень странных дел» сломала Netflix 9 ч.
«Базис» идёт на IPO в декабре 10 ч.
Вот тебе, закупщик, и «Юрьев день» 11 ч.
OpenAI признала утечку данных пользователей через Mixpanel — переписки с ChatGPT остались в безопасности 11 ч.
Тайваньские следователи обыскали дома экс-вице-президента TSMC по делу о передаче секретов в Intel и забрали всю электронику 29 мин.
Как построить 5000-ваттный GPU будущего — Intel расскажет на ISSCC 2026 34 мин.
Новая статья: Обзор игрового WQHD IPS-монитора Gigabyte M27Q2 QD: доступный универсал 3 ч.
Сословное право доступа: из-за дефицита ИИ-серверов Alibaba Cloud вынужденно разделила клиентов на категории 3 ч.
В Китае намекнули на создание многочиповых ИИ-ускорителей, способных потягаться с Nvidia Blackwell 5 ч.
Honor представила компактный проектор с жестовым управлением и автокалибровкой за $85 5 ч.
«Руцентр» вошёл в реестр провайдеров хостинга для государственных информационных систем 6 ч.
После провала iPhone Air китайские бренды передумали выпускать сверхтонкие смартфоны 9 ч.
Ракета «Союз-2.1а» за три часа доставила двух россиян и американца на МКС 9 ч.
Foxconn вложит $569 млн в производство ИИ-оборудования и компонентов в Висконсине 9 ч.