Новости Software

Алгоритм OpenAI позволяет обучить робота действию за одну демонстрацию

Некоммерческая исследовательская организация OpenAI, финансируемая Элоном Маском (Elon Musk), объявила о новом достижении в сфере развития роботов. Она создала алгоритм, который позволяет человеку обучать искусственный интеллект действиям, выполняя их в виртуальной реальности. Здесь используется метод одноразового имитационного обучения, который позволяет роботу повторять физическое действие, используя один-единственный пример.

OpenAI попыталась научить роботизированную руку складывать набор разноцветных кубиков. Человек в VR-шлеме проделывал необходимые действия в виртуальном окружении. После этого их изучала нейронная сеть, натренированная на основе сотен тысяч искусственно созданных изображений.

Поскольку сбор реальных изображений — дорого, трудно и долго, исследователи использовали искусственные картинки. OpenAI «скормила» алгоритму виртуальные образы стола и кубиков с различными фонами, эффектами освещения и текстурами. Так искусственный интеллект понимал сцену, не видев её раньше.

После этого алгоритм брал информацию из нейронной сети и отправлял её в другую, имитационную сеть. Она определяет намерения действия и повторяет его, предсказывая то, что сделал бы человек в данной ситуации. Сложность заключается в том, что расположение и цвет кубиков менялись каждый раз. Но программному обеспечению всё равно удавалось построить три столбика — каждый из двух кубов.

Роботу ни разу не показали видео или фото с реальными примерами действий. «Наш робот научился выполнять задачу, несмотря на то, что движения должны отличаться от показанных в демонстрации, — объяснил Джош Тобин (Josh Tobin), член команды OpenAI. — С помощью одной демонстрации задачи мы можем воспроизвести её в целом ряде различных начальных условий. Чтобы обучить робота, как построить другую последовательность блоков, нужна только одна дополнительная демонстрация».

Долгосрочная цель исследователей — дать искусственному интеллекту возможность быстро учиться новым действиям и адаптироваться к непредсказуемым изменениям в окружении. «Младенцы рождаются со способностью подражать тому, что делают другие люди, — говорит Тобин. — Подражание позволяет людям быстро обучаться новым действиям. Мы бы хотели, чтобы так могли обучаться и наши роботы».

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме
Прежде чем оставить комментарий, пожалуйста, ознакомьтесь с правилами комментирования. Оставляя комментарий, вы подтверждаете ваше согласие с данными правилами и осознаете возможную ответственность за их нарушение.
Все комментарии премодерируются.
Комментарии загружаются...
window-new
Soft
Hard
Тренды 🔥
Главное — не замёрзнуть: трейлер к скорому запуску пошаговой тактики 1971 Project Helios 15 мин.
Нашумевшая игра: PlayStation 4 Pro с запущенной The Last of Us Part II «ревёт громче кондиционера» 2 ч.
Google обвинили в незаконном сборе конфиденциальных данных пользователей 3 ч.
Всесильный бан: читеры из «беты» Valorant узнали, что не могут играть в шутер и после релиза 3 ч.
Голосовой ассистент «Маруся» научился управлять «умным» домом и развлекать детей 3 ч.
Пользователям «ВКонтакте» стали доступны групповые голосовые и видеозвонки прямо на сайте 3 ч.
Видео: состоялся запуск платформера Skelattack о весёлых приключениях скелета 4 ч.
Humble Bundle создаст фонд в размере $1 миллиона для поддержки чернокожих разработчиков 4 ч.
Разработчик ремейка Trackmania Nations назвал подписную модель распространения лучше ежегодных сиквелов 4 ч.
WANdisco обеспечит миграцию данных в Azure в петабайтном масштабе 4 ч.