Сегодня 28 июня 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Hardware

Учёные MIT подсмотрели у больших языковых моделей ИИ эффективный метод обучения роботов

Исследователи из Массачусетского технологического института (MIT) разработали собственный метод обучения роботов новым навыкам. Вместо стандартного набора сфокусированных данных, которые обычно используются при обучении роботов, они задействовали большие массивы данных, тем самым имитируя процесс обучения больших языковых моделей (LLM).

 Источник изображения: MIT

Источник изображения: MIT

По мнению исследователей из MIT, имитационное обучение, когда робот учится на действиях человека, выполняющего ту или иную задачу, может оказаться неэффективным при несущественном изменение окружающей обстановки. К примеру, у робота могут возникнуть трудности после обучения, если он попадёт в обстановку с другим освещением или предметами.

В своей работе исследователи задействовали разные LLM, такие как GPT-4, чтобы повысить качество обучения методом перебора данных. «В области языковых моделей все данные — это просто предложения. В робототехнике, учитывая всю неоднородность данных, если вы хотите проводить предварительное обучение аналогичным образом, то потребуется другая архитектура», — рассказал один из авторов исследования Лируй Ванг (Lirui Wang).

Исследователи разработали новую архитектуру под названием Heterogeneous Pretrained Transformers (HPT), которая объединяет информацию, получаемую от разных датчиков и из разных сред. Собираемые таким образом данные объединяются в обучаемые модели с помощью «трансформера». Конечному пользователю нужно лишь указать дизайн робота, его конфигурацию и навык, которому он должен обучиться.

«Мы мечтаем о создании универсального мозга робота, который можно было бы загрузить и использовать в своём роботе без какого-либо обучения. Пока мы находимся на ранних стадиях, но мы собираемся продолжать упорно работать и надеемся, что масштабирование приведёт к прорыву в робототехнике, как это было с большими языковыми моделями», — рассказал один из авторов исследования Дэвид Хелд (David Held).

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Microsoft подтвердила скорый выход Windows 11 25H2 — установить обновление будет проще, чем 24H2 26 мин.
Использование ИИ превратилось из рекомендации в обязанность для менеджеров Microsoft 3 ч.
Долг Google по штрафам в России превысил 27 млрд рублей — и ещё 2,8 дуодециллиона рублей 3 ч.
Российские банки тестируют заменитель Apple Pay, но до массового внедрения ещё далеко 3 ч.
Роскомнадзор зарегистрировал почти 150 тысяч блогеров-десятитысячников 3 ч.
Facebook захотел покопаться в фотографиях на смартфонах пользователей — скорее всего, для обучения ИИ 5 ч.
В миллионах принтеров Brother обнаружены уязвимости безопасности — некоторые невозможно исправить 11 ч.
Runway готовит платформу для создания игр с помощью ИИ 11 ч.
ЕС пригрозил Meta ежедневными штрафами — бизнес-модель «плати или соглашайся» не прошла проверку 16 ч.
Новая статья: FBC: Firebreak — контроль потерян. Рецензия 17 ч.
Старый марсианский спутник NASA научился «стоять на голове» — это на порядок повысило чувствительность подповерхностного радара 29 мин.
Tesla впервые доехала до покупателя своим ходом без людей в салоне 10 ч.
Maxell выпустила кассетный ретро-плеер MXCP-P100 с поддержкой Bluetooth-наушников и USB-C 10 ч.
Intel отправила в отставку директора по стратегии 10 ч.
Мозговой имплант N1 компании Neuralink получили уже семь пациентов с опорно-двигательными проблемами 11 ч.
Xiaomi выпустила контроллер Redmi GamePad за $70 со стиками с эффектом Холла для мобильных устройств 11 ч.
Intel скоро «догонит» AMD по доле рынка серверных процессоров 17 ч.
Intel смогла снизить долю на рынке серверных процессоров до 62 %, но доля AMD всё равно меньше 18 ч.
Учёные заставили цифровой контроллер работать почти при абсолютном нуле — это прорыв для квантовых компьютеров 19 ч.
Над США взорвался пылающий метеорит массой более тонны — осколки пробили жилой дом 22 ч.