Сегодня 02 апреля 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Hardware

Учёные MIT подсмотрели у больших языковых моделей ИИ эффективный метод обучения роботов

Исследователи из Массачусетского технологического института (MIT) разработали собственный метод обучения роботов новым навыкам. Вместо стандартного набора сфокусированных данных, которые обычно используются при обучении роботов, они задействовали большие массивы данных, тем самым имитируя процесс обучения больших языковых моделей (LLM).

 Источник изображения: MIT

Источник изображения: MIT

По мнению исследователей из MIT, имитационное обучение, когда робот учится на действиях человека, выполняющего ту или иную задачу, может оказаться неэффективным при несущественном изменение окружающей обстановки. К примеру, у робота могут возникнуть трудности после обучения, если он попадёт в обстановку с другим освещением или предметами.

В своей работе исследователи задействовали разные LLM, такие как GPT-4, чтобы повысить качество обучения методом перебора данных. «В области языковых моделей все данные — это просто предложения. В робототехнике, учитывая всю неоднородность данных, если вы хотите проводить предварительное обучение аналогичным образом, то потребуется другая архитектура», — рассказал один из авторов исследования Лируй Ванг (Lirui Wang).

Исследователи разработали новую архитектуру под названием Heterogeneous Pretrained Transformers (HPT), которая объединяет информацию, получаемую от разных датчиков и из разных сред. Собираемые таким образом данные объединяются в обучаемые модели с помощью «трансформера». Конечному пользователю нужно лишь указать дизайн робота, его конфигурацию и навык, которому он должен обучиться.

«Мы мечтаем о создании универсального мозга робота, который можно было бы загрузить и использовать в своём роботе без какого-либо обучения. Пока мы находимся на ранних стадиях, но мы собираемся продолжать упорно работать и надеемся, что масштабирование приведёт к прорыву в робототехнике, как это было с большими языковыми моделями», — рассказал один из авторов исследования Дэвид Хелд (David Held).

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Статистика Steam за март: Linux обогнала macOS, популярность RTX 5070 вернулся к реальности, а AMD отобрала ещё чуть-чуть доли Intel 17 мин.
Cloudflare представила CMS EmDash — «духовного преемника» WordPress 25 мин.
«Яндекс» добавил в определитель номера блокировку всех неизвестных номеров 53 мин.
Apple объявила об отключении всех платежей в России 55 мин.
Россияне озаботились альтернативными способами пополнения Apple ID 59 мин.
Fujitsu сократит 10 % сотрудников британского подразделения, чтобы хоть как-то справиться с многолетним скандалом с Почтой Великобритании 2 ч.
Google начнёт принудительный перевод Wear OS на 64-битные приложения 3 ч.
Стартап Kagi представил «Малый веб» — рукотворный каталог сайтов, созданных людьми, а не ИИ 4 ч.
Meta предупредила о поддельном приложении WhatsApp от разработчика шпионского ПО 4 ч.
Google вдвое увеличила объём облачного хранилища, но не для всех 5 ч.
В России хотят «зачистить» рынок связи от небольших операторов — это может спровоцировать рост цен 2 ч.
Иран нанёс новый удар по облачному ЦОД AWS в Бахрейне 3 ч.
Американцы создали память, способную работать при 700 °C — для Венеры, реакторов и ИИ 3 ч.
Gigabyte анонсировала плату X870E Aero X3D Dark Wood с отделкой под тёмное дерево 3 ч.
Удобно устроились: долгосрочные контракты позволят Samsung и SK hynix расширять производство памяти на деньги клиентов 3 ч.
Ближневосточная война грозит дефицитом ещё одного важного вещества для производства чипов 4 ч.
Крупная российская точка обмена трафиком повысит цены — зарубежный трафик резко вырос 5 ч.
Oracle готовит многотысячные сокращения персонала, чтобы высвободить средства на новые ИИ ЦОД 6 ч.
Китайские ИИ-ускорители заняли почти половину местного рынка на фоне снижения доли NVIDIA 6 ч.
QNAP выпустила управляемый коммутатор QSW-M7230-2X4F24T с портами 100GbE QSFP28 6 ч.