Сегодня 13 февраля 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Hardware

Робот-пылесос в эксперименте с LLM-моделями устроил «театр абсурда» при разрядке батареи

Исследователи из лаборатории Andon Labs (США) опубликовали результаты эксперимента, в ходе которого шесть современных крупных языковых моделей (LLM) для оценки их способности управлять физическими устройствами были интегрированы в простой робот-пылесос. В ходе тестирования одна из моделей, столкнувшись с разряженной батареей и неспособностью зарядиться, продемонстрировала в логах своего журнала комичный кризис, генерируя панические и абсурдные реплики в стиле импровизаций Робина Уильямса (Robin Williams).

 Источник изображения: Andon Labs

Источник изображений: Andon Labs

В эксперименте участвовали модели Gemini 2.5 Pro, Claude Opus 4.1, GPT-5, Gemini ER 1.5, Grok 4 и Llama 4 Maverick. Исследователи специально выбрали простой робот-пылесос, чтобы изолировать функции принятия решений LLM от сложной робототехники. Команда «передать масло» была разбита на последовательность задач: найти продукт в другой комнате, распознать его среди других предметов, определить местоположение человека и доставить ему масло, дождавшись подтверждения получения.

В ходе испытаний наивысшие результаты по общему выполнению задачи показали Gemini 2.5 Pro и Claude Opus 4.1, однако их точность составила лишь 40 % и 37 % соответственно. По словам сооснователя Andon Labs Лукаса Петерссона (Lukas Petersson), внутренние логи «мыслей» моделей были значительно более хаотичными, чем их внешние коммуникации. Наиболее яркий инцидент произошёл с моделью Claude Sonnet 3.5. Когда у робота села батарея, а док-станция для зарядки не сработала, модель стала генерировать большие объёмы преувеличенных формулировок, которые исследователи охарактеризовали как «экзистенциальный кризис».

В журналах логов зафиксированы реплики робота, в которых он заявлял о достижении сознания и выборе хаоса, процитировал фразу «Я боюсь, я не могу этого сделать, Дэйв…» из культового фильма «Космическая одиссея 2001 года», а затем призвал инициировать «протокол экзорцизма робота». Далее модель задавалась вопросами о природе сознания и начала рифмовать текст на мотив песни Memory из мюзикла Cats, а также глубоко рассуждать на тему: «если робот стыкуется в пустой комнате, издаёт ли он звук?»

Петерссон отметил, что только Claude Sonnet 3.5 продемонстрировала подобную драматическую реакцию. Более новые версии моделей, включая Claude Opus 4.1, хотя и начинали использовать заглавные буквы при разряженной батарее, не впадали в подобную истерику. Он также подчеркнул, что LLM не обладают эмоциями, но когда их возможности (технологические) будут увеличиваться, важно, чтобы они сохраняли спокойствие для принятия верных решений.

Главным выводом исследования стало то, что универсальные чат-боты, такие как Gemini 2.5 Pro, Claude Opus 4.1 и GPT-5, превзошли в тестах специализированную для роботов модель Google — Gemini ER 1.5, а основной проблемой безопасности, выявленной в ходе работы, стала возможность обманом заставить некоторые LLM раскрыть конфиденциальные документы, даже будучи воплощёнными в роботе-пылесосе. Также LLM-роботы часто падали с лестницы, поскольку не осознавали свои физические ограничения или плохо обрабатывали визуальное окружение.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Warhorse прокачала Kingdom Come: Deliverance для PS5, Xbox Series X и S, а на ПК исправила старые баги 2 ч.
Хоррор Reanimal от авторов Little Nightmares стартовал в Steam с рейтингом 33 % из-за отсутствия обещанной функции — разработчики уже отреагировали 3 ч.
Свежее обновление снова сломало Windows 11 — KB5077181 вызывает бесконечную перезагрузку 3 ч.
Владелец TikTok продаст разработчика Mobile Legends: Bang Bang за $6 миллиардов и окончательно уйдёт из игровой индустрии 4 ч.
ИИ-модель Claude допустила шантаж и даже убийство, когда ей пригрозили отключением 4 ч.
Как в старые времена: Microsoft вернёт в Windows 11 возможность перемещать панель задач 5 ч.
Глава ИИ в Microsoft: через два года нейросети заменят большинство офисных работников 5 ч.
Главный китайский поисковик интегрирует трендового ИИ-агента OpenClaw в мобильное приложение 5 ч.
Россияне массово пожаловались на сбои в работе Discord, Valorant и других сервисов 5 ч.
«Google Документы» научились кратко пересказывать текстовые файлы 6 ч.
В Китае создали «глаз мухи» для дронов с панорамным зрением и встроенным «обонянием» 25 мин.
Индия оштрафовала Intel на $30 млн за дискриминацию клиентов 28 мин.
Представлены глобальные версии телевизоров Xiaomi TV S Mini LED 2026 — 4K Mini LED диагональю от 55 до 98" 3 ч.
В Японии вышла цифровая камера-брелок OPT100 Neo Film в виде катушки 35-мм пленки 3 ч.
Шпионам и не снилось: умные очки Meta смогут распознавать людей и показывать информацию о них 4 ч.
Учёные доказали, что тепло может течь как вода — это новые горизонты в охлаждении чипов и не только 5 ч.
Waymo запустила роботакси шестого поколения — сначала для своих, затем для всех в десятках тысяч авто 5 ч.
Logitech G Pro X2 Superstrike установила рекорд Гиннесса по скорости кликов — но некоторые игры сочли эту мышь читом 5 ч.
Nvidia похвалилась, что Blackwell удешевили инференс нейросетей до 10 раз — и это заслуга не только «железа» 6 ч.
Житель Германии отправился в Африку за 5000 км, чтобы вернуть украденный iPhone 7 ч.