Сегодня 15 июня 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

OpenAI объяснила борьбу с гремлинами в ответах ИИ — и позволила снять ограничения

OpenAI рассказала широкой аудитории о своей проблеме с гоблинами — к этому компанию подвиг материал на сайте Wired. Как выяснилось, разработчик систем искусственного интеллекта вынужден дополнительно инструктировать свои модели «никогда не говорить о гоблинах, гремлинах, енотах, троллях, ограх, голубях или других животных и существах», потому что эти модели в процессе обучения выработали такую «странную привычку».

 Источник изображения: Vikram Singh / unsplash.com

Источник изображения: Vikram Singh / unsplash.com

Компания обратила внимание на то, что ИИ стал подозрительно часто прибегать к метафорам с гоблинами и другими вымышленными существами с выходом модели GPT-5.1, особенно при подключении персонажа «Ботаник» (Nerdy). С каждым последующим выпуском модели проблема только усугублялась, пока не обнаружилось, что в процессе обучения с подкреплением эти причудливые метафоры сопровождались вознаграждением.

Вознаграждение производилось только при включении личности «Ботаника», но процесс обучения с подкреплением не гарантирует, что усвоенные механизмы поведения так и останутся привязанным к породившим их условиям. На последующих этапах этот стиль поведения может вознаграждаться и усиливаться и в других местах, особенно если эти результаты повторно используются в контролируемой тонкой настройке или в данных о предпочтениях, пояснил разработчик.

Упоминания гоблинов и гремлинов преимущественно исчезли марте, когда OpenAI отказалась от «Ботаника», но всплыли в сервисе программирования Codex с моделью GPT-5.5 — её обучение началось ещё до того, как компания обнаружила первопричину. Поэтому ей пришлось давать Codex дополнительные инструкции не упоминать мифологических существ. Впрочем, для тех, кому эта манера поведения нравится, OpenAI предложила код отмены этих инструкций.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
У Don't Nod большие проблемы — разработчики Life is Strange, Remember Me и Jusant оказались на грани банкротства 57 мин.
Nintendo проговорилась, чего ждать от ремейка легендарной The Legend of Zelda: Ocarina of Time 2 ч.
Спустя два года после релиза Capcom удалит микротранзакции из Dragon’s Dogma 2 и снизит цену игры 4 ч.
В Великобритании полицейского уличили в фальсификации доказательств преступлений с помощью ИИ 9 ч.
«Кто купит Xbox и Game Pass ради Gears?»: инсайдер рассекретил «безумный» бюджет Gears of War: E-Day 10 ч.
Anthropic проведёт переговоры с властями США для разблокировки ИИ-моделей Mythos 5 и Fable 5 10 ч.
Авторитетный инсайдер подтвердил, когда выйдет God of War Laufey 11 ч.
В Steam завирусились виртуальные прятки Meccha Chameleon, где можно буквально слиться с окружением 11 ч.
Журналисты раскрыли подробности неанонсированного кооперативного ролевого боевика по «Ведьмаку» 11 ч.
Власти США заподозрили Китай в несанкционированном доступе к модели Mythos компании Anthropic 15 ч.
Китайские вузы закрыли более 12 000 «устаревших» специальностей, заменив их профессиями в сферах ИИ и робототехники 7 мин.
Midea запустила акцию «Сорви летний куш» с розыгрышем поездки в Китай и других призов 53 мин.
Nvidia тоже залезет в долги ради финансирования ИИ — Хуанг готовит облигации на $20 млрд 2 ч.
SpaceX с помощью IPO привлекла $85,7 млрд — сумма выросла на 14 % за счёт «зелёного башмака» 3 ч.
Ирано-американская мирная сделка запустила рост акций Samsung, SK hynix и других IT-компаний из Азии 4 ч.
МТС вложит 1 млрд рублей в модернизацию ядра сети ШПД и установку маршрутизаторов собственной разработки 4 ч.
Индийские клиенты Google Cloud уже неделю мирятся со сбоями сети из-за пожара в ЦОД в Дели 4 ч.
MSI оценила портативную приставку Claw 8 EX AI+ на чипе Arc G3 Extreme в $1799 4 ч.
Google Chromebook исполнилось 15 лет — массовыми хромбуки не стали, но завоевали популярность в образовании 5 ч.
Samsung в следующем году запустит производство 4-нм чипов для мозговых имплантов Neuralink 5 ч.