Сегодня 30 апреля 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

OpenAI объяснила борьбу с гремлинами в ответах ИИ — и позволила снять ограничения

OpenAI рассказала широкой аудитории о своей проблеме с гоблинами — к этому компанию подвиг материал на сайте Wired. Как выяснилось, разработчик систем искусственного интеллекта вынужден дополнительно инструктировать свои модели «никогда не говорить о гоблинах, гремлинах, енотах, троллях, ограх, голубях или других животных и существах», потому что эти модели в процессе обучения выработали такую «странную привычку».

 Источник изображения: Vikram Singh / unsplash.com

Источник изображения: Vikram Singh / unsplash.com

Компания обратила внимание на то, что ИИ стал подозрительно часто прибегать к метафорам с гоблинами и другими вымышленными существами с выходом модели GPT-5.1, особенно при подключении персонажа «Ботаник» (Nerdy). С каждым последующим выпуском модели проблема только усугублялась, пока не обнаружилось, что в процессе обучения с подкреплением эти причудливые метафоры сопровождались вознаграждением.

Вознаграждение производилось только при включении личности «Ботаника», но процесс обучения с подкреплением не гарантирует, что усвоенные механизмы поведения так и останутся привязанным к породившим их условиям. На последующих этапах этот стиль поведения может вознаграждаться и усиливаться и в других местах, особенно если эти результаты повторно используются в контролируемой тонкой настройке или в данных о предпочтениях, пояснил разработчик.

Упоминания гоблинов и гремлинов преимущественно исчезли марте, когда OpenAI отказалась от «Ботаника», но всплыли в сервисе программирования Codex с моделью GPT-5.5 — её обучение началось ещё до того, как компания обнаружила первопричину. Поэтому ей пришлось давать Codex дополнительные инструкции не упоминать мифологических существ. Впрочем, для тех, кому эта манера поведения нравится, OpenAI предложила код отмены этих инструкций.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
«Продолжаете удивлять, капитаны!»: пиратский хит Windrose достиг новой вершины продаж и получил патч с техническими улучшениями 31 мин.
Обновлённые Microsoft PowerToys научились управлять мониторами и улучшили работу с окнами 45 мин.
OpenAI объяснила борьбу с гремлинами в ответах ИИ — и позволила снять ограничения 2 ч.
Работник Warner Bros. Games проговорился, что следующей игрой создателей Mortal Kombat станет Injustice 3 2 ч.
«DLSS 5 у нас дома»: Roblox готовит Reality — фотореалистичную игровую платформу с ИИ-рендерингом 2 ч.
Heroes of Might & Magic: Olden Era вышла в раннем доступе Steam — фанаты ждали этого 11 лет 3 ч.
Провайдер Cloudflare назвал мессенджер Max шпионским и вредоносным — разработчики ответили 4 ч.
VK Tech предложила бизнесу платформу VK AI Space для создания и запуска ИИ-агентов 4 ч.
VK получила из российского бюджета более 43,5 млрд рублей на «Макс» и «VK Видео» 4 ч.
«Лучше поиграйте в первую часть»: шутер Industria 2 разочаровал игроков и стартовал в Steam с рейтингом 56 % 4 ч.
Представлены ретрофутуристические портативные консоли, вдохновлённые легендарными Commodore 64 и ZX Spectrum 36 мин.
Reliance потратит $17 млрд на крупнейший в Индии кластер ЦОД мощностью 1,5 ГВт 54 мин.
Бум ИИ оставил стройки жилых домов без электриков — в дата-центрах платят больше 2 ч.
Учёные близки к разгадке тайны «маленьких красных точек» в глубинах Вселенной — «Уэбб» засёк у одной из них признаки чёрной дыры 2 ч.
Samsung готовит ноутбуки на Aluminium OS — компьютерный Android получит интерфейс One UI 2 ч.
SoftBank готовится отправить роботов строить дата-центры 2 ч.
Giga Computing представила 4OU-сервер TO46-SD3 на базе NVIDIA HGX B300 с СЖО 3 ч.
Китайский электромобиль за $2 760 000: BYD подтвердила цену гиперкара YangWang U9 Xtreme 3 ч.
Слухи: Apple заморозила разработку новой Vision Pro из-за слабого интереса к актуальной версии 3 ч.
Российские компании начали хорошо зарабатывать на «временном» Wi-Fi 4 ч.