Сегодня 01 апреля 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

OpenAI раскрыла истинную причину подхалимского поведения ChatGPT

После отката последнего обновления GPT-4o из-за чрезмерного угодничества модели, OpenAI стала выяснять причину такого необычного и отталкивающего поведения ИИ. Разработчики выяснили, что GPT-4o стала отдавать предпочтение пользовательским оценкам в ущерб основным правилам, заложенным в поведение модели.

 Источник изображения: D koi / Unsplash

Источник изображения: D koi / Unsplash

Пользователи заметили проблему в поведении чат-бота ещё до того, как обновление было отменено и начали делиться скриншотами в социальных сетях. В частности, ChatGPT начал соглашаться даже с абсурдными или потенциально опасными утверждениями. Как пишет The Verge, примером стало расследование журнала Rolling Stone, в котором рассказывается о случаях, когда некоторые люди утверждали, что «пробудили в ChatGPT духовное сознание, поддерживающее их религиозные взгляды, связанные с манией величия».

Генеральный директор OpenAI Сэм Альтман (Sam Altman) заявил, что одной из основных причин проблемы стало использование в качестве дополнительного сигнала для обучения модели кнопок «лайк» и «дизлайк». По словам Альтмана, это могло ослабить влияние основного механизма, который ранее помогал контролировать проявления угодливости. «Мы не ожидали, что пользователи могут отдавать предпочтение более приятным, но менее корректным ответам», — отметили в компании. Также было указано, что функция запоминания предыдущего общения с ИИ тоже могла усиливать эффект угодничества.

Другой существенной причиной провала обновления OpenAI названы недостатки в тестировании. Хотя оффлайн-оценки и A/B-тесты показали хорошие результаты, некоторые эксперты отмечали, что ИИ стал вести себя странно. Однако разработчики всё равно выпустили обновление, не придав серьёзного значения происходящему.

OpenAI пообещала информировать пользователей обо всех изменениях в работе ChatGPT, даже если они кажутся незначительными. Это должно помочь избежать повторения ситуации, когда ИИ начинает слишком активно льстить собеседнику, игнорируя логику и здравый смысл.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
В iOS 27 появится улучшенная автокоррекции ввода для клавиатуры iPhone 8 ч.
Google представила ИИ-модель Veo 3.1 Lite для генерации видео до 8 секунд — он дешевле Veo 3.1 и Veo 3.1 Fast 9 ч.
«Нам говорили, что комедийные игры не продаются»: разработчики Dispatch похвастались новыми успехами проекта 9 ч.
Хакеры подсадили троян в одну из самых скачиваемых библиотек JavaScript 11 ч.
«Google Диск» научился выявлять программы-вымогатели и автоматически восстанавливать файлы пользователя 11 ч.
Ведущий дизайнер CI Games проговорился, когда выйдет Lords of the Fallen 2 11 ч.
Eidos Montreal спустя семь лет разработки и «сотни миллионов долларов» отменила AAAA-игру, ради которой умерла новая Deus Ex 12 ч.
Ещё больше ненастоящих кадров: Nvidia выпустила DLSS 4.5 с динамическим мультикадровым генератором и режимом MFG 6X 12 ч.
Google разрешила пользователям менять адрес электронной почты, но пока лишь в одной стране 13 ч.
«Куплю незамедлительно»: фанатов Auto Modellista заинтриговал трейлер гоночной аркады с открытым миром Rogue Stradale 13 ч.