Сегодня 29 июля 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

OpenAI раскрыла истинную причину подхалимского поведения ChatGPT

После отката последнего обновления GPT-4o из-за чрезмерного угодничества модели, OpenAI стала выяснять причину такого необычного и отталкивающего поведения ИИ. Разработчики выяснили, что GPT-4o стала отдавать предпочтение пользовательским оценкам в ущерб основным правилам, заложенным в поведение модели.

 Источник изображения: D koi / Unsplash

Источник изображения: D koi / Unsplash

Пользователи заметили проблему в поведении чат-бота ещё до того, как обновление было отменено и начали делиться скриншотами в социальных сетях. В частности, ChatGPT начал соглашаться даже с абсурдными или потенциально опасными утверждениями. Как пишет The Verge, примером стало расследование журнала Rolling Stone, в котором рассказывается о случаях, когда некоторые люди утверждали, что «пробудили в ChatGPT духовное сознание, поддерживающее их религиозные взгляды, связанные с манией величия».

Генеральный директор OpenAI Сэм Альтман (Sam Altman) заявил, что одной из основных причин проблемы стало использование в качестве дополнительного сигнала для обучения модели кнопок «лайк» и «дизлайк». По словам Альтмана, это могло ослабить влияние основного механизма, который ранее помогал контролировать проявления угодливости. «Мы не ожидали, что пользователи могут отдавать предпочтение более приятным, но менее корректным ответам», — отметили в компании. Также было указано, что функция запоминания предыдущего общения с ИИ тоже могла усиливать эффект угодничества.

Другой существенной причиной провала обновления OpenAI названы недостатки в тестировании. Хотя оффлайн-оценки и A/B-тесты показали хорошие результаты, некоторые эксперты отмечали, что ИИ стал вести себя странно. Однако разработчики всё равно выпустили обновление, не придав серьёзного значения происходящему.

OpenAI пообещала информировать пользователей обо всех изменениях в работе ChatGPT, даже если они кажутся незначительными. Это должно помочь избежать повторения ситуации, когда ИИ начинает слишком активно льстить собеседнику, игнорируя логику и здравый смысл.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Провал Suicide Squad: Kill the Justice League не остановил Warner Bros. — разработчики Gotham Knights взялись за крупнобюджетную игру-сервис 51 мин.
«Инферит ОС» (ГК Softline) запустила открытое бета-тестирование операционной системы «МСВСфера» 10 53 мин.
Американку осудили на 8,5 лет тюрьмы за помощь северокорейцам в проникновении в компании США 55 мин.
Акции Spotify упали на 8 % из-за обвалившейся выручки и плохих прогнозов 2 ч.
В ИИ-помощника программиста Amazon Q кто-то тайно внедрил опасный код — это заметили лишь через десять дней 2 ч.
Расплывчато и потенциально незаконно: эксперты — о грандиозном ИИ-плане Трампа 2 ч.
Anthropic ввела квоты на работу с Claude Code из-за чрезмерного спроса и злоупотреблений 3 ч.
Bloober Team доказала, что «люди ошибались» — разработчики ремейка Silent Hill 2 и Cronos: The New Dawn больше не чувствуют себя аутсайдерами 3 ч.
Microsoft не хочет упустить сильный ИИ: корпорация борется за доступ к будущим технологиям OpenAI 4 ч.
Представлен российский аналог платформы визуализации данных Grafana 5 ч.