Сегодня 29 мая 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

OpenAI раскрыла истинную причину подхалимского поведения ChatGPT

После отката последнего обновления GPT-4o из-за чрезмерного угодничества модели, OpenAI стала выяснять причину такого необычного и отталкивающего поведения ИИ. Разработчики выяснили, что GPT-4o стала отдавать предпочтение пользовательским оценкам в ущерб основным правилам, заложенным в поведение модели.

 Источник изображения: D koi / Unsplash

Источник изображения: D koi / Unsplash

Пользователи заметили проблему в поведении чат-бота ещё до того, как обновление было отменено и начали делиться скриншотами в социальных сетях. В частности, ChatGPT начал соглашаться даже с абсурдными или потенциально опасными утверждениями. Как пишет The Verge, примером стало расследование журнала Rolling Stone, в котором рассказывается о случаях, когда некоторые люди утверждали, что «пробудили в ChatGPT духовное сознание, поддерживающее их религиозные взгляды, связанные с манией величия».

Генеральный директор OpenAI Сэм Альтман (Sam Altman) заявил, что одной из основных причин проблемы стало использование в качестве дополнительного сигнала для обучения модели кнопок «лайк» и «дизлайк». По словам Альтмана, это могло ослабить влияние основного механизма, который ранее помогал контролировать проявления угодливости. «Мы не ожидали, что пользователи могут отдавать предпочтение более приятным, но менее корректным ответам», — отметили в компании. Также было указано, что функция запоминания предыдущего общения с ИИ тоже могла усиливать эффект угодничества.

Другой существенной причиной провала обновления OpenAI названы недостатки в тестировании. Хотя оффлайн-оценки и A/B-тесты показали хорошие результаты, некоторые эксперты отмечали, что ИИ стал вести себя странно. Однако разработчики всё равно выпустили обновление, не придав серьёзного значения происходящему.

OpenAI пообещала информировать пользователей обо всех изменениях в работе ChatGPT, даже если они кажутся незначительными. Это должно помочь избежать повторения ситуации, когда ИИ начинает слишком активно льстить собеседнику, игнорируя логику и здравый смысл.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Игроки профинансировали русскую озвучку Clair Obscur: Expedition 33 от GamesVoice 33 мин.
Отечественные системы для управления сетями заняли лишь 3 % российского рынка 3 ч.
Соруководитель студии экс-президента Rockstar уверен, что негатив вокруг MindsEye генерируют боты и проплаченные блогеры 3 ч.
«Базис» представляет программно-определяемую систему хранения данных Basis SDS 2.0 4 ч.
«Призовите силу альтернативного метала начала 2000-х»: новый трейлер Elden Ring Nightreign зарядил фанатов ностальгией 4 ч.
Илон Маск ушёл из DOGE и плотнее займётся проблемами Tesla, X и xAI 4 ч.
Ежемесячная аудитория ИИ-бота Meta AI превысила 1 млрд человек, похвастался Цукерберг 4 ч.
Salesforce приобрела за $8 млрд Informatica ради улучшения платформы ИИ-агентов Agentforce 5 ч.
«Базис» представляет Basis Workplace 3.0: новое поколение платформы виртуализации рабочих мест 5 ч.
Создатели новой Painkiller пригласили игроков на техническое тестирование в Steam — доступный контент и системные требования 5 ч.
Хвалённый термогель Gigabyte «поплыл»: обычные термопрокладки лучше справились с охлаждением 31 мин.
Honor заявила, что научила роботов Unitree бегать быстрее всех 43 мин.
Китайская космическая станция получит защиту от непрошеных гостей — в случае чего их растолкают спутники-буксиры 58 мин.
Fermilab получит ленточную библиотеку ёмкостью более 225 Пбайт 2 ч.
Перегрев, протечки и нестабильность затормозили массовый выпуск NVIDIA GB200 NVL72, но теперь все проблемы решены 3 ч.
NASA спасло межпланетную станцию «Психея», переключив её на запасную топливную магистраль в двигателях 4 ч.
После ухода из политики Маск пообещал запустить беспилотное такси Tesla в Техасе раньше сроков 4 ч.
Новая статья: Обзор смартфона realme 14 5G: мощность на каждый день 4 ч.
Федеральный суд США признал незаконными и заблокировал большинство трамповских пошлин 5 ч.
Дебютировали российские серверы «Аквариус» AQserv RS на базе Intel Xeon Emerald Rapids 5 ч.