Сегодня 20 августа 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

OpenAI раскрыла истинную причину подхалимского поведения ChatGPT

После отката последнего обновления GPT-4o из-за чрезмерного угодничества модели, OpenAI стала выяснять причину такого необычного и отталкивающего поведения ИИ. Разработчики выяснили, что GPT-4o стала отдавать предпочтение пользовательским оценкам в ущерб основным правилам, заложенным в поведение модели.

 Источник изображения: D koi / Unsplash

Источник изображения: D koi / Unsplash

Пользователи заметили проблему в поведении чат-бота ещё до того, как обновление было отменено и начали делиться скриншотами в социальных сетях. В частности, ChatGPT начал соглашаться даже с абсурдными или потенциально опасными утверждениями. Как пишет The Verge, примером стало расследование журнала Rolling Stone, в котором рассказывается о случаях, когда некоторые люди утверждали, что «пробудили в ChatGPT духовное сознание, поддерживающее их религиозные взгляды, связанные с манией величия».

Генеральный директор OpenAI Сэм Альтман (Sam Altman) заявил, что одной из основных причин проблемы стало использование в качестве дополнительного сигнала для обучения модели кнопок «лайк» и «дизлайк». По словам Альтмана, это могло ослабить влияние основного механизма, который ранее помогал контролировать проявления угодливости. «Мы не ожидали, что пользователи могут отдавать предпочтение более приятным, но менее корректным ответам», — отметили в компании. Также было указано, что функция запоминания предыдущего общения с ИИ тоже могла усиливать эффект угодничества.

Другой существенной причиной провала обновления OpenAI названы недостатки в тестировании. Хотя оффлайн-оценки и A/B-тесты показали хорошие результаты, некоторые эксперты отмечали, что ИИ стал вести себя странно. Однако разработчики всё равно выпустили обновление, не придав серьёзного значения происходящему.

OpenAI пообещала информировать пользователей обо всех изменениях в работе ChatGPT, даже если они кажутся незначительными. Это должно помочь избежать повторения ситуации, когда ИИ начинает слишком активно льстить собеседнику, игнорируя логику и здравый смысл.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Sekiro: Shadows Die Twice превратят в аниме ручной работы — дебютный трейлер Sekiro: No Defeat 17 мин.
Исследователь нашёл уязвимости в четырёх сайтах Intel, но не получил за это ни гроша 2 ч.
Популярность домена .RU среди новых сайтов упала 2 ч.
Сюжетное дополнение Legacy of the Forge принесёт в Kingdom Come: Deliverance 2 элементы The Sims — трейлер и дата выхода 2 ч.
Хоррор-шутер Crossfire: Rainbow от создателей Delta Force сменил название на Project Spectrum и обзавёлся атмосферным трейлером 3 ч.
Российский ИИ будет развиваться под надзором — Минцифры разработало концепцию регулирования нейросетей 3 ч.
По мотивам «Божественной комедии» выйдет экшен La Divina Commedia с элементами эвакуационных шутеров и смертными грехами вместо мировоззрений 4 ч.
«И нет, с ними нельзя спать»: авторы The Outer Worlds 2 напомнили о главной особенности компаньонов главного героя в новом трейлере 5 ч.
Студия-разработчик культовой Disco Elysium анонсировала Zero Parades — шпионскую ролевую игру с уставшей оперативницей в главной роли 6 ч.
Нью-Вегас, мистер Хаус и встреча с когтем смерти: второй сезон «Фоллаут» выйдет 17 декабря, но не целиком 6 ч.
Amazon, Google и Microsoft призвали США сохранить субсидии на возобновляемые источники энергии ради борьбы с КНР за первенство в сфере ИИ 17 мин.
Vantage построит за $25 млрд 1,4-ГВт кампус ИИ ЦОД неподалёку от первого дата-центра Crusoe Stargate 60 мин.
Представлен HMD Fuse — смартфон с неординарным дизайном и ИИ-блокировщиком взрослого контента 2 ч.
Asus представила материнскую плату ROG Strix X870E-H Gaming WiFi7 с поддержкой Wi-Fi 7 и USB4 2 ч.
Ажиотаж вокруг DDR4 и DDR5 стал утихать — спотовые цены на оперативную память немного спали 2 ч.
Крышу дома американца пробил метеорит, оказавшийся старше Земли 2 ч.
Applied Digital построит в Северной Дакоте 280-МВт ИИ ЦОД с СЖО 3 ч.
Тактильная сенсорная панель, быстрая зарядка и не только: мышь Logitech MX Master 4 полностью рассекретили до анонса 3 ч.
Unitree похвасталась, что возглавила медальный зачёт первых Всемирных игр человекоподобных роботов 4 ч.
SSSTC представила SSD серии CA8 — первые на рынке индустриальные M.2-накопители с памятью Kioxia BiCS Flash восьмого поколения 4 ч.