Сегодня 12 марта 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

OpenAI раскрыла истинную причину подхалимского поведения ChatGPT

После отката последнего обновления GPT-4o из-за чрезмерного угодничества модели, OpenAI стала выяснять причину такого необычного и отталкивающего поведения ИИ. Разработчики выяснили, что GPT-4o стала отдавать предпочтение пользовательским оценкам в ущерб основным правилам, заложенным в поведение модели.

 Источник изображения: D koi / Unsplash

Источник изображения: D koi / Unsplash

Пользователи заметили проблему в поведении чат-бота ещё до того, как обновление было отменено и начали делиться скриншотами в социальных сетях. В частности, ChatGPT начал соглашаться даже с абсурдными или потенциально опасными утверждениями. Как пишет The Verge, примером стало расследование журнала Rolling Stone, в котором рассказывается о случаях, когда некоторые люди утверждали, что «пробудили в ChatGPT духовное сознание, поддерживающее их религиозные взгляды, связанные с манией величия».

Генеральный директор OpenAI Сэм Альтман (Sam Altman) заявил, что одной из основных причин проблемы стало использование в качестве дополнительного сигнала для обучения модели кнопок «лайк» и «дизлайк». По словам Альтмана, это могло ослабить влияние основного механизма, который ранее помогал контролировать проявления угодливости. «Мы не ожидали, что пользователи могут отдавать предпочтение более приятным, но менее корректным ответам», — отметили в компании. Также было указано, что функция запоминания предыдущего общения с ИИ тоже могла усиливать эффект угодничества.

Другой существенной причиной провала обновления OpenAI названы недостатки в тестировании. Хотя оффлайн-оценки и A/B-тесты показали хорошие результаты, некоторые эксперты отмечали, что ИИ стал вести себя странно. Однако разработчики всё равно выпустили обновление, не придав серьёзного значения происходящему.

OpenAI пообещала информировать пользователей обо всех изменениях в работе ChatGPT, даже если они кажутся незначительными. Это должно помочь избежать повторения ситуации, когда ИИ начинает слишком активно льстить собеседнику, игнорируя логику и здравый смысл.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Google рассказала, как улучшит производительность и автономность Android-смартфонов 4 ч.
Microsoft добавит «режим Xbox» на каждый компьютер с Windows 11 5 ч.
Valve отвергла обвинения властей Нью-Йорка в организации азартных игр и сравнила лутбоксы в Counter-Strike 2 c Лабубу 6 ч.
Две критические уязвимости Microsoft Office получили экстренные патчи 6 ч.
Nvidia выпустила Nemotron 3 Super 120B — открытую LLM для ИИ-агентов с пятикратным приростом скорости 7 ч.
Спустя 13 лет моддеры возродили отменённый мультиплеерный шутер Star Wars: First Assault, который должен был проложить дорогу Battlefront 3 7 ч.
Valve: 5863 игры в Steam заработали по $100 000 и больше за прошлый год 8 ч.
Meta запустила ИИ-защиту от фишинговых ссылок и дипфейков знаменитостей 8 ч.
Создатели Styx: Blades of Greed анонсировали Warhammer Blood Bowl — первый трейлер, демо в Steam и бесплатный апгрейд 8 ч.
Спидраннер наткнулся в Uncharted: Drake's Fortune на секрет, который скрывался от игроков почти 20 лет 9 ч.
Новая статья: Обзор GIGABYTE GAMING A16 PRO: самый доступный игровой ноутбук с графикой на 16 Гбайт 4 ч.
Xbox Project Helix получит ИИ-генератор кадров и рейтрейсинг нового поколения — девкиты выйдут в 2027 году 6 ч.
Intel представила мечту анонимов — чип Heracles для работы с зашифрованными данными без дешифровки 6 ч.
Valve рассказала, как будет проверять игры на совместимость с приставкой Steam Machine и VR-гарнитурой Steam Frame 6 ч.
Framework повысила цены на память и SSD для своих ноутбуков и ПК — в третий раз за четыре месяца 7 ч.
Телевизоры Hisense начали показывать неотключаемую рекламу даже при переключении входов и каналов 8 ч.
Apple продаст до конца года около 5 млн MacBook Neo, а будущий Neo 2 получит сенсорный экран 8 ч.
Nvidia бросит вызов Tesla и Waymo на рынке автопилота 11 ч.
Intel внезапно представила десктопные процессоры Core Ultra 200S Plus — ядер больше, память быстрее, а цена ниже 12 ч.
В жаркие дни ИИ ЦОД способны потреблять воды как весь Нью-Йорк за день 13 ч.