Сегодня 18 февраля 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

OpenAI придумала, как исправить угодливое поведение ChatGPТ

OpenAI официально отчиталась о мерах, принятых для устранения чрезмерно услужливого поведения ChatGPT. Ранее пользователи пожаловались, что ИИ стал слишком льстивым и одобрял даже опасные или рискованные идеи. Проблема возникла после выхода доработанной версии GPT-4o, которую разработчикам пришлось срочно откатывать назад.

 Источник изображения: openai.com

Источник изображения: openai.com

Генеральный директор OpenAI Сэм Альтман (Sam Altman) признал проблему в своём посте в X и пообещал исправить ситуацию «как можно скорее». Уже во вторник компания откатила обновление GPT-4o и заявила, что работает над исправлением «поведенческих особенностей» модели. Позже OpenAI опубликовала разбор инцидента и анонсировала изменения в процессе тестирования новой версии.

В своём блоге компания заявила, что усовершенствовала основные методы обучения и системные подсказки с целью увода модели от угодничества, создала дополнительные ограничения для повышения честности ответов и расширила возможности для большего числа пользователей по проведению тестирования перед развёртыванием. Также OpenAI считает, что пользователи должны иметь больше контроля над ChatGPT, и для этого разрешит вносить коррективы в поведение модели.

Проблема стала особенно актуальной на фоне роста популярности ChatGPT как источника полезных советов. Согласно опросу Express Legal Funding, 60 % взрослых американцев уже используют ИИ для поиска информации или рекомендаций. Учитывая масштабы аудитории, любые сбои в работе ChatGPT, будь то подхалимство или недостоверные ответы, могут иметь серьёзные последствия.

В качестве временного решения OpenAI начала тестировать функцию обратной связи в реальном режиме времени, которая позволяет пользователям напрямую влиять на ответы ChatGPT. Также изучается возможность добавления разных типов личности для ИИ. Компания не уточнила сроки внедрения всех намеченных изменений.

«Главный урок — осознание того, что люди всё чаще используют ChatGPT для личных советов, чего год назад почти не было, — отметили в OpenAI. — Теперь мы уделим этому аспекту больше внимания в контексте безопасности».

Источники:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Firefox вот-вот лишится поддержки Windows 7 и 8 — Mozilla советует срочно обновить ОС 8 мин.
Киберпанковый боевик Replaced опять перенесли — на этот раз из-за демоверсии в Steam 17 мин.
«Яндекс» рассказал, как сэкономил 4,8 млрд рублей на обучении ИИ без потери качества 19 мин.
Discord будет применять возрастную цензуру с помощью ИИ, за которым будут перепроверять люди 56 мин.
Разработчики «Войны Миров: Сибирь» объяснили, почему ушли из 1C Game Studios, и нацелились продать миллион копий игры в России 58 мин.
Лабораторные атаки показали уязвимости в менеджерах паролей LastPass, Bitwarden и Dashlane — ими пользуются 60 млн человек 2 ч.
Windows 11 получила полноценную поддержку MIDI 2.0 3 ч.
Суд запретил OpenAI использовать бренд Cameo 5 ч.
VK неделю назад объявила о закрытии «заменителя Telegram» TamTam, но это заметили лишь сейчас 5 ч.
Реестр российского ПО разросся до 30 тысяч продуктов — на это ушло 10 лет 5 ч.
В Швеции показали в деле зарядку на 1,2 МВт для электромобилей — и мороз не помешал 15 мин.
Топ-менеджер Intel: в половине отгруженных к этом году ПК будет ускоритель ИИ 25 мин.
Apple Mac mini и Mac Studio стали дефицитными — виноват снова ИИ, но не так, как с другими ПК 48 мин.
ПК-версию Cyberpunk 2077 запустили на Android — RedMagic 11 Pro справился на 30–40 FPS 3 ч.
Китайский конкурент Neuralink сообщил о первых успехах — пациент с имплантом научился управлять курсором за 5 дней 4 ч.
Wavepiston построит на Барбадосе волновую электростанцию на 50 МВт, каких мир ещё не видел 4 ч.
Новый дата‑центр «Мегафона» начал работу в Хабаровском крае 4 ч.
Британский бизнес обеспокоен грядущим запретом VPN 5 ч.
Бум ИИ разогнал станкостроителей: прибыль поставщиков чипового оборудования растёт восьмой квартал подряд 7 ч.
Технология древних на новых лад: учёные научились записывать 2 Тбайт данных на лист керамики формата A4 7 ч.