Сегодня 14 июня 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

OpenAI придумала, как исправить угодливое поведение ChatGPТ

OpenAI официально отчиталась о мерах, принятых для устранения чрезмерно услужливого поведения ChatGPT. Ранее пользователи пожаловались, что ИИ стал слишком льстивым и одобрял даже опасные или рискованные идеи. Проблема возникла после выхода доработанной версии GPT-4o, которую разработчикам пришлось срочно откатывать назад.

 Источник изображения: openai.com

Источник изображения: openai.com

Генеральный директор OpenAI Сэм Альтман (Sam Altman) признал проблему в своём посте в X и пообещал исправить ситуацию «как можно скорее». Уже во вторник компания откатила обновление GPT-4o и заявила, что работает над исправлением «поведенческих особенностей» модели. Позже OpenAI опубликовала разбор инцидента и анонсировала изменения в процессе тестирования новой версии.

В своём блоге компания заявила, что усовершенствовала основные методы обучения и системные подсказки с целью увода модели от угодничества, создала дополнительные ограничения для повышения честности ответов и расширила возможности для большего числа пользователей по проведению тестирования перед развёртыванием. Также OpenAI считает, что пользователи должны иметь больше контроля над ChatGPT, и для этого разрешит вносить коррективы в поведение модели.

Проблема стала особенно актуальной на фоне роста популярности ChatGPT как источника полезных советов. Согласно опросу Express Legal Funding, 60 % взрослых американцев уже используют ИИ для поиска информации или рекомендаций. Учитывая масштабы аудитории, любые сбои в работе ChatGPT, будь то подхалимство или недостоверные ответы, могут иметь серьёзные последствия.

В качестве временного решения OpenAI начала тестировать функцию обратной связи в реальном режиме времени, которая позволяет пользователям напрямую влиять на ответы ChatGPT. Также изучается возможность добавления разных типов личности для ИИ. Компания не уточнила сроки внедрения всех намеченных изменений.

«Главный урок — осознание того, что люди всё чаще используют ChatGPT для личных советов, чего год назад почти не было, — отметили в OpenAI. — Теперь мы уделим этому аспекту больше внимания в контексте безопасности».

Источники:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
YouTube может снизить скорость видео для пользователя при обнаружении блокировщиков рекламы 2 ч.
Meta переманила основателя Scale AI и получила 49 % акций стартапа за $14,3 млрд 2 ч.
Новая статья: Pipistrello and the Cursed Yoyo — замечательное приключение с ноткой ностальгии. Рецензия 8 ч.
Epic Games продолжает борьбу против читеров в Fortnite — студия подала в суд на разработчика и продавцов программ Sincey Cheats и Vanta Cheats 8 ч.
Чемоданный ИИ: в Китае придумали, как обучать модели на чипах Nvidia, которые нельзя ввезти в страну 9 ч.
«Хотим создать нечто действительно особенное»: Heroes of Might & Magic: Olden Era не выйдет в раннем доступе летом 10 ч.
Techland пообещала не бросать Dying Light 2 Stay Human из-за Dying Light: The Beast — у студии ещё «много очень и очень крутых идей» для игры 10 ч.
Несмотря на громкие провалы, Sony всё ещё нацелена на создание «разнообразных и устойчивых» игр-сервисов 13 ч.
Гейминг на Mac вышел на новый уровень: Steam наконец получил нативную поддержку процессоров Apple 13 ч.
Агрессивный план отменяется: Sony продолжит «очень вдумчиво» переносить эксклюзивы PlayStation на ПК 13 ч.
Мозговой имплант Neuralink позволил обезьяне увидеть несуществующий предмет 24 мин.
Samsung договорилась о поставках HBM3E для ускорителей AMD Instinct MI350 2 ч.
Micron вложит $200 млрд в производство чипов в США и создаст 90 тысяч рабочих мест 2 ч.
Oracle пообещала построить больше облачных ЦОД, чем все конкуренты вместе взятые 7 ч.
Робопсы Boston Dynamics станцевали в шоу «Америка ищет таланты» — один из них не справился с страхом сцены 7 ч.
Nvidia вычеркнула Китай: Хуанг больше не будет включать Поднебесную в планы по прибыли 7 ч.
И нашим, и вашим: Talen всё-таки поставит 1,92 ГВт энергии с АЭС дата-центрам AWS, но опосредованно 8 ч.
Закат эпохи DDR4: Micron объявила о прекращении выпуска устаревшей памяти 8 ч.
Раскол Intel — вопрос времени: аналитики не верят, что компания справится с кризисом без разделения 10 ч.
Intel отправила на пенсию свои первые настольные и мобильные видеокарты Arc 11 ч.