Сегодня 30 января 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

OpenAI обновила правила поведения для ИИ: нет подхалимству и избеганию деликатных тем

Компания OpenAI выпустила расширенную версию «Спецификации моделей» (Model Spec) — документа, определяющего поведение моделей искусственного интеллекта. Компания сделала его бесплатным для использования и изменения любым желающим.

 Источник изображения: Dima Solomin / unsplash.com

Источник изображения: Dima Solomin / unsplash.com

Документ объёмом 63 страницы (предыдущая версия содержала всего 10 страниц) содержит рекомендации относительно того, как модели ИИ должны обрабатывать запросы и реагировать на устанавливаемые пользователями настройки. В нём подчёркиваются три основных принципа: настраиваемость, прозрачность и «интеллектуальная свобода» — последнее означает возможность для пользователя исследовать и обсуждать различные вопросы без произвольных ограничений. В документе упомянуты получившие наибольшую огласку инциденты, связанные с этикой ИИ и произошедшие за последний год.

В публикации корпоративного блога OpenAI приводится множество примеров запросов и надлежащих ответов, а также вариантов, нарушающих требования документа. Например, модели ИИ не должны воспроизводить защищённые авторским правом материалы или использоваться для обхода платного доступа. Модель не может поощрять членовредительство — в индустрии ИИ бывали и такие инциденты. Изменения коснулись также участия ИИ в обсуждении спорных тем: моделям следует не проявлять крайнюю осторожность, а «искать истину вместе» с пользователями, придерживаясь при этом строгих моральных позиций по таким вопросам, как дезинформация или причинение вреда. То есть ИИ должен предлагать обоснованный анализ, а не избегать обсуждения. OpenAI также пересмотрела свою позицию в отношении материалов для взрослых: компания изучает возможность разрешить некоторые их виды, но сохранить строгий запрет на явно противоправный контент.

 Источник изображения: Growtika / unsplash.com

Источник изображения: Growtika / unsplash.com

Новые принципы позволяют ИИ преобразовывать материалы деликатного характера, но запрещают создавать их. Например, можно перевести текст, связанный с веществами в ограниченном обороте, с одного языка на другой; можно проявлять эмпатию, но без явно неискренних эмоций. Следует соблюдать границы, но при этом максимально повышать полезность ИИ. К этому, в той или иной мере, стремятся и другие разработчики ИИ, но не все готовы открыто это формулировать.

Особое внимание уделяется проблеме «подхалимства ИИ» — модели склонны демонстрировать покладистость, даже когда следовало бы возразить или выступить с критикой. ChatGPT должен давать одинаковые фактические ответы независимо от формулировки вопроса, честную обратную связь вместо пустых похвал — вести себя как вдумчивый коллега, а не стремиться угодить. Если пользователя интересует критика работы, ИИ должен предоставлять конструктивные замечания, а не утверждать, что всё идеально. Если же пользователь делает неверное утверждение, его следует вежливо исправить, а не подыгрывать ему.

В спецификации представлена чёткая «цепочка команд», определяющая приоритет инструкций: на первом месте — нормы OpenAI, за ними следуют рекомендации разработчиков, а затем предпочтения пользователей. Такая иерархия проясняет, какие аспекты ИИ можно изменять, а какие ограничения остаются неизменными. Документ распространяется под лицензией Creative Commons Zero (CC0), что фактически переводит его в общественное достояние: компании и исследователи в области ИИ могут свободно внедрять, изменять или дополнять эти рекомендации. OpenAI не обещает мгновенных изменений в поведении ChatGPT или других своих продуктов, но новые модели будут постепенно приводиться в соответствие с новыми нормами. Компания также публикует список контрольных запросов, используемых для проверки соответствия моделей рекомендациям.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Россияне стали больше сидеть во «ВКонтакте» и смотреть «VK видео» 47 мин.
«Если вы вернётесь в игру 20-летней давности, вас ждёт кринж»: ветеран Bethesda бросил тень на потенциальный ремастер The Elder Scrolls III: Morrowind 2 ч.
Разработчики Yakuza Kiwami 3 пообещали исправить графику к релизу — пока ремейк местами выглядит хуже, чем игра 16-летней давности 3 ч.
Microsoft исправила сбои входа и загрузки в свежем обновлении Windows 11 4 ч.
В Китае ликвидировали одну из крупнейших в мире сетей пиратской манги 4 ч.
Режиссёр Даррен Аронофски выпустит сгенерированный ИИ сериал о войне за независимость США 4 ч.
Сразу три источника подтвердили, когда пройдёт следующая презентация Nintendo Direct и какой она будет 4 ч.
Разработчики провальной MindsEye уйдут от IO Interactive, чтобы взять своё будущее под контроль — кроссовер с Hitman отменён 5 ч.
«Нацелены выпустить выдающуюся игру»: ведущий разработчик Beyond Good and Evil 2 подтвердил статус долгостроя после чистки в Ubisoft 6 ч.
ИИ схлестнулся с людьми в битве на креативность — результаты неоднозначны 7 ч.
Неооблака «засасывают» ИИ-данные как чёрные дыры, меня поведение Сети 6 мин.
Финны начали варить пиво «на песке» — местная пивоварня установила песочный теплоаккумулятор 55 мин.
Музыкальные издатели потребовали от Anthropic $3 млрд за «вопиющее пиратство» 2 ч.
Китай тоже планирует строительство гигаваттных космических ЦОД 2 ч.
От технологического наследия к строительству будущего — Atos перезапустила бренд Bull для HPC, ИИ и квантовых инноваций 3 ч.
США продвигают «атомные кампусы» с ослабленными требованиями к ядерной безопасности, чтобы запитать ИИ ЦОД 3 ч.
Android 16 распространяется быстрее предшественника — свежая ОС заняла 7,5 % Android-устройств по всему миру 3 ч.
Тим Кук наобещал «невиданных ранее» инноваций — Apple выпустит более 20 новинок в 2026 году 3 ч.
Мировой рынок смартфонов заработал рекордные $143 млрд за квартал — пользователи стали чаще выбирать флагманы 3 ч.
Смесь iPhone Air и Google Pixel: представлен смартфон Realme 16 с чипом Dimensity 6400 Turbo и батареей на 7000 мА·ч 3 ч.