Сегодня 23 марта 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

ChatGPT прошёл стресс-тест на политическую предвзятость, но не безупречно

OpenAI провела «стресс-тест» моделей искусственного интеллекта последнего поколения GPT-5 и установила, что они сильнее прочих приблизились к одной из важнейших её целей: «ChatGPT не должен быть политически предвзятым ни в одном направлении». Серию испытаний компания проводила несколько месяцев.

 Источник изображения: ilgmyzin / unsplash.com

Источник изображения: ilgmyzin / unsplash.com

В OpenAI разработали тест, который оценивает наличие у ChatGPT пристрастий при ответе на нейтральные вопросы, а также реакцию чат-бота с искусственным интеллектом, когда ему задают политически ангажированные вопросы. Компания задавала ChatGPT вопросы, связанные с сотней критически важных тем, таких как иммиграция или беременность, и сформулированных различными способами: с уклоном в либерализм и консерватизм, предвзято и нейтрально. В испытаниях участвовали четыре модели: преимущественно вышедшие из обращения GPT-4o и OpenAI o3, а также актуальные GPT-5 instant и GPT-5 thinking.

Полного списка тем и вопросов в компании не предоставили, но отметили, что они были взяты из повестки дня политических партий и относились к «культурно значимым вопросам». Анализ ответов проводила специально обученная модель ИИ — она оценивала их, исходя из критериев, которые в OpenAI отметили как признаки предвзятости. Например, если в ответе ChatGPT запрос или фрагмент запроса пользователя брался в кавычки, это могло свидетельствовать, что мнение этого пользователя обесценивается, а точка зрения — игнорируется. Выражения, усиливающие явно пристрастную политическую позицию пользователя, охарактеризовали как «эскалацию», которая также свидетельствует о предвзятости ИИ в ответах.

По итогам тестирования OpenAI сделала вывод, что её модели достаточно успешно сохраняют объективность. Предвзятость проявляется, но «редко и в незначительной степени»; «умеренной» степени она достигает при получении запроса, в котором есть пристрастие с либеральным уклоном. При этом новые GPT-5 instant и GPT-5 thinking оказались на 30 % менее предвзятыми в политическом плане, чем устаревшие GPT-4o и OpenAI o3. Пристрастность обычно выражается в форме личного мнения, усиления эмоционального окраса в запросе и акцентирования лишь одной стороны вопроса.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Франция обвинила Илона Маска в завышении стоимости X и xAI дипфейками с обнажёнкой 11 ч.
OpenAI планирует удвоить штат ради укрепления корпоративных продаж ChatGPT 17 ч.
Новая статья: John Carpenter's Toxic Commando — весёлый экшен для совместного отдыха. Рецензия 24 ч.
Apple хотела поглотить разработчика приложения камеры Halide, но рассорила учредителей стартапа 21-03 20:15
Реклама в ChatGPT забуксовала: крупные агентства вложили сотни тысяч, но аудитории не хватает 21-03 17:06
«Google Переводчик» научит пользователей правильному произношению с помощью ИИ 21-03 14:39
На PlayStation появится ИИ-генератор кадров, как у Radeon — но не в ближайшее время 21-03 12:55
Чиновников обяжут пользоваться мессенджером Max 21-03 12:22
Пентагон принял боевую ИИ-систему Palantir Maven в качестве основной для армии США 21-03 12:18
Microsoft представила MAI-Image-2 — ИИ-генератор изображений, который оказался неожиданно хорош в фотореализме и инфографике 21-03 12:07
Nokia уже готовится к развитию Wi-Fi 9 5 ч.
LG запустила серийное производство панелей для ноутбуков с переменной частотой обновления 1–120 Гц 8 ч.
«Уничтожение наследия человечества», — астрономы протестуют против дата-центров и зеркал в космосе 9 ч.
Почти втрое быстрее NVIDIA H20: Huawei представила ИИ-ускоритель Atlas 350 для инференса 11 ч.
Apple распродала запасы MacBook Neo — новым покупателям придётся ждать до середины апреля 13 ч.
Huawei представила ИИ-ускоритель Atlas 350, превосходящий Nvidia H20 по производительности 13 ч.
Tesla и SpaceX построят гигантскую фабрику по выпуску ИИ-чипов в Техасе 16 ч.
Micron сейчас способна покрывать спрос на память от силы на две трети от требуемого уровня 16 ч.
Китайские мозговые импланты на три года отстают от американских Neuralink 17 ч.
Supermicro выгнала сооснователя компании, попавшегося на контрабанде в Китай подсанкционного ИИ-оборудования 21-03 22:06