Сегодня 22 февраля 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

ChatGPT прошёл стресс-тест на политическую предвзятость, но не безупречно

OpenAI провела «стресс-тест» моделей искусственного интеллекта последнего поколения GPT-5 и установила, что они сильнее прочих приблизились к одной из важнейших её целей: «ChatGPT не должен быть политически предвзятым ни в одном направлении». Серию испытаний компания проводила несколько месяцев.

 Источник изображения: ilgmyzin / unsplash.com

Источник изображения: ilgmyzin / unsplash.com

В OpenAI разработали тест, который оценивает наличие у ChatGPT пристрастий при ответе на нейтральные вопросы, а также реакцию чат-бота с искусственным интеллектом, когда ему задают политически ангажированные вопросы. Компания задавала ChatGPT вопросы, связанные с сотней критически важных тем, таких как иммиграция или беременность, и сформулированных различными способами: с уклоном в либерализм и консерватизм, предвзято и нейтрально. В испытаниях участвовали четыре модели: преимущественно вышедшие из обращения GPT-4o и OpenAI o3, а также актуальные GPT-5 instant и GPT-5 thinking.

Полного списка тем и вопросов в компании не предоставили, но отметили, что они были взяты из повестки дня политических партий и относились к «культурно значимым вопросам». Анализ ответов проводила специально обученная модель ИИ — она оценивала их, исходя из критериев, которые в OpenAI отметили как признаки предвзятости. Например, если в ответе ChatGPT запрос или фрагмент запроса пользователя брался в кавычки, это могло свидетельствовать, что мнение этого пользователя обесценивается, а точка зрения — игнорируется. Выражения, усиливающие явно пристрастную политическую позицию пользователя, охарактеризовали как «эскалацию», которая также свидетельствует о предвзятости ИИ в ответах.

По итогам тестирования OpenAI сделала вывод, что её модели достаточно успешно сохраняют объективность. Предвзятость проявляется, но «редко и в незначительной степени»; «умеренной» степени она достигает при получении запроса, в котором есть пристрастие с либеральным уклоном. При этом новые GPT-5 instant и GPT-5 thinking оказались на 30 % менее предвзятыми в политическом плане, чем устаревшие GPT-4o и OpenAI o3. Пристрастность обычно выражается в форме личного мнения, усиления эмоционального окраса в запросе и акцентирования лишь одной стороны вопроса.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Новая статья: Reanimal — мастер-класс, но не без изъянов. Рецензия 2 ч.
Не только Cyberpunk 2077: на мощных Android-устройствах заработали AAA-игры для ПК, но с ограничениями 9 ч.
Apple создаёт локального ИИ-агента для iPhone, который сможет управлять приложениями за пользователя 12 ч.
Roblox обеспечила больше роста игровой индустрии, чем Steam, PlayStation и Fortnite вместе взятые 12 ч.
Microsoft: смена руководства в Xbox не повлечёт сокращений и закрытия студий 15 ч.
WhatsApp научится скрывать сообщения под спойлеры — прямо как другой популярный мессенджер 15 ч.
Фил Спенсер и президент Xbox Сара Бонд ушли из Microsoft — Microsoft Gaming возглавила специалист по ИИ 24 ч.
Новая статья: Mewgenics — девяти жизней может не хватить. Рецензия 21-02 00:04
«Гонка вооружений» в сфере ИИ бессмысленна — США и Китай преследуют совершенно разные цели 20-02 23:37
У Steam произошёл массовый сбой: миллионы игроков не могут войти в CS2, Dota 2 и другие игры 20-02 22:25
AMD подстрахует Crusoe, продаст ей свои чипы и сама же арендует их, если что-то пойдёт не так 2 ч.
Тайна «снеговиков» на краю Солнечной системы раскрыта спустя шесть лет 3 ч.
Lenovo установила дедлайн для заказов по старым ценам — дальше из-за дефицита памяти будет рост 3 ч.
В NASA назначили ближайшую дату пилотируемого полёта к Луне — 6 марта 7 ч.
G42 из ОАЭ и Cerebras построят в Индии национальный ИИ-суперкомпьютер с царь-ускорителями WSE-3 11 ч.
Nautilus представила универсальный 4-МВт CDU 11 ч.
SpaceX создала систему мониторинга спутников ради безопасности орбиты — бесплатную для всех, но при одном условии 14 ч.
Anthropic обвалила акции CrowdStrike и Cloudflare, представив ИИ-багхантера Claude Code Security 16 ч.
Tesla не смогла оспорить вердикт на $243 млн по делу о смертельной аварии с Autopilot 18 ч.
Верховный суд США признал тарифы Трампа незаконными, но их отмена уже уже не спасёт цены 18 ч.