Сегодня 10 февраля 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

ChatGPT прошёл стресс-тест на политическую предвзятость, но не безупречно

OpenAI провела «стресс-тест» моделей искусственного интеллекта последнего поколения GPT-5 и установила, что они сильнее прочих приблизились к одной из важнейших её целей: «ChatGPT не должен быть политически предвзятым ни в одном направлении». Серию испытаний компания проводила несколько месяцев.

 Источник изображения: ilgmyzin / unsplash.com

Источник изображения: ilgmyzin / unsplash.com

В OpenAI разработали тест, который оценивает наличие у ChatGPT пристрастий при ответе на нейтральные вопросы, а также реакцию чат-бота с искусственным интеллектом, когда ему задают политически ангажированные вопросы. Компания задавала ChatGPT вопросы, связанные с сотней критически важных тем, таких как иммиграция или беременность, и сформулированных различными способами: с уклоном в либерализм и консерватизм, предвзято и нейтрально. В испытаниях участвовали четыре модели: преимущественно вышедшие из обращения GPT-4o и OpenAI o3, а также актуальные GPT-5 instant и GPT-5 thinking.

Полного списка тем и вопросов в компании не предоставили, но отметили, что они были взяты из повестки дня политических партий и относились к «культурно значимым вопросам». Анализ ответов проводила специально обученная модель ИИ — она оценивала их, исходя из критериев, которые в OpenAI отметили как признаки предвзятости. Например, если в ответе ChatGPT запрос или фрагмент запроса пользователя брался в кавычки, это могло свидетельствовать, что мнение этого пользователя обесценивается, а точка зрения — игнорируется. Выражения, усиливающие явно пристрастную политическую позицию пользователя, охарактеризовали как «эскалацию», которая также свидетельствует о предвзятости ИИ в ответах.

По итогам тестирования OpenAI сделала вывод, что её модели достаточно успешно сохраняют объективность. Предвзятость проявляется, но «редко и в незначительной степени»; «умеренной» степени она достигает при получении запроса, в котором есть пристрастие с либеральным уклоном. При этом новые GPT-5 instant и GPT-5 thinking оказались на 30 % менее предвзятыми в политическом плане, чем устаревшие GPT-4o и OpenAI o3. Пристрастность обычно выражается в форме личного мнения, усиления эмоционального окраса в запросе и акцентирования лишь одной стороны вопроса.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Экс-продюсер GTA Лесли Бензис «временно» покинул основанную им Build a Rocket Boy, а руководство MindsEye надеется повторить путь Cyberpunk 2077 8 ч.
Календарь релизов 9–15 февраля: Reanimal, Mewgenics, Romeo is a Dead Man и Disciples: Domination 9 ч.
Зрелищный ретрофутуристический боевик Replaced порадовал журналистов и скоро получит демоверсию в Steam 10 ч.
Discord начнёт требовать сканирование лица или удостоверение личности для полного доступа 10 ч.
Успех на грани разочарования: критики оценили Yakuza Kiwami 3 хуже классической Yakuza 3 11 ч.
Десятки тысяч ИИ-агентов OpenClaw оказались уязвимы для взлома из-за ошибок в настройках 11 ч.
ChatGPT начнёт массово показывать рекламу уже на этой неделе — а пока Альтман похвалился активным ростом аудитории 12 ч.
«Жёсткое, но единственно правильное решение»: после критики фанатов авторы «Зайчика» объявили о полной переработке игры 12 ч.
Google спрятала тексты песен в YouTube Music от бесплатных пользователей 12 ч.
Sony подтвердила самый масштабный выпуск State of Play в истории — больше 60 минут анонсов от студий по всему миру 14 ч.
Власти США готовятся поднять пошлины на импорт чипов, но гиперскейлеры из числа клиентов TSMC получат льготы 2 ч.
Новая статья: Обзор игровых системных блоков ASUS ROG G700 и ASUS TUF Gaming T500: бессмертная классика и необычный гибрид 7 ч.
Alphabet возьмёт в долг $20 млрд на 100 лет, чтобы вложиться в ИИ 7 ч.
NASA и SpaceX отложили запуск миссии Crew-12 с россиянином к МКС из-за непогоды 8 ч.
Snapdragon X2 Elite оказался быстрее Apple M5 в синтетических тестах, но уступил Ryzen AI 9 и Core Ultra X9 в играх 10 ч.
Google собралась одолжить $15 млрд на строительство дата-центров для ненасытного ИИ 12 ч.
Intel тихо похоронила идею активации функций процессоров за доплату 14 ч.
Какие ваши доказательства: Nvidia отринула обвинения в обучении ИИ на пиратских книгах 14 ч.
Nokia и Ericsson вытеснили с китайского рынка — не за горами «раскол» 6G на западный и китайский варианты 15 ч.
Xbox нового поколения будет работать на Windows — подробности о самом рискованном проекте Microsoft 15 ч.