Сегодня 13 мая 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

ChatGPT прошёл стресс-тест на политическую предвзятость, но не безупречно

OpenAI провела «стресс-тест» моделей искусственного интеллекта последнего поколения GPT-5 и установила, что они сильнее прочих приблизились к одной из важнейших её целей: «ChatGPT не должен быть политически предвзятым ни в одном направлении». Серию испытаний компания проводила несколько месяцев.

 Источник изображения: ilgmyzin / unsplash.com

Источник изображения: ilgmyzin / unsplash.com

В OpenAI разработали тест, который оценивает наличие у ChatGPT пристрастий при ответе на нейтральные вопросы, а также реакцию чат-бота с искусственным интеллектом, когда ему задают политически ангажированные вопросы. Компания задавала ChatGPT вопросы, связанные с сотней критически важных тем, таких как иммиграция или беременность, и сформулированных различными способами: с уклоном в либерализм и консерватизм, предвзято и нейтрально. В испытаниях участвовали четыре модели: преимущественно вышедшие из обращения GPT-4o и OpenAI o3, а также актуальные GPT-5 instant и GPT-5 thinking.

Полного списка тем и вопросов в компании не предоставили, но отметили, что они были взяты из повестки дня политических партий и относились к «культурно значимым вопросам». Анализ ответов проводила специально обученная модель ИИ — она оценивала их, исходя из критериев, которые в OpenAI отметили как признаки предвзятости. Например, если в ответе ChatGPT запрос или фрагмент запроса пользователя брался в кавычки, это могло свидетельствовать, что мнение этого пользователя обесценивается, а точка зрения — игнорируется. Выражения, усиливающие явно пристрастную политическую позицию пользователя, охарактеризовали как «эскалацию», которая также свидетельствует о предвзятости ИИ в ответах.

По итогам тестирования OpenAI сделала вывод, что её модели достаточно успешно сохраняют объективность. Предвзятость проявляется, но «редко и в незначительной степени»; «умеренной» степени она достигает при получении запроса, в котором есть пристрастие с либеральным уклоном. При этом новые GPT-5 instant и GPT-5 thinking оказались на 30 % менее предвзятыми в политическом плане, чем устаревшие GPT-4o и OpenAI o3. Пристрастность обычно выражается в форме личного мнения, усиления эмоционального окраса в запросе и акцентирования лишь одной стороны вопроса.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Выручка Nebius Аркадия Воложа взлетела на 684 % благодаря буму ИИ 37 мин.
Разработчики Subnautica 2 подтвердили утечку игры и предупредили пиратов 44 мин.
Linux снова под ударом: раскрыт эксплойт Fragnesia, который превратит любого пользователя в администратора 48 мин.
Хакеры атаковали интернет-магазин Škoda — данные клиентов могли утечь 2 ч.
Биологический ИИ оказался обоюдоострым: он создаёт и яды, и антидоты — и не ясно, что опаснее 3 ч.
Microsoft объяснила, как планирует ускорить интерфейс Windows 11 3 ч.
Создатель Claude Code рассказал, что каждую ночь запускает тысячи ИИ-агентов и управляет ими со смартфона 4 ч.
Meta отступила перед Еврокомиссией — конкурирующие ИИ-чат-боты получили бесплатный доступ к WhatsApp 5 ч.
«Дорогие и быстро устаревают»: создатель BioShock и Judas объяснил, почему не гонится за передовыми технологиями 5 ч.
Хакеры из Nitrogen заявили о краже 8 Тбайт данных у партнёра Apple — заводы Foxconn перешли на бумажные табели 6 ч.
Прибыль Alibaba рухнула на 84 %, но гендир назвал отдачу от ИИ «абсолютно очевидной» 17 мин.
Xiaomi скоро представит флагман Xiaomi 17 Max, фитнес-браслет Smart Band 10 Pro и первые спортивные наушники 36 мин.
Аэрокосмический ИИ-стартап Aetherflux сменил имя на Cowboy Space Corporation и привлёк $275 млн на создание орбитального ЦОД 44 мин.
Нидерланды выступили против новых санкций США на поставки чипового оборудования ASML в Китай 50 мин.
Motorola выпустила трекер Moto Tag 2 с поддержкой UWB, Google Find Hub и автономностью на 600 дней 60 мин.
Он настоящий: создатели Trump Mobile T1 пообещали поставить первые смартфоны уже на этой неделе 2 ч.
Waymo отучит роботакси штурмовать затопленные улицы 2 ч.
Nothing Phone (4a) и Phone (4a) Pro поступили в продажу в России — от 49 999 рублей 2 ч.
Иди своей дорогой, сталкер: вокруг ЦОД в России создадут зоны отчуждения 2 ч.
AMD предупредила об уязвимости в процессорах на базе Zen 2 — для EPYC Rome патчей прошивок не будет 3 ч.