Сегодня 21 ноября 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

ChatGPT прошёл стресс-тест на политическую предвзятость, но не безупречно

OpenAI провела «стресс-тест» моделей искусственного интеллекта последнего поколения GPT-5 и установила, что они сильнее прочих приблизились к одной из важнейших её целей: «ChatGPT не должен быть политически предвзятым ни в одном направлении». Серию испытаний компания проводила несколько месяцев.

 Источник изображения: ilgmyzin / unsplash.com

Источник изображения: ilgmyzin / unsplash.com

В OpenAI разработали тест, который оценивает наличие у ChatGPT пристрастий при ответе на нейтральные вопросы, а также реакцию чат-бота с искусственным интеллектом, когда ему задают политически ангажированные вопросы. Компания задавала ChatGPT вопросы, связанные с сотней критически важных тем, таких как иммиграция или беременность, и сформулированных различными способами: с уклоном в либерализм и консерватизм, предвзято и нейтрально. В испытаниях участвовали четыре модели: преимущественно вышедшие из обращения GPT-4o и OpenAI o3, а также актуальные GPT-5 instant и GPT-5 thinking.

Полного списка тем и вопросов в компании не предоставили, но отметили, что они были взяты из повестки дня политических партий и относились к «культурно значимым вопросам». Анализ ответов проводила специально обученная модель ИИ — она оценивала их, исходя из критериев, которые в OpenAI отметили как признаки предвзятости. Например, если в ответе ChatGPT запрос или фрагмент запроса пользователя брался в кавычки, это могло свидетельствовать, что мнение этого пользователя обесценивается, а точка зрения — игнорируется. Выражения, усиливающие явно пристрастную политическую позицию пользователя, охарактеризовали как «эскалацию», которая также свидетельствует о предвзятости ИИ в ответах.

По итогам тестирования OpenAI сделала вывод, что её модели достаточно успешно сохраняют объективность. Предвзятость проявляется, но «редко и в незначительной степени»; «умеренной» степени она достигает при получении запроса, в котором есть пристрастие с либеральным уклоном. При этом новые GPT-5 instant и GPT-5 thinking оказались на 30 % менее предвзятыми в политическом плане, чем устаревшие GPT-4o и OpenAI o3. Пристрастность обычно выражается в форме личного мнения, усиления эмоционального окраса в запросе и акцентирования лишь одной стороны вопроса.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
В Steam стартовала бесплатная раздача Warhammer: Vermintide 2 — в игру добавили знаковую миссию из первой части 21 мин.
«Просить больше казалось неправильным»: авторы возрождённой ролевой песочницы Hytale в духе Minecraft подтвердили цену игры 2 ч.
Google теперь использует письма пользователей Gmail для обучения ИИ, но это можно отключить 2 ч.
У Grok сломался регулятор подхалимства к Илону Маску — бот решил, что он совершенен во всём и даже может воскрешать людей 3 ч.
Разработчики Nioh 3 раскрыли системные требования для игры в 1080p с апскейлерами 3 ч.
Каждый четвёртый россиянин хотя бы раз в месяц пользуется нейросетями 3 ч.
Ubisoft объяснила, почему задержала финансовый отчёт, и похвасталась новым успехом Assassin's Creed Mirage 4 ч.
«МойОфис» анонсировал более десятка новых технологий и продуктов для бизнеса 6 ч.
Журналисты выяснили, когда выйдет ремейк Assassin’s Creed IV: Black Flag — ждать осталось недолго 6 ч.
Обнаружен Android-троян Sturnus, который перехватывает сообщения в WhatsApp и Telegram 6 ч.
Huawei пообещала флагманам Mate 80 автономность до 14 дней, не чем-то придётся жертвовать 2 ч.
Huawei научилась создавать конкурентов для ИИ-систем Nvidia, но они проигрывают по эффективности и производительности 2 ч.
В США впервые разрешили испытания на людях мозгового имплантата для восстановления речи 3 ч.
МТС, «МегаФон» и Т2 пригрозили «Билайну» судом за агрессивное переманивание абонентов 3 ч.
Российские итоги HUAWEI XMAGE 2025 и выставка «Фото[графическое] путешествие» 4 ч.
Joby Aviation подала в суд на конкурента Archer за кражу технологий аэротакси 5 ч.
Маск пообещал дешёвые ИИ-серверы в космосе через пять лет — Хуанг назвал эти планы «мечтой» 5 ч.
Ускоритель SpaceX Super Heavy для нового Starship 3 взорвался во время испытаний 5 ч.
«Покажите деньги»: инвесторы заподозрили ИИ-компании в махинациях по завышению капитализации 5 ч.
Рекордная выручка и оптимистичный прогноз NVIDIA снизили опасения по поводу растущего ИИ-пузыря 6 ч.