Сегодня 23 июня 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

ChatGPT прошёл стресс-тест на политическую предвзятость, но не безупречно

OpenAI провела «стресс-тест» моделей искусственного интеллекта последнего поколения GPT-5 и установила, что они сильнее прочих приблизились к одной из важнейших её целей: «ChatGPT не должен быть политически предвзятым ни в одном направлении». Серию испытаний компания проводила несколько месяцев.

 Источник изображения: ilgmyzin / unsplash.com

Источник изображения: ilgmyzin / unsplash.com

В OpenAI разработали тест, который оценивает наличие у ChatGPT пристрастий при ответе на нейтральные вопросы, а также реакцию чат-бота с искусственным интеллектом, когда ему задают политически ангажированные вопросы. Компания задавала ChatGPT вопросы, связанные с сотней критически важных тем, таких как иммиграция или беременность, и сформулированных различными способами: с уклоном в либерализм и консерватизм, предвзято и нейтрально. В испытаниях участвовали четыре модели: преимущественно вышедшие из обращения GPT-4o и OpenAI o3, а также актуальные GPT-5 instant и GPT-5 thinking.

Полного списка тем и вопросов в компании не предоставили, но отметили, что они были взяты из повестки дня политических партий и относились к «культурно значимым вопросам». Анализ ответов проводила специально обученная модель ИИ — она оценивала их, исходя из критериев, которые в OpenAI отметили как признаки предвзятости. Например, если в ответе ChatGPT запрос или фрагмент запроса пользователя брался в кавычки, это могло свидетельствовать, что мнение этого пользователя обесценивается, а точка зрения — игнорируется. Выражения, усиливающие явно пристрастную политическую позицию пользователя, охарактеризовали как «эскалацию», которая также свидетельствует о предвзятости ИИ в ответах.

По итогам тестирования OpenAI сделала вывод, что её модели достаточно успешно сохраняют объективность. Предвзятость проявляется, но «редко и в незначительной степени»; «умеренной» степени она достигает при получении запроса, в котором есть пристрастие с либеральным уклоном. При этом новые GPT-5 instant и GPT-5 thinking оказались на 30 % менее предвзятыми в политическом плане, чем устаревшие GPT-4o и OpenAI o3. Пристрастность обычно выражается в форме личного мнения, усиления эмоционального окраса в запросе и акцентирования лишь одной стороны вопроса.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
AMD выпустила драйвер с поддержкой масштабирования FSR 4.1 на видеокартах Radeon RX 7000 3 ч.
Глобальный интернет столкнулся с масштабным сбоем из-за проблем в инфраструктуре Cloudflare 3 ч.
Эксперт Digital Foundry прояснил тайну «вампирского» колеса обозрения из GTA VI 3 ч.
Календарь релизов 22–28 июня: Star Fox, Empulse, Dark Scrolls и Dead or Alive 6 Last Round 4 ч.
«Всё в одном месте»: лаунчер Owlcat появился в Warhammer 40,000: Rogue Trader, но игра продолжит запускаться и без него 5 ч.
Ставка на ретро: Instagram запускает горизонтальное видео на телевизорах Samsung 5 ч.
Продажи инди-хита Meccha Chameleon превысили 7 миллионов копий менее чем за две недели — даже Resident Evil Requiem покупают не так быстро 5 ч.
Законопроект о регулировании ИИ в России кардинально сократили и упростили 5 ч.
AMD добавила официальную поддержку апскейлера FSR 4.1 видеокартам Radeon RX 7000 6 ч.
Регулирование российского ИИ сделают не таким строгим, как хотели вначале 7 ч.
Новая статья: Обзор Infinix GT 50 Pro: геймерский смартфон со встроенной СЖО 5 мин.
Компактный игровой ПК Steam Machine от Valve поступит в продажу 29 июня по цене от $1049 4 ч.
Asus и Acer урегулировали патентный спор с Nokia о технологиях аппаратного ускорения H.265 5 ч.
Квартальные продажи СХД подскочили почти на четверть, а доля All-Flash хранилищ впервые перевалила за 50 % 5 ч.
SpaceX запустила больше спутников, чем всё остальное человечество с 1957 года 8 ч.
Samsung ускорила достройку крупнейшего комплекса по производству памяти — мощности компании удвоятся 10 ч.
TSMC ускорила отказ от зрелых технологий ради миграции на передовые 11 ч.
Critical Energy привлекла $22 млн на строительство модульных геотермальных электростанций для ИИ ЦОД 11 ч.
Саудовская DataVolt строит в Узбекистане 12-МВт дата-центр стоимостью $150 млн 12 ч.
Intersect360: годовой объём мирового рынка ИИ-инфраструктур превысил $300 млрд 12 ч.