Сегодня 23 апреля 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

ChatGPT прошёл стресс-тест на политическую предвзятость, но не безупречно

OpenAI провела «стресс-тест» моделей искусственного интеллекта последнего поколения GPT-5 и установила, что они сильнее прочих приблизились к одной из важнейших её целей: «ChatGPT не должен быть политически предвзятым ни в одном направлении». Серию испытаний компания проводила несколько месяцев.

 Источник изображения: ilgmyzin / unsplash.com

Источник изображения: ilgmyzin / unsplash.com

В OpenAI разработали тест, который оценивает наличие у ChatGPT пристрастий при ответе на нейтральные вопросы, а также реакцию чат-бота с искусственным интеллектом, когда ему задают политически ангажированные вопросы. Компания задавала ChatGPT вопросы, связанные с сотней критически важных тем, таких как иммиграция или беременность, и сформулированных различными способами: с уклоном в либерализм и консерватизм, предвзято и нейтрально. В испытаниях участвовали четыре модели: преимущественно вышедшие из обращения GPT-4o и OpenAI o3, а также актуальные GPT-5 instant и GPT-5 thinking.

Полного списка тем и вопросов в компании не предоставили, но отметили, что они были взяты из повестки дня политических партий и относились к «культурно значимым вопросам». Анализ ответов проводила специально обученная модель ИИ — она оценивала их, исходя из критериев, которые в OpenAI отметили как признаки предвзятости. Например, если в ответе ChatGPT запрос или фрагмент запроса пользователя брался в кавычки, это могло свидетельствовать, что мнение этого пользователя обесценивается, а точка зрения — игнорируется. Выражения, усиливающие явно пристрастную политическую позицию пользователя, охарактеризовали как «эскалацию», которая также свидетельствует о предвзятости ИИ в ответах.

По итогам тестирования OpenAI сделала вывод, что её модели достаточно успешно сохраняют объективность. Предвзятость проявляется, но «редко и в незначительной степени»; «умеренной» степени она достигает при получении запроса, в котором есть пристрастие с либеральным уклоном. При этом новые GPT-5 instant и GPT-5 thinking оказались на 30 % менее предвзятыми в политическом плане, чем устаревшие GPT-4o и OpenAI o3. Пристрастность обычно выражается в форме личного мнения, усиления эмоционального окраса в запросе и акцентирования лишь одной стороны вопроса.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Половину программного кода Google уже пишет ИИ — и его станет больше 43 мин.
Британские антимонопольщики дали ход коллективному «облачному» иску к Microsoft на £2 млрд 2 ч.
Selectel выпустила обновлённую ИИ-платформу с расширенными возможностями масштабирования моделей и внедрения в бизнес-процессы 2 ч.
VAST Data привлекла $1 млрд в раунде финансирования серии F 2 ч.
«На 100 % ещё ничего не утверждено»: Owlcat ответила на критику бета-версии The Expanse: Osiris Reborn 3 ч.
Иран обвинил США в выводе из строя маршрутизаторов Cisco и других производителей через скрытые бэкдоры 4 ч.
Anthropic: у нас нет «рубильника» от ИИ-моделей Claude в секретных системах Пентагона 4 ч.
«Один из величайших хаков»: энтузиастка запустила современный Linux на Windows 95 4 ч.
Google превратила Chrome в «автоматический браузер» — полноценного работника среды Workspace 5 ч.
OpenAI добавила в ChatGPT ИИ-агентов для бизнеса — они выполняют задачи без участия человека 5 ч.
Xiaomi, Oppo, Vivo и Honor объединились для борьбы с перегревом и зависанием смартфонов 44 мин.
Bolt Graphics завершила проектирование графического чипа Zeus — он в разы превосходит RTX 5090 2 ч.
Nvidia до сих пор не поставила ни единого ускорителя H200 в Китай — их там не принимают 2 ч.
Популярность Galaxy S26 не спасёт мобильное подразделение Samsung от больших убытков в этом году 2 ч.
IonQ выпустила «квантовых котиков» в мир — раскрыла секреты создания безотказных квантовых компьютеров 2 ч.
Gartner: нефтяной кризис не затормозит IT-индустрию — в ИИ готовы вкладываться все 2 ч.
Война США и Ирана ударила по рынку чипов — возник дефицит сырья для литографии 3 ч.
Gigabyte представила мощный ноутбук Gaming A18 Pro с GeForce RTX 5080 для игр и ИИ 4 ч.
40 000 сотрудников Samsung вышли на протест, требуя премии до $400 000 в год 4 ч.
«Лаборатория Касперского» выявила аппаратную уязвимость в чипах Qualcomm Snapdragon 4 ч.