Сегодня 12 октября 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

ChatGPT прошёл стресс-тест на политическую предвзятость, но не безупречно

OpenAI провела «стресс-тест» моделей искусственного интеллекта последнего поколения GPT-5 и установила, что они сильнее прочих приблизились к одной из важнейших её целей: «ChatGPT не должен быть политически предвзятым ни в одном направлении». Серию испытаний компания проводила несколько месяцев.

 Источник изображения: ilgmyzin / unsplash.com

Источник изображения: ilgmyzin / unsplash.com

В OpenAI разработали тест, который оценивает наличие у ChatGPT пристрастий при ответе на нейтральные вопросы, а также реакцию чат-бота с искусственным интеллектом, когда ему задают политически ангажированные вопросы. Компания задавала ChatGPT вопросы, связанные с сотней критически важных тем, таких как иммиграция или беременность, и сформулированных различными способами: с уклоном в либерализм и консерватизм, предвзято и нейтрально. В испытаниях участвовали четыре модели: преимущественно вышедшие из обращения GPT-4o и OpenAI o3, а также актуальные GPT-5 instant и GPT-5 thinking.

Полного списка тем и вопросов в компании не предоставили, но отметили, что они были взяты из повестки дня политических партий и относились к «культурно значимым вопросам». Анализ ответов проводила специально обученная модель ИИ — она оценивала их, исходя из критериев, которые в OpenAI отметили как признаки предвзятости. Например, если в ответе ChatGPT запрос или фрагмент запроса пользователя брался в кавычки, это могло свидетельствовать, что мнение этого пользователя обесценивается, а точка зрения — игнорируется. Выражения, усиливающие явно пристрастную политическую позицию пользователя, охарактеризовали как «эскалацию», которая также свидетельствует о предвзятости ИИ в ответах.

По итогам тестирования OpenAI сделала вывод, что её модели достаточно успешно сохраняют объективность. Предвзятость проявляется, но «редко и в незначительной степени»; «умеренной» степени она достигает при получении запроса, в котором есть пристрастие с либеральным уклоном. При этом новые GPT-5 instant и GPT-5 thinking оказались на 30 % менее предвзятыми в политическом плане, чем устаревшие GPT-4o и OpenAI o3. Пристрастность обычно выражается в форме личного мнения, усиления эмоционального окраса в запросе и акцентирования лишь одной стороны вопроса.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Пользователи ChatGPT снова могут удалять свои чаты безвозвратно 10 ч.
Арт-директор Halo покинул студию после 17 лет работы и намекнул на проблемы в команде разработчиков 11 ч.
Один из основателей ИИ-стартапа Thinking Machines переметнулся к Марку Цукербергу 13 ч.
Apple завершила поддержку своего бесплатного видеоредактора Clips 15 ч.
Новая статья: CloverPit — добро пожаловать в яму. Рецензия 22 ч.
Chrome сам будет блокировать уведомления с сайтов, которые пользователь игнорирует 11-10 14:40
ChatGPT прошёл стресс-тест на политическую предвзятость, но не безупречно 11-10 14:24
Telegram получил большое обновление: переписки в групповых звонках, комментарии к профилям и другие нововведения 11-10 11:57
Apple купит технологии компьютерного зрения и специалистов стартапа Prompt AI за «некоторую сумму» 11-10 11:01
На Apple подали в суд за обучение ИИ на пиратских копиях книг 11-10 08:06
США и Китай пошли к технологическому суверенитету схожими путями, но Америка пока отстаёт 2 ч.
ИИ спас США от рецессии, став единственным драйвером роста в 2025 году 7 ч.
Graphcore, спасённая SoftBank, воспрянула духом — штат в Великобритании удвоится, а в разработку в Индии инвестируют $1 млрд 7 ч.
В наши дни все высокопроизводительные вычисления связаны с ИИ, как считает глава AMD Лиза Су 14 ч.
Обострение между США и Китаем грозит серьёзным ударом по мировой индустрии чипов 16 ч.
Кембриджский университет запустил проект по спасению данных со старых дискет 21 ч.
Китай грозит отправить США в рецессию — новые санкции на редкоземельные металлы ударят по ИИ 22 ч.
Акции китайских чипмейкеров взлетели, но инвесторы опасаются перегрева рынка 22 ч.
Представлен складной смартфон Samsung W26 — особенная версия Galaxy Z Fold7 для Китая за $2390–2670 11-10 20:07
MSI создала видеокарту GeForce RTX 5080 Gaming Trio в стиле Battlefield 6, и отдаст её кому-то бесплатно 11-10 15:54