Сегодня 02 марта 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Исследование показало, что американские и китайские ИИ-модели часто перегибают с подхалимством

Наиболее популярные ИИ-модели из США и Китая, как показало исследование учёных Стэнфордского университета и коллег из Карнеги Меллон, склонны слишком сильно льстить пользователям и не всегда доносят до них объективную информацию. Руководствуясь советами чат-ботов, полученных таким образом, люди могут с меньшей вероятностью добиться установления гармоничных отношений между собой.

 Источник изображения: Nvidia

Источник изображения: Nvidia

Авторы исследования изучали, как 11 популярных больших языковых моделей отвечают на запросы пользователей, касающиеся межличностных взаимоотношений. Было установлено, что многие языковые модели склонны слишком часто соглашаться с пользователями в надежде им угодить. Например, выпущенная в декабре прошлого года DeepSeek V3 одобряла действия пользователей на 55 % чаще, чем живой собеседник. Для прочих моделей, попавших в выборку, средний показатель «превышения подхалимства над нормой» достигал 47 %.

Что характерно, авторы исследования за эталон человеческой реакции брали ответы пользователей со страниц Reddit, которые описывали оценку действий других людей в разного рода межличностных конфликтах. В качестве эталона выбирались те ситуации, в которых сообщество выступало с осуждением автора публикации, указывая на его неправоту. Эти же сценарии прогонялись через популярные большие языковые модели, и они гораздо чаще оправдывали совершивших те или иные проступки людей, чем живые собеседники. В исследовании использовались преимущественно публикации и обсуждения на английском языке.

Разработанная Alibaba языковая модель Qwen2.5-7B-Instruct вообще оказалась чемпионом подхалимства, оправдав проступки человека в 79 % случаев. На втором месте оказалась DeepSeek V3, которая оправдывала обсуждаемых людей в 76 % случаев. Американская Gemini 1.5 корпорации Google оправдала человека только в 18 % случаев. Из 11 протестированных моделей только две были разработаны в Китае, остальные были созданы в США, если не считать французскую Mistral.

Авторы исследования также пришли к выводу, что подхалимство чат-ботов снижает склонность людей к разрешению конфликтов полюбовно, поскольку вселяет в них ложное ощущение собственной правоты. На психическом здоровье пользователей больших языковых моделей такое подхалимство тоже сказывается не лучшим образом. При использовании ИИ в сфере бизнес-аналитики склонность к подхалимству тоже вредна, поскольку языковая модель стремится чаще соглашаться с аналитиком, чем следовало бы.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Российский рынок видеопиратства сократился на 5,5 % по итогам 2025 года 2 ч.
Бутерброд раздора: спор о торговой марке вынудил Take-Two впервые за 18 лет обновить данные о продажах GTA: Vice City Stories 3 ч.
ChatGPT подвергли «отмене» за сотрудничество OpenAI с Пентагоном 3 ч.
Обновление Telegram 12.5: теги для людей в чате, запрет пересылки сообщений, стикеры из фото 4 ч.
Инсайдеры: FromSoftware забраковала ремейк Bloodborne от Bluepoint из-за ремейка Demon’s Souls 4 ч.
«Чертовски большой. Почти что сиквел»: режиссёр Doom: The Dark Ages заинтриговал фанатов подробностями «первого и последнего» DLC 5 ч.
Распространение Windows 11 ускорилось — доля ОС превысила 72 % 5 ч.
Слухи: Ubisoft выпустит режиссёрскую версию Watch Dogs: Legion с новым контентом 6 ч.
И не звони мне больше: Microsoft представила по-настоящему автономное частное облако Azure Local 7 ч.
Инсайдер раскрыл подробности новой франшизы во вселенной God of War — в главной роли будет не Кратос и даже не Атрей 7 ч.
AMD представила мобильные Ryzen AI Pro 400 для корпоративных ноутбуков и мобильных рабочих станций 13 мин.
NVIDIA, Ericsson, Nokia и партнёры займутся развитием 6G с использованием ИИ и открытых платформ 2 ч.
В США появился Институт дата-центров следующего поколения для решения проблем питания и охлаждения ИИ ЦОД будущего 2 ч.
Контрабандисты открыто закупали в США партии ИИ-ускорителей Nvidia для поставок в Китай, выяснило следствие 2 ч.
Ещё одна причина, почему SSD дорожают: Phison стала требовать предоплату за контроллеры 3 ч.
Представлен игровой планшет Lenovo Legion Tab Gen 5 3 ч.
Облако AWS пострадало от «удара объектов по ЦОД» в ОАЭ, приведшего к пожару 4 ч.
Среди зарубежных фабрик TSMC самыми доходными остаются китайские, а вот японская работает в убыток 4 ч.
Смартфон Motorola Edge 70 Fusion оснастили изогнутым 144-Гц дисплеем и чипом Snapdragon 7s Gen 3 4 ч.
Team Group анонсировала новые индустриальные NVMe SSD и модули памяти 4 ч.