Сегодня 04 февраля 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Исследование показало, что американские и китайские ИИ-модели часто перегибают с подхалимством

Наиболее популярные ИИ-модели из США и Китая, как показало исследование учёных Стэнфордского университета и коллег из Карнеги Меллон, склонны слишком сильно льстить пользователям и не всегда доносят до них объективную информацию. Руководствуясь советами чат-ботов, полученных таким образом, люди могут с меньшей вероятностью добиться установления гармоничных отношений между собой.

 Источник изображения: Nvidia

Источник изображения: Nvidia

Авторы исследования изучали, как 11 популярных больших языковых моделей отвечают на запросы пользователей, касающиеся межличностных взаимоотношений. Было установлено, что многие языковые модели склонны слишком часто соглашаться с пользователями в надежде им угодить. Например, выпущенная в декабре прошлого года DeepSeek V3 одобряла действия пользователей на 55 % чаще, чем живой собеседник. Для прочих моделей, попавших в выборку, средний показатель «превышения подхалимства над нормой» достигал 47 %.

Что характерно, авторы исследования за эталон человеческой реакции брали ответы пользователей со страниц Reddit, которые описывали оценку действий других людей в разного рода межличностных конфликтах. В качестве эталона выбирались те ситуации, в которых сообщество выступало с осуждением автора публикации, указывая на его неправоту. Эти же сценарии прогонялись через популярные большие языковые модели, и они гораздо чаще оправдывали совершивших те или иные проступки людей, чем живые собеседники. В исследовании использовались преимущественно публикации и обсуждения на английском языке.

Разработанная Alibaba языковая модель Qwen2.5-7B-Instruct вообще оказалась чемпионом подхалимства, оправдав проступки человека в 79 % случаев. На втором месте оказалась DeepSeek V3, которая оправдывала обсуждаемых людей в 76 % случаев. Американская Gemini 1.5 корпорации Google оправдала человека только в 18 % случаев. Из 11 протестированных моделей только две были разработаны в Китае, остальные были созданы в США, если не считать французскую Mistral.

Авторы исследования также пришли к выводу, что подхалимство чат-ботов снижает склонность людей к разрешению конфликтов полюбовно, поскольку вселяет в них ложное ощущение собственной правоты. На психическом здоровье пользователей больших языковых моделей такое подхалимство тоже сказывается не лучшим образом. При использовании ИИ в сфере бизнес-аналитики склонность к подхалимству тоже вредна, поскольку языковая модель стремится чаще соглашаться с аналитиком, чем следовало бы.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Стала известна дата «смерти» ChromeOS — Google обеспечит достойный срок поддержки угасающей ОС 60 мин.
Магазин Epic Games Store станет быстрее и удобнее для пользователей 2 ч.
В Steam и VK Play вышла демоверсия российского шутера Grimps с «плюшевым» насилием и креативным арсеналом 2 ч.
Драматичный трейлер подтвердил новую дату выхода Forgotlings — нарисованной вручную метроидвании в мире оживших потерянных вещей 3 ч.
The Outer Worlds 2 и Avowed не оправдали ожиданий Microsoft, но это не конец для Obsidian 4 ч.
PayPal обзавёлся новым гендиректором — это бывший глава HP Энрике Лорес 4 ч.
Тратили больше, играли меньше: Epic Games Store подвёл итоги 2025 года 5 ч.
Новым курсом: российские ИБ-вендоры изучают перспективы выхода на рынки Китая и Индии 6 ч.
Китай вырвался вперёд: в шестёрке лучших открытых ИИ-моделей в мире не осталось американских 6 ч.
Kingdom Come: Deliverance, High on Life 2, Avatar: Frontiers of Pandora: Microsoft раскрыла главные новинки Game Pass в первой половине февраля 6 ч.
Western Digital раскрыла сроки выпуска HDD на 100 Тбайт — модели на 40–44 Тбайт с HAMR уже почти готовы 2 ч.
В межзвёздной среде впервые нашли сложное соединение серы — ещё одно свидетельство космического происхождения органики 5 ч.
В Китае запретили электромобили с выдвижными дверными ручками 6 ч.
OpenAI не устроили чипы NVIDIA для инференса, теперь она ищет альтернативы 7 ч.
Apple захватила 69 % американского рынка смартфонов — у Samsung в пять раз меньше 8 ч.
Xiaomi выпустила на глобальный рынок 27-дюймовый 200-Гц FHD-монитор G27i 2026 за $157 9 ч.
«Шоковая заморозка» для серверов: китайские учёные научились охлаждать системы ИИ за 20 секунд без фреона 9 ч.
Сделка на триллион с четвертью: SpaceX приобрела xAI 9 ч.
«Байкал Электроникс» открыл свободный доступ к документации на серийный микроконтроллер Baikal-U 10 ч.
Спутник-платформа RuVDS для разработки космического ПО успешно выведен на орбиту 10 ч.