Сегодня 21 ноября 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Исследование показало, что американские и китайские ИИ-модели часто перегибают с подхалимством

Наиболее популярные ИИ-модели из США и Китая, как показало исследование учёных Стэнфордского университета и коллег из Карнеги Меллон, склонны слишком сильно льстить пользователям и не всегда доносят до них объективную информацию. Руководствуясь советами чат-ботов, полученных таким образом, люди могут с меньшей вероятностью добиться установления гармоничных отношений между собой.

 Источник изображения: Nvidia

Источник изображения: Nvidia

Авторы исследования изучали, как 11 популярных больших языковых моделей отвечают на запросы пользователей, касающиеся межличностных взаимоотношений. Было установлено, что многие языковые модели склонны слишком часто соглашаться с пользователями в надежде им угодить. Например, выпущенная в декабре прошлого года DeepSeek V3 одобряла действия пользователей на 55 % чаще, чем живой собеседник. Для прочих моделей, попавших в выборку, средний показатель «превышения подхалимства над нормой» достигал 47 %.

Что характерно, авторы исследования за эталон человеческой реакции брали ответы пользователей со страниц Reddit, которые описывали оценку действий других людей в разного рода межличностных конфликтах. В качестве эталона выбирались те ситуации, в которых сообщество выступало с осуждением автора публикации, указывая на его неправоту. Эти же сценарии прогонялись через популярные большие языковые модели, и они гораздо чаще оправдывали совершивших те или иные проступки людей, чем живые собеседники. В исследовании использовались преимущественно публикации и обсуждения на английском языке.

Разработанная Alibaba языковая модель Qwen2.5-7B-Instruct вообще оказалась чемпионом подхалимства, оправдав проступки человека в 79 % случаев. На втором месте оказалась DeepSeek V3, которая оправдывала обсуждаемых людей в 76 % случаев. Американская Gemini 1.5 корпорации Google оправдала человека только в 18 % случаев. Из 11 протестированных моделей только две были разработаны в Китае, остальные были созданы в США, если не считать французскую Mistral.

Авторы исследования также пришли к выводу, что подхалимство чат-ботов снижает склонность людей к разрешению конфликтов полюбовно, поскольку вселяет в них ложное ощущение собственной правоты. На психическом здоровье пользователей больших языковых моделей такое подхалимство тоже сказывается не лучшим образом. При использовании ИИ в сфере бизнес-аналитики склонность к подхалимству тоже вредна, поскольку языковая модель стремится чаще соглашаться с аналитиком, чем следовало бы.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Clair Obscur: Expedition 33 повторила рекорд Baldur’s Gate 3 и не оставила шанса конкурентам — итоги Golden Joystick Awards 2025 2 ч.
В Steam и на консолях без предупреждения вышел беспощадный хоррор на выживание Total Chaos от автора Turbo Overkill 3 ч.
Google выпустила Nano Banana Pro — «ИИ-фотошоп», который делает 4K-картинки, правит детали и даже меняет освещение 3 ч.
Google Gemini научился определять изображения, созданные с помощью ИИ, но пока не все 3 ч.
Сицилийское кино, фоторежим и новый контент: для Mafia: The Old Country вышло крупное обновление «Прогулка» 4 ч.
Pornhub призвал Apple, Google и Microsoft встроить проверку возраста прямо в смартфоны и ПК 6 ч.
За несколько часов до официального анонса THQ Nordic проговорилась о дате выхода Reanimal — кооперативного хоррора от авторов Little Nightmares 6 ч.
Спустя всего месяц Battlefield 6 вырвалась в лидеры самых продаваемых игр за 2025 год в США 6 ч.
Spotify анонсировала функцию SongDNA — она расскажет о сэмплах в треке и каверах на него 7 ч.
Капитализация криптовалютного рынка рухнула на триллион долларов из-за падения биткоина 8 ч.
Новая статья: Уйти от CISC — пойти на RISC: начало 43 мин.
Производитель смарт-колец Oura Ring подал в суд на Samsung, Amazfit и других за кражу разработок 5 ч.
IBM и Cisco к концу 30-х годов создадут интернет для котов Шрёдингера — квантовый и запутанный 5 ч.
Leica представила камеру Q3 Monochrom исключительно для чёрно-белой съёмки — и она на $1055 дороже цветной версии 6 ч.
Redragon выпустила Impact M908 SE — игровую мышь за $33 с 18 программируемыми кнопками для поклонников MMO 7 ч.
Intel подтвердила, что представит процессоры Core Ultra 300 на выставке CES 2026 в январе 7 ч.
Nokia меняет стратегию развития, сделав ставку на ИИ, ЦОД и 6G 7 ч.
Nvidia зарабатывает $4,4 млн на сотрудника — Netflix и Apple тоже в топе 8 ч.
Brookfield, NVIDIA и партнёры направят $100 млрд на развитие ИИ-инфраструктуры и энергетики 9 ч.
Sunday представила похожего на лего-человечка робота Memo — он умеет загружать посудомойку и не только 9 ч.