Сегодня 09 сентября 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

ИИ-боты начинают чаще привирать, когда их просят о лаконичных ответах — исследование

Исследователи из французской компании Giskard, занимающейся тестированием искусственного интеллекта, пришли к выводу, что чем короче ответы ChatGPT и других ИИ-помощников, тем выше вероятность выдачи недостоверной информации. Такие запросы, как «ответь кратко» или «объясни в двух предложениях» заставляют модели привирать и быть неточными.

 Источник изображения: AI

Источник изображения: AI

Как пишет TechCrunch, в ходе исследования специалисты проанализировали поведение популярных языковых моделей, включая GPT-4o от OpenAI, Mistral Large и Claude 3.7 Sonnet от Anthropic и установили, что при запросах на краткие ответы, особенно по неоднозначным или спорным темам, модели чаще выдают ошибочную информацию. «Наши данные показывают, что даже простые изменения в инструкциях значительно влияют на склонность моделей к галлюцинациям», — отметили в Giskard.

Галлюцинации остаются одной из главных нерешённых проблем в области генеративного ИИ. Даже передовые модели, основанные на вероятностных алгоритмах, могут придумывать несуществующие факты. По словам авторов исследования, новые модели, ориентированные на рассуждение, такие как o3 от OpenAI, склонны к галлюцинациям даже чаще, чем их предшественники, что не может не снижать доверие к их ответам.

Отмечается, что одной из причин повышенной склонности к ошибкам является ограниченность пространства для объяснений. Когда модель просят быть краткой, она не может полностью раскрыть тему и опровергнуть ложные предпосылки в запросе. Однако этот момент очень важен для разработчиков кода, поскольку промпт, содержащий инструкцию типа «будь кратким» может навредить качеству ответа.

Кроме того, было замечено, что модели реже опровергают спорные утверждения, если их высказывают уверенно. Также оказалось, что те ИИ, которые пользователи чаще оценивают как удобные или приятные в общении, не всегда отличаются высокой степенью точности ответов.

Эксперты из Giskard советуют тщательнее подбирать инструкции для ИИ и избегать строгих ограничений на длину ответов. «Кажущиеся безобидными подсказки вроде "будь лаконичным" могут незаметно ухудшить качество информации», — предупреждают они.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Продажи Ready or Not достигли 13 миллионов — на ПК игру продолжили покупать даже в разгар скандала с цензурой 12 ч.
Календарь релизов — 8–14 сентября: Borderlands 4, Shape of Dreams и Katanaut 13 ч.
Security Vision представила решение для защиты критической инфраструктуры малого и среднего бизнеса 13 ч.
Журналисты откопали концепт-арт версии ремейка Star Wars: Knights of the Old Republic, которая никогда не выйдет 13 ч.
Google добавила в Gemini поддержку аудиофайлов для всех платформ, включая iOS 14 ч.
Польские СМИ раскрыли стартовые продажи хоррора Cronos: The New Dawn от разработчиков ремейка Silent Hill 2 14 ч.
В MacBook нашёлся датчик угла наклона крышки — на нём создали симулятор скрипящей двери 17 ч.
Звезда Cyberpunk 2077 Киану Ривз «с удовольствием бы» сыграл Джонни Сильверхенда в Cyberpunk 2 17 ч.
Microsoft предоставила скидки госагентствам США на более чем $6 млрд 17 ч.
Hollow Knight: Silksong оказалась слишком сложной даже для фанатов первой части, и моддеры спешат на помощь 18 ч.
Intel заверила, что до полного отделения производства чипов не дойдёт — но почти половину продать может 9 мин.
«Непоправимый ущерб»: Nintendo отсудила $2 млн за продажу взломанных Switch 17 мин.
Дональд Трамп пообещал IT-гигантам решить проблемы с энергоснабжением ЦОД 47 мин.
В России поступил в продажу флагманский смартфон Huawei Pura 80 2 ч.
Американские регуляторы не будут признавать результаты сертификации ввозимой в США электроники от нескольких китайских лабораторий 2 ч.
Представлен электромобиль Polestar 5 — за 3,1 секунды до 100 км/ч и запас хода до 670 км по цене от $140 тысяч 3 ч.
В Intel — масштабные кадровые перестановки: сменились руководители клиентского и серверного сегментов 6 ч.
Лунную ракету SLS не отменят — Трамп и Конгресс США нащупали способ удешевить проект 9 ч.
Новая статья: Обзор PCIe 5.0-накопителя Patriot Viper PV593: история про баланс 9 ч.
Новая статья: Обзор смартфона Google Pixel 10: середнячок, возомнивший себя флагманом 11 ч.