Сегодня 31 июля 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

ИИ-боты начинают чаще привирать, когда их просят о лаконичных ответах — исследование

Исследователи из французской компании Giskard, занимающейся тестированием искусственного интеллекта, пришли к выводу, что чем короче ответы ChatGPT и других ИИ-помощников, тем выше вероятность выдачи недостоверной информации. Такие запросы, как «ответь кратко» или «объясни в двух предложениях» заставляют модели привирать и быть неточными.

 Источник изображения: AI

Источник изображения: AI

Как пишет TechCrunch, в ходе исследования специалисты проанализировали поведение популярных языковых моделей, включая GPT-4o от OpenAI, Mistral Large и Claude 3.7 Sonnet от Anthropic и установили, что при запросах на краткие ответы, особенно по неоднозначным или спорным темам, модели чаще выдают ошибочную информацию. «Наши данные показывают, что даже простые изменения в инструкциях значительно влияют на склонность моделей к галлюцинациям», — отметили в Giskard.

Галлюцинации остаются одной из главных нерешённых проблем в области генеративного ИИ. Даже передовые модели, основанные на вероятностных алгоритмах, могут придумывать несуществующие факты. По словам авторов исследования, новые модели, ориентированные на рассуждение, такие как o3 от OpenAI, склонны к галлюцинациям даже чаще, чем их предшественники, что не может не снижать доверие к их ответам.

Отмечается, что одной из причин повышенной склонности к ошибкам является ограниченность пространства для объяснений. Когда модель просят быть краткой, она не может полностью раскрыть тему и опровергнуть ложные предпосылки в запросе. Однако этот момент очень важен для разработчиков кода, поскольку промпт, содержащий инструкцию типа «будь кратким» может навредить качеству ответа.

Кроме того, было замечено, что модели реже опровергают спорные утверждения, если их высказывают уверенно. Также оказалось, что те ИИ, которые пользователи чаще оценивают как удобные или приятные в общении, не всегда отличаются высокой степенью точности ответов.

Эксперты из Giskard советуют тщательнее подбирать инструкции для ИИ и избегать строгих ограничений на длину ответов. «Кажущиеся безобидными подсказки вроде "будь лаконичным" могут незаметно ухудшить качество информации», — предупреждают они.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Инсайдер раскрыл планы Electronic Arts на открытую «бету» Battlefield 6 — когда тестирование и как получить ранний доступ 3 ч.
«Абсолютно нормальное» обновление на радость фанатам добавило в инди-хит Peak каннибализм 5 ч.
Google выпустила экстренное обновление для Chrome, закрывшее опасную уязвимость 6 ч.
Devil May Cry 5 стала самой продаваемой игрой квартала для Capcom, а Monster Hunter Wilds весь запал растеряла 6 ч.
ИИ-приложения захватили смартфоны и удвоили выручку — ChatGPT уже дышит в затылок Google 6 ч.
Google заявила, что Великобритания не требовала от неё создать бэкдор в облаке — в отличие от Apple 7 ч.
Тысячи камер Hikvision остаются уязвимы ко взлому почти год — доступ к ним активно продают в даркнете 7 ч.
TikTok запустил систему проверки фактов и новые инструменты родительского контроля 8 ч.
Генерация кадров и востребованные функции: для Clair Obscur: Expedition 33 вышло крупное обновление 8 ч.
Завтра пройдёт презентация Nintendo Direct: Partner Showcase — фанаты ждут Hollow Knight: Silksong и Red Dead Redemption 2 8 ч.
Макеты всех версий iPhone 17 показались на фото в новых цветах — оранжевый Pro стал сюрпризом 45 мин.
Новая статья: Система жидкостного охлаждения Arctic Liquid Freezer III Pro 360 A-RGB: новые вентиляторы — и точка 2 ч.
Видео: австрийский одноместный электровертолёт eCopter впервые полетал без привязи 3 ч.
AOC представила 610-Гц киберспортивные мониторы Agon Pro CS24A и Agon Pro AG246FK6 5 ч.
Apple случайно прорекламировала Samsung Galaxy Z Flip7 6 ч.
Минюст США посягнул на качества, которые делают iPhone уникальным — Apple ответила на громкий иск 7 ч.
Житель Аризоны украл оборудования с вышек сотовой связи на полмиллиона долларов 8 ч.
В Москве протестировали 5G-антенну российского производства — она обеспечила 1 Гбит/с 9 ч.
Pixel 10 станет первым флагманом Google с магнитной зарядкой Qi2, если слухи и утечки не врут 9 ч.
Microsoft выпустила Smurface Laptop — спецверсию Surface Laptop с синим лого и изображениями смурфов 9 ч.