Сегодня 15 июня 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

ИИ-боты начинают чаще привирать, когда их просят о лаконичных ответах — исследование

Исследователи из французской компании Giskard, занимающейся тестированием искусственного интеллекта, пришли к выводу, что чем короче ответы ChatGPT и других ИИ-помощников, тем выше вероятность выдачи недостоверной информации. Такие запросы, как «ответь кратко» или «объясни в двух предложениях» заставляют модели привирать и быть неточными.

 Источник изображения: AI

Источник изображения: AI

Как пишет TechCrunch, в ходе исследования специалисты проанализировали поведение популярных языковых моделей, включая GPT-4o от OpenAI, Mistral Large и Claude 3.7 Sonnet от Anthropic и установили, что при запросах на краткие ответы, особенно по неоднозначным или спорным темам, модели чаще выдают ошибочную информацию. «Наши данные показывают, что даже простые изменения в инструкциях значительно влияют на склонность моделей к галлюцинациям», — отметили в Giskard.

Галлюцинации остаются одной из главных нерешённых проблем в области генеративного ИИ. Даже передовые модели, основанные на вероятностных алгоритмах, могут придумывать несуществующие факты. По словам авторов исследования, новые модели, ориентированные на рассуждение, такие как o3 от OpenAI, склонны к галлюцинациям даже чаще, чем их предшественники, что не может не снижать доверие к их ответам.

Отмечается, что одной из причин повышенной склонности к ошибкам является ограниченность пространства для объяснений. Когда модель просят быть краткой, она не может полностью раскрыть тему и опровергнуть ложные предпосылки в запросе. Однако этот момент очень важен для разработчиков кода, поскольку промпт, содержащий инструкцию типа «будь кратким» может навредить качеству ответа.

Кроме того, было замечено, что модели реже опровергают спорные утверждения, если их высказывают уверенно. Также оказалось, что те ИИ, которые пользователи чаще оценивают как удобные или приятные в общении, не всегда отличаются высокой степенью точности ответов.

Эксперты из Giskard советуют тщательнее подбирать инструкции для ИИ и избегать строгих ограничений на длину ответов. «Кажущиеся безобидными подсказки вроде "будь лаконичным" могут незаметно ухудшить качество информации», — предупреждают они.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
В Великобритании полицейского уличили в фальсификации доказательств преступлений с помощью ИИ 5 ч.
«Кто купит Xbox и Game Pass ради Gears?»: инсайдер рассекретил «безумный» бюджет Gears of War: E-Day 5 ч.
Anthropic проведёт переговоры с властями США для разблокировки ИИ-моделей Mythos 5 и Fable 5 6 ч.
Авторитетный инсайдер подтвердил, когда выйдет God of War Laufey 6 ч.
Журналисты раскрыли подробности неанонсированного кооперативного ролевого боевика по «Ведьмаку» 7 ч.
Власти США заподозрили Китай в несанкционированном доступе к модели Mythos компании Anthropic 10 ч.
К сентябрю Apple подготовит ряд новых функций для iOS 27 11 ч.
Блокировщики рекламы не перестанут работать в Google Chrome после прекращения поддержки Manifest V2 14-06 16:54
Отключить доступ иностранцев к передовым моделям Anthropic пришлось по наводке главы Amazon 14-06 07:23
Новая статья: Fatekeeper — наконец-то Dark Messiah 2? Предварительный обзор 14-06 00:05
Китайский автопроизводитель Seres представил человекоподобного робота Xiaosai — он умеет поддерживать беседу 4 мин.
ByteDance ведёт переговоры о покупке китайских ИИ-ускорителей Iluvatar CoreX и Baidu 14 мин.
Dreame H16 Pro Steam и Dreame Z40 TangleCut Flex+: какой пылесос выбрать — моющий или для сухой уборки? 2 ч.
Дата-центры Amazon «выпили» почти 9,5 млн кубометров воды в 2025 году 2 ч.
К концу года SK hynix намерена начать массовое производство 375-слойной памяти 3D NAND 2 ч.
SteamOS научили работать с процессорами Intel и настольной видеокартой Arc B580 4 ч.
Pinterest заключила с AWS самую крупную инфраструктурную сделку, планируя потратить $4 млрд на облачные сервисы, Graviton и Trainium 4 ч.
В Сингапуре запущен суперкомпьютер ASPIRE 2B на базе NVIDIA H200 и AMD EPYC Turin с быстродействие 115 Пфлопс 5 ч.
Helix Digital Infrastructure привлекла более $10 млрд на строительство ИИ-инфраструктуры «под ключ» 5 ч.
Tesla заподозрили в искажении данных о безопасности автопилота для европейских регуляторов 5 ч.