Сегодня 16 мая 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

ИИ-боты начинают чаще привирать, когда их просят о лаконичных ответах — исследование

Исследователи из французской компании Giskard, занимающейся тестированием искусственного интеллекта, пришли к выводу, что чем короче ответы ChatGPT и других ИИ-помощников, тем выше вероятность выдачи недостоверной информации. Такие запросы, как «ответь кратко» или «объясни в двух предложениях» заставляют модели привирать и быть неточными.

 Источник изображения: AI

Источник изображения: AI

Как пишет TechCrunch, в ходе исследования специалисты проанализировали поведение популярных языковых моделей, включая GPT-4o от OpenAI, Mistral Large и Claude 3.7 Sonnet от Anthropic и установили, что при запросах на краткие ответы, особенно по неоднозначным или спорным темам, модели чаще выдают ошибочную информацию. «Наши данные показывают, что даже простые изменения в инструкциях значительно влияют на склонность моделей к галлюцинациям», — отметили в Giskard.

Галлюцинации остаются одной из главных нерешённых проблем в области генеративного ИИ. Даже передовые модели, основанные на вероятностных алгоритмах, могут придумывать несуществующие факты. По словам авторов исследования, новые модели, ориентированные на рассуждение, такие как o3 от OpenAI, склонны к галлюцинациям даже чаще, чем их предшественники, что не может не снижать доверие к их ответам.

Отмечается, что одной из причин повышенной склонности к ошибкам является ограниченность пространства для объяснений. Когда модель просят быть краткой, она не может полностью раскрыть тему и опровергнуть ложные предпосылки в запросе. Однако этот момент очень важен для разработчиков кода, поскольку промпт, содержащий инструкцию типа «будь кратким» может навредить качеству ответа.

Кроме того, было замечено, что модели реже опровергают спорные утверждения, если их высказывают уверенно. Также оказалось, что те ИИ, которые пользователи чаще оценивают как удобные или приятные в общении, не всегда отличаются высокой степенью точности ответов.

Эксперты из Giskard советуют тщательнее подбирать инструкции для ИИ и избегать строгих ограничений на длину ответов. «Кажущиеся безобидными подсказки вроде "будь лаконичным" могут незаметно ухудшить качество информации», — предупреждают они.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Новая статья: Mixtape — воспоминания никто не отнимет. Рецензия 12 ч.
Google начнёт наказывать сайты за накрутку попаданий в ИИ-ответы 12 ч.
Московский суд оштрафовал владельца Deus Ex, Metro и Kingdom Come: Deliverance за отказ локализовать данные россиян 13 ч.
Спринт, торговля и продолжение сюжета: разработчики Subnautica 2 раскрыли план улучшения игры на ближайшие месяцы 16 ч.
ChatGPT получит прямой доступ к банковским счетам пользователей — для анализа расходов и финансовых советов 16 ч.
Трамп и Си Цзиньпин обсудили ограничения слишком умного ИИ и зависшие поставки Nvidia H200 16 ч.
Microsoft намерена избавить Windows 11 от главной причины «синих экранов» 17 ч.
Доминирование ChatGPT пошатнулось — Gemini и Perplexity быстро набирают обороты 17 ч.
Pragmata стала новой жертвой пиратов — игру взломали без гипервизора 17 ч.
YouTube Shorts набрали популярность на смарт-телевизорах — 2 млрд часов просмотра за месяц 18 ч.
Китай и США не заключили крупных сделок в технологическом секторе — это запустило распродажу акций производителей чипов 8 мин.
Apple тестирует производство чипов для iPhone на мощностях Intel 8 мин.
Китайские ИТ-гиганты ускорили переход на отечественные ИИ-ускорители, несмотря на возможное возвращение Nvidia 11 мин.
Дженсен Хуанг стал героем китайских соцсетей, перекусив лапшой и мороженым прямо на пекинской улице 2 ч.
Tesla сняла гриф секретности с отчётов о ДТП с участием своих роботакси 3 ч.
ArXiv запретила учёным загружать статьи, сгенерированные нейросетями — за это предусмотрен бан на один год 3 ч.
DJI анонсировала в Каннах карманную кинокамеру Osmo Pocket 4P 11 ч.
OpenAI перестраивается вокруг ИИ-агентов в рамках подготовки к IPO — ChatGPT и Codex объединят в единую платформу 11 ч.
Зонд Mars Express показал «хаос и кратеры», образовавшиеся в результате древних наводнений на Марсе 11 ч.
Asus и T1 выпустили лимитированные GeForce RTX для фанатов League of Legends 13 ч.