Сегодня 10 июня 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

ИИ-боты начинают чаще привирать, когда их просят о лаконичных ответах — исследование

Исследователи из французской компании Giskard, занимающейся тестированием искусственного интеллекта, пришли к выводу, что чем короче ответы ChatGPT и других ИИ-помощников, тем выше вероятность выдачи недостоверной информации. Такие запросы, как «ответь кратко» или «объясни в двух предложениях» заставляют модели привирать и быть неточными.

 Источник изображения: AI

Источник изображения: AI

Как пишет TechCrunch, в ходе исследования специалисты проанализировали поведение популярных языковых моделей, включая GPT-4o от OpenAI, Mistral Large и Claude 3.7 Sonnet от Anthropic и установили, что при запросах на краткие ответы, особенно по неоднозначным или спорным темам, модели чаще выдают ошибочную информацию. «Наши данные показывают, что даже простые изменения в инструкциях значительно влияют на склонность моделей к галлюцинациям», — отметили в Giskard.

Галлюцинации остаются одной из главных нерешённых проблем в области генеративного ИИ. Даже передовые модели, основанные на вероятностных алгоритмах, могут придумывать несуществующие факты. По словам авторов исследования, новые модели, ориентированные на рассуждение, такие как o3 от OpenAI, склонны к галлюцинациям даже чаще, чем их предшественники, что не может не снижать доверие к их ответам.

Отмечается, что одной из причин повышенной склонности к ошибкам является ограниченность пространства для объяснений. Когда модель просят быть краткой, она не может полностью раскрыть тему и опровергнуть ложные предпосылки в запросе. Однако этот момент очень важен для разработчиков кода, поскольку промпт, содержащий инструкцию типа «будь кратким» может навредить качеству ответа.

Кроме того, было замечено, что модели реже опровергают спорные утверждения, если их высказывают уверенно. Также оказалось, что те ИИ, которые пользователи чаще оценивают как удобные или приятные в общении, не всегда отличаются высокой степенью точности ответов.

Эксперты из Giskard советуют тщательнее подбирать инструкции для ИИ и избегать строгих ограничений на длину ответов. «Кажущиеся безобидными подсказки вроде "будь лаконичным" могут незаметно ухудшить качество информации», — предупреждают они.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
THQ Nordic заинтриговала фанатов тизером «самого большого и эпичного» обновления в истории Titan Quest 2 3 мин.
iPhone 17 получит урезанную Siri AI в iOS 27 из-за нехватки оперативной памяти 30 мин.
Неизвестные опубликовали исходный код червя Miasma, и тот атаковал GitHub 33 мин.
Honor научила смартфоны подсовывать приложениям фальшивые данные вместо личных — Google может её завернуть 2 ч.
Безумное приключение про одержимую монахиню Indika привлекло миллион игроков 2 ч.
Юристы обеих сторон в судебном разбирательстве сослались на выдумки ИИ — наказали всех 3 ч.
Ежемесячное обновление Windows установится не на все ПК, предупредила Microsoft 4 ч.
Waymo создала виртуального водителя, чтобы тестировать реакцию автопилота на дорожные инциденты 5 ч.
Новый релиз Basis Dynamix Enterprise 4.6: автоматическая балансировка нагрузки, связанные клоны и поддержка современных протоколов работы с СХД 5 ч.
В 2025 году российский рынок инфраструктурных облачных сервисов вырос почти на треть 5 ч.
Компактная 8K-камера Insta360 Luna Ultra с подвесом и объективом Leica Summicron дебютировала по цене $770 31 мин.
Акции Apple упали после крупных анонсов — возможно, не по её вине 2 ч.
Санкции на сертификат: Let’s Encrypt перестанет работать с недружественными США странами, лицами и организациями 4 ч.
Представлен GL.iNet Comet X — стоечный KVM с возможностью управления четырьмя серверами 4 ч.
AST SpaceMobile объявила сроки запуска гигантских интернет-спутников BlueBird 8, 9 и 10 4 ч.
Со следующего месяца Lenovo поднимет цены на ПК — второй раз с начала года 5 ч.
Представлены доступные смартфоны OnePlus Turbo 6X и 6X Pro с батареями до 8000 мА·ч 5 ч.
Выручка TSMC в мае подскочила на 30 %, подогреваемая ИИ-бумом 6 ч.
Китай готовится потратить $295 млрд на строительство ИИ-инфраструктуры по всей стране 6 ч.
Машины с одним лишь ДВС выбыли из пятёрки самых популярных в Китае легковушек по итогам мая 6 ч.