Сегодня 26 мая 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

ИИ-боты начинают чаще привирать, когда их просят о лаконичных ответах — исследование

Исследователи из французской компании Giskard, занимающейся тестированием искусственного интеллекта, пришли к выводу, что чем короче ответы ChatGPT и других ИИ-помощников, тем выше вероятность выдачи недостоверной информации. Такие запросы, как «ответь кратко» или «объясни в двух предложениях» заставляют модели привирать и быть неточными.

 Источник изображения: AI

Источник изображения: AI

Как пишет TechCrunch, в ходе исследования специалисты проанализировали поведение популярных языковых моделей, включая GPT-4o от OpenAI, Mistral Large и Claude 3.7 Sonnet от Anthropic и установили, что при запросах на краткие ответы, особенно по неоднозначным или спорным темам, модели чаще выдают ошибочную информацию. «Наши данные показывают, что даже простые изменения в инструкциях значительно влияют на склонность моделей к галлюцинациям», — отметили в Giskard.

Галлюцинации остаются одной из главных нерешённых проблем в области генеративного ИИ. Даже передовые модели, основанные на вероятностных алгоритмах, могут придумывать несуществующие факты. По словам авторов исследования, новые модели, ориентированные на рассуждение, такие как o3 от OpenAI, склонны к галлюцинациям даже чаще, чем их предшественники, что не может не снижать доверие к их ответам.

Отмечается, что одной из причин повышенной склонности к ошибкам является ограниченность пространства для объяснений. Когда модель просят быть краткой, она не может полностью раскрыть тему и опровергнуть ложные предпосылки в запросе. Однако этот момент очень важен для разработчиков кода, поскольку промпт, содержащий инструкцию типа «будь кратким» может навредить качеству ответа.

Кроме того, было замечено, что модели реже опровергают спорные утверждения, если их высказывают уверенно. Также оказалось, что те ИИ, которые пользователи чаще оценивают как удобные или приятные в общении, не всегда отличаются высокой степенью точности ответов.

Эксперты из Giskard советуют тщательнее подбирать инструкции для ИИ и избегать строгих ограничений на длину ответов. «Кажущиеся безобидными подсказки вроде "будь лаконичным" могут незаметно ухудшить качество информации», — предупреждают они.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Президент Ирана подписал указ о восстановлении подключения страны к интернету — после почти трёх месяцев блокировки 7 мин.
Попытка не пытка: после отмены Contraband разработчики Just Cause взялись за ещё одну игру-сервис 24 мин.
Гибкие настройки безопасности и новые инструменты для работы с шаблонами — «Базис» обновил конструктор Basis Automation Studio до версии 2.4 60 мин.
Гибкие настройки безопасности и новые инструменты для работы с шаблонами — «Базис» обновил конструктор Basis Automation Studio до версии 2.4 2 ч.
Симулятор жизни Paralives порадовал разработчиков продажами на старте раннего доступа Steam 2 ч.
ЕС готовится оштрафовать Google на рекордную сумму по итогам антимонопольного расследования 6 ч.
Accenture и OneView Commerce получили контракт на замену скандально известного ПО Fujitsu Horizon для Почты Великобритании 13 ч.
Tether выпустит цифровой грузинский лари совместно с правительством Грузии 14 ч.
Konami показала 50 минут геймплея Metal Gear Solid 4: Guns of the Patriots на PS5 — фанаты в восторге 16 ч.
Календарь релизов 25–31 мая: 007 First Light, Paralives, Mina the Hollower и WoT: Heat 17 ч.
Samsung разработала первый в мире прототип флеш-чипа 3D NAND с 900 слоями 9 мин.
Но есть и плюсы: OCP напомнила местным властям о возможности использования избыточнго тепла ЦОД 20 мин.
Новая статья: Своевременная доставка до последнего байта: как российская сеть Curator CDN совмещает скорость, безопасность и гибкость управления 58 мин.
Учёные впервые поймали гамма-лучи сверхъяркой сверхновой — их связали с рождением магнитара 59 мин.
MediaTek намекнула на выпуск первого чипа для Windows-ноутбуков в преддверии Computex 2026 6 ч.
Масштабный разворот внешнего ядра Земли, начавшийся в 2010 году, может оказаться временным явлением 6 ч.
Новая статья: Обзор и тест процессорного кулера PCCooler RZ700D: битва башен 10 ч.
Tryx представила жидкостный кулер Holo с голографическим дисплеем 11 ч.
Со своим можно: в РФ готовы разрешить строить ЦОД, если они самообеспечатся энергией 11 ч.
Совокупная мощность строящихся ЦОД в мире удвоилась всего за год и достигла 31,7 ГВт 12 ч.