Сегодня 28 января 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

ИИ-боты начинают чаще привирать, когда их просят о лаконичных ответах — исследование

Исследователи из французской компании Giskard, занимающейся тестированием искусственного интеллекта, пришли к выводу, что чем короче ответы ChatGPT и других ИИ-помощников, тем выше вероятность выдачи недостоверной информации. Такие запросы, как «ответь кратко» или «объясни в двух предложениях» заставляют модели привирать и быть неточными.

 Источник изображения: AI

Источник изображения: AI

Как пишет TechCrunch, в ходе исследования специалисты проанализировали поведение популярных языковых моделей, включая GPT-4o от OpenAI, Mistral Large и Claude 3.7 Sonnet от Anthropic и установили, что при запросах на краткие ответы, особенно по неоднозначным или спорным темам, модели чаще выдают ошибочную информацию. «Наши данные показывают, что даже простые изменения в инструкциях значительно влияют на склонность моделей к галлюцинациям», — отметили в Giskard.

Галлюцинации остаются одной из главных нерешённых проблем в области генеративного ИИ. Даже передовые модели, основанные на вероятностных алгоритмах, могут придумывать несуществующие факты. По словам авторов исследования, новые модели, ориентированные на рассуждение, такие как o3 от OpenAI, склонны к галлюцинациям даже чаще, чем их предшественники, что не может не снижать доверие к их ответам.

Отмечается, что одной из причин повышенной склонности к ошибкам является ограниченность пространства для объяснений. Когда модель просят быть краткой, она не может полностью раскрыть тему и опровергнуть ложные предпосылки в запросе. Однако этот момент очень важен для разработчиков кода, поскольку промпт, содержащий инструкцию типа «будь кратким» может навредить качеству ответа.

Кроме того, было замечено, что модели реже опровергают спорные утверждения, если их высказывают уверенно. Также оказалось, что те ИИ, которые пользователи чаще оценивают как удобные или приятные в общении, не всегда отличаются высокой степенью точности ответов.

Эксперты из Giskard советуют тщательнее подбирать инструкции для ИИ и избегать строгих ограничений на длину ответов. «Кажущиеся безобидными подсказки вроде "будь лаконичным" могут незаметно ухудшить качество информации», — предупреждают они.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
«Средневековая Богемия ещё никогда не была такой красивой»: PS Store «засветил» подробности ремастера Kingdom Come: Deliverance для PS5 59 мин.
Google заплатит $135 млн за тайный сбор данных пользователей Android и больше не будет «шпионить» без спроса 3 ч.
Литовский маркетплейс рассекретил статуэтку по ремейку Assassin’s Creed IV: Black Flag — Ubisoft отреагировала мемом из GTA: San Andreas 4 ч.
Открытая игра без открытого мира: новые подробности амбициозного ролевого боевика Control Resonant от создателей Alan Wake 2 4 ч.
Microsoft улучшила бесшовный перенос приложений между Android и Windows 11 6 ч.
План «Б» для стареющего Linux: у сообщества появился план на случай ухода Линуса Торвальдса 6 ч.
Спустя почти год CD Projekt Red вернула карточную ролевую игру «Кровная вражда: Ведьмак. Истории» на iOS и Android 6 ч.
Google: хакеры до сих пор активно используют уже закрытую уязвимость WinRAR для взлома Windows 6 ч.
Настольный Microsoft Excel получил режим ИИ-агента — он сам заполняет таблицы, исправляет формулы и не только 6 ч.
Психологический триллер The Alighieri Circle: Dante’s Bloodline превратит «Божественную комедию» в симулятор ходьбы 6 ч.
Японская ракета потеряла спутник по пути на орбиту — он просто свалился с неё 2 ч.
Cooler Master показала огромную СЖО для 2000-Вт чипов — у неё четыре 180-мм вентилятора 2 ч.
В 2025 году электромобили впервые обогнали по продажам автомобили с ДВС в Европе 4 ч.
Недорогая разработка японских учёных превратила смартфон в точный детектор радиации 4 ч.
В России начались продажи смартфонов Redmi Note 15 5 ч.
Идея полувековой давности вдохновила на реалистичный проект дата-центра на орбите 5 ч.
Обзоры AMD Ryzen 7 9850X3D — действительно самый быстрый игровой CPU, но разница с Ryzen 7 9800X3D минимальная 5 ч.
Подглядеть не получится: Samsung сделает уведомления на экране смартфона невидимыми для посторонних 5 ч.
TD Cowen: американские банки расхотели давать в долг Oracle из-за её сделок с OpenAI 6 ч.
Магазины в США начали убирать модули DDR5 и видеокарты из витринных ПК, потому что их теперь часто воруют 7 ч.