Сегодня 21 апреля 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

ИИ-боты начинают чаще привирать, когда их просят о лаконичных ответах — исследование

Исследователи из французской компании Giskard, занимающейся тестированием искусственного интеллекта, пришли к выводу, что чем короче ответы ChatGPT и других ИИ-помощников, тем выше вероятность выдачи недостоверной информации. Такие запросы, как «ответь кратко» или «объясни в двух предложениях» заставляют модели привирать и быть неточными.

 Источник изображения: AI

Источник изображения: AI

Как пишет TechCrunch, в ходе исследования специалисты проанализировали поведение популярных языковых моделей, включая GPT-4o от OpenAI, Mistral Large и Claude 3.7 Sonnet от Anthropic и установили, что при запросах на краткие ответы, особенно по неоднозначным или спорным темам, модели чаще выдают ошибочную информацию. «Наши данные показывают, что даже простые изменения в инструкциях значительно влияют на склонность моделей к галлюцинациям», — отметили в Giskard.

Галлюцинации остаются одной из главных нерешённых проблем в области генеративного ИИ. Даже передовые модели, основанные на вероятностных алгоритмах, могут придумывать несуществующие факты. По словам авторов исследования, новые модели, ориентированные на рассуждение, такие как o3 от OpenAI, склонны к галлюцинациям даже чаще, чем их предшественники, что не может не снижать доверие к их ответам.

Отмечается, что одной из причин повышенной склонности к ошибкам является ограниченность пространства для объяснений. Когда модель просят быть краткой, она не может полностью раскрыть тему и опровергнуть ложные предпосылки в запросе. Однако этот момент очень важен для разработчиков кода, поскольку промпт, содержащий инструкцию типа «будь кратким» может навредить качеству ответа.

Кроме того, было замечено, что модели реже опровергают спорные утверждения, если их высказывают уверенно. Также оказалось, что те ИИ, которые пользователи чаще оценивают как удобные или приятные в общении, не всегда отличаются высокой степенью точности ответов.

Эксперты из Giskard советуют тщательнее подбирать инструкции для ИИ и избегать строгих ограничений на длину ответов. «Кажущиеся безобидными подсказки вроде "будь лаконичным" могут незаметно ухудшить качество информации», — предупреждают они.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Пионер не всегда готов: ФНС заблокировала разработчикам Pioner банковские счета в России за неуплату налогов 7 мин.
Microsoft заверила, что Windows 11 прекрасно обходится без стороннего антивируса 43 мин.
Telegram оштрафовали в России на 7 млн рублей за неудаление запрещёнки 44 мин.
Starfield впервые за три года возглавила недельный чарт продаж в США — всё благодаря релизу на PS5 2 ч.
Тим Кук продолжит представлять Apple в отношениях с властями по всему миру 2 ч.
«Чисто сюжетное приключение»: инсайдер раскрыл новые подробности Assassin’s Creed Black Flag Resynced 3 ч.
Представлена функция OpenAI Chronicle — аналог скандальной Windows Recall, но для программистов 3 ч.
Британия проверит Telegram, Teen Chat и Chat Avenue на соблюдение закона по защите детей в Cети 3 ч.
Национального мессенджера Max больше нет — теперь он «Макс» 3 ч.
Кодзима сравнил достижения игроков Death Stranding 2: On the Beach с результатами лунной миссии Artemis II 5 ч.
Вышли обзоры Ryzen 9 9950X3D2: на 4 % быстрее предшественника, но в играх разницы нет 11 мин.
CATL представила LFP-аккумулятор 3-го поколения: почти полная зарядка за шесть минут 33 мин.
В Китае с размахом вернули к жизни технологии стабилизации энергосетей вековой давности 39 мин.
Глава Microsoft пообещал досрочно ввести в эксплуатацию самый мощный в мире ИИ ЦОД проекта Fairwater 44 мин.
Sony и Honda почти закрыли совместное предприятие после остановки электромобильного проекта Afeela 2 ч.
Представлен компактный планшет Oppo Pad Mini с флагманским процессором 2 ч.
Xiaomi представила свой первый смартфон с вентилятором — геймерский Redmi K90 Max с батареей на 8550 мА·ч 2 ч.
Руководитель Intel намекнул на появление доступных CPU с поддержкой разгона 3 ч.
В ближайшие годы человек станет «ходячим суперкомпьютером» с ИИ 3 ч.
В Apple ждут, что Джон Тернус будет руководить жёстче Кука — в духе Стива Джобса 4 ч.