Сегодня 13 ноября 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

ИИ-боты начинают чаще привирать, когда их просят о лаконичных ответах — исследование

Исследователи из французской компании Giskard, занимающейся тестированием искусственного интеллекта, пришли к выводу, что чем короче ответы ChatGPT и других ИИ-помощников, тем выше вероятность выдачи недостоверной информации. Такие запросы, как «ответь кратко» или «объясни в двух предложениях» заставляют модели привирать и быть неточными.

 Источник изображения: AI

Источник изображения: AI

Как пишет TechCrunch, в ходе исследования специалисты проанализировали поведение популярных языковых моделей, включая GPT-4o от OpenAI, Mistral Large и Claude 3.7 Sonnet от Anthropic и установили, что при запросах на краткие ответы, особенно по неоднозначным или спорным темам, модели чаще выдают ошибочную информацию. «Наши данные показывают, что даже простые изменения в инструкциях значительно влияют на склонность моделей к галлюцинациям», — отметили в Giskard.

Галлюцинации остаются одной из главных нерешённых проблем в области генеративного ИИ. Даже передовые модели, основанные на вероятностных алгоритмах, могут придумывать несуществующие факты. По словам авторов исследования, новые модели, ориентированные на рассуждение, такие как o3 от OpenAI, склонны к галлюцинациям даже чаще, чем их предшественники, что не может не снижать доверие к их ответам.

Отмечается, что одной из причин повышенной склонности к ошибкам является ограниченность пространства для объяснений. Когда модель просят быть краткой, она не может полностью раскрыть тему и опровергнуть ложные предпосылки в запросе. Однако этот момент очень важен для разработчиков кода, поскольку промпт, содержащий инструкцию типа «будь кратким» может навредить качеству ответа.

Кроме того, было замечено, что модели реже опровергают спорные утверждения, если их высказывают уверенно. Также оказалось, что те ИИ, которые пользователи чаще оценивают как удобные или приятные в общении, не всегда отличаются высокой степенью точности ответов.

Эксперты из Giskard советуют тщательнее подбирать инструкции для ИИ и избегать строгих ограничений на длину ответов. «Кажущиеся безобидными подсказки вроде "будь лаконичным" могут незаметно ухудшить качество информации», — предупреждают они.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Sony анонсировала первую за четыре года новую Ratchet & Clank, но есть нюанс — это мобильный мультиплеерный шутер 50 мин.
Создатели Lineage и Guild Wars анонсировали MMORPG во вселенной Horizon от Sony — первый геймплей и подробности Horizon Steel Frontiers 3 ч.
ElevenLabs получила разрешение от голливудских звёзд на коммерческое применение их ИИ-голосов 3 ч.
Valve добавит поддержку Android-игр в Steam вместе с VR-гарнитурой 7 ч.
Хоррор об ужасах долговой ямы CloverPit получил хардкорный режим и достиг миллиона проданных копий — разработчики «в полном шоке» 13 ч.
OpenAI представила GPT-5.1 — ChatGPT станет умнее и приятнее в общении 13 ч.
Разработчики Vampire: The Masquerade — Bloodlines 2 рассказали, как будут улучшать игру до конца 2025 года 15 ч.
Российский корпоративный центр сертификации SafeTech CA получил масштабное обновление 15 ч.
«Безмерно благодарны вам»: продажи Kingdom Come: Deliverance 2 взяли новую высоту 16 ч.
Nintendo показала первый трейлер фильма «Галактика Супер Марио в кино» — фанаты в восторге 17 ч.
Праздник для сборщиков ПК: AeroCool объявляет о масштабной распродаже компонентов и аксессуаров 13 мин.
«Группа Астра» представила семейство ПАК XPlatform для построения ИТ-инфраструктуры «под ключ» 49 мин.
GlobalFoundries рассчитывает тоже извлечь выгоду из бума ИИ 52 мин.
Цены на флеш-память взлетят на 40–50 %: все производители сократили выпуск NAND 2 ч.
OpenAI сжигает миллиарды и зарабатывает крохи — окупаемость может наступить лишь через десять лет 4 ч.
Waymo выпустила беспилотные такси на шоссе в трёх районах США 4 ч.
Foxconn ожидает, что в следующем году поставки ИИ-серверов удвоятся 6 ч.
Microsoft готова использовать разработки OpenAI для совершенствования собственных чипов 6 ч.
На строительство ЦОД в этом году будет потрачено больше, чем на разведку новых месторождений нефти 7 ч.
Новая статья: Обзор и тестирование стильного корпуса 1stplayer GM7: сталь, пластик, два стекла 12 ч.