Сегодня 21 марта 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

ИИ-боты начинают чаще привирать, когда их просят о лаконичных ответах — исследование

Исследователи из французской компании Giskard, занимающейся тестированием искусственного интеллекта, пришли к выводу, что чем короче ответы ChatGPT и других ИИ-помощников, тем выше вероятность выдачи недостоверной информации. Такие запросы, как «ответь кратко» или «объясни в двух предложениях» заставляют модели привирать и быть неточными.

 Источник изображения: AI

Источник изображения: AI

Как пишет TechCrunch, в ходе исследования специалисты проанализировали поведение популярных языковых моделей, включая GPT-4o от OpenAI, Mistral Large и Claude 3.7 Sonnet от Anthropic и установили, что при запросах на краткие ответы, особенно по неоднозначным или спорным темам, модели чаще выдают ошибочную информацию. «Наши данные показывают, что даже простые изменения в инструкциях значительно влияют на склонность моделей к галлюцинациям», — отметили в Giskard.

Галлюцинации остаются одной из главных нерешённых проблем в области генеративного ИИ. Даже передовые модели, основанные на вероятностных алгоритмах, могут придумывать несуществующие факты. По словам авторов исследования, новые модели, ориентированные на рассуждение, такие как o3 от OpenAI, склонны к галлюцинациям даже чаще, чем их предшественники, что не может не снижать доверие к их ответам.

Отмечается, что одной из причин повышенной склонности к ошибкам является ограниченность пространства для объяснений. Когда модель просят быть краткой, она не может полностью раскрыть тему и опровергнуть ложные предпосылки в запросе. Однако этот момент очень важен для разработчиков кода, поскольку промпт, содержащий инструкцию типа «будь кратким» может навредить качеству ответа.

Кроме того, было замечено, что модели реже опровергают спорные утверждения, если их высказывают уверенно. Также оказалось, что те ИИ, которые пользователи чаще оценивают как удобные или приятные в общении, не всегда отличаются высокой степенью точности ответов.

Эксперты из Giskard советуют тщательнее подбирать инструкции для ИИ и избегать строгих ограничений на длину ответов. «Кажущиеся безобидными подсказки вроде "будь лаконичным" могут незаметно ухудшить качество информации», — предупреждают они.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Суд признал Илона Маска виновным в введении в заблуждение инвесторов на этапе подготовки к покупке Twitter 2 ч.
Панель задач Windows 11 всё же станет перемещаемой — как в Windows 10 6 ч.
Новая статья: Esoteric Ebb — кубик всемогущий. Рецензия 8 ч.
Поиск Google начал подменять заголовки новостей сгенерированными ИИ — и не гнушается искажением смысла 8 ч.
Продажи Crimson Desert в день релиза превысили два миллиона копий — Pearl Abyss пообещала оперативно улучшать игру 12 ч.
Мартовское обновление Windows 11 сломало вход в Teams и OneDrive, призналась Microsoft 13 ч.
Саудовский фонд купит разработчика Mobile Legends: Bang Bang за $6 миллиардов — владелец TikTok устал от игр и хочет сосредоточиться на ИИ 14 ч.
Crimson Desert не запускается на видеокартах Intel Arc — издатель призвал оформить возврат средств 14 ч.
Alibaba избавилась от трети сотрудников за прошлый год и сосредоточилась на ИИ 15 ч.
В «Google Сообщения» добавили долгожданную возможность транслировать свою геопозицию 16 ч.
Джефф Безос собирается привлечь $100 млрд на нужды ИИ-стартапа Project Prometheus 14 мин.
xAI переманила у OpenAI крупного клиента, применив тактику «внедрения» 2 ч.
Nintendo сделает батарею в Switch 2 сменной, но только для Европы 3 ч.
Intel прислушается к пользователям и перестанет менять сокеты как перчатки 6 ч.
В Китае придумали, как охлаждать квантовые процессоры без дефицитного гелия-3 10 ч.
Huawei представила смартфон Mate 80 Pro Max Wind Edition с сильно выступающими камерами и вентилятором 12 ч.
Доступный MacBook Neo стал хитом: Тим Кук похвастался лучшим запуском новых Mac в истории 12 ч.
Ракету SLS с кораблём Orion вернули на стартовую площадку в преддверии исторического облёта Луны людьми 12 ч.
Gigabyte выпустила аскетичную матплату Z890 D Plus на флагманском чипсете Intel Z890 12 ч.
Этот будильник сложно возненавидеть — Balmuda The Clock вовсю старается сделать засыпание и пробуждение приятными 12 ч.