Сегодня 20 августа 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

ИИ-боты начинают чаще привирать, когда их просят о лаконичных ответах — исследование

Исследователи из французской компании Giskard, занимающейся тестированием искусственного интеллекта, пришли к выводу, что чем короче ответы ChatGPT и других ИИ-помощников, тем выше вероятность выдачи недостоверной информации. Такие запросы, как «ответь кратко» или «объясни в двух предложениях» заставляют модели привирать и быть неточными.

 Источник изображения: AI

Источник изображения: AI

Как пишет TechCrunch, в ходе исследования специалисты проанализировали поведение популярных языковых моделей, включая GPT-4o от OpenAI, Mistral Large и Claude 3.7 Sonnet от Anthropic и установили, что при запросах на краткие ответы, особенно по неоднозначным или спорным темам, модели чаще выдают ошибочную информацию. «Наши данные показывают, что даже простые изменения в инструкциях значительно влияют на склонность моделей к галлюцинациям», — отметили в Giskard.

Галлюцинации остаются одной из главных нерешённых проблем в области генеративного ИИ. Даже передовые модели, основанные на вероятностных алгоритмах, могут придумывать несуществующие факты. По словам авторов исследования, новые модели, ориентированные на рассуждение, такие как o3 от OpenAI, склонны к галлюцинациям даже чаще, чем их предшественники, что не может не снижать доверие к их ответам.

Отмечается, что одной из причин повышенной склонности к ошибкам является ограниченность пространства для объяснений. Когда модель просят быть краткой, она не может полностью раскрыть тему и опровергнуть ложные предпосылки в запросе. Однако этот момент очень важен для разработчиков кода, поскольку промпт, содержащий инструкцию типа «будь кратким» может навредить качеству ответа.

Кроме того, было замечено, что модели реже опровергают спорные утверждения, если их высказывают уверенно. Также оказалось, что те ИИ, которые пользователи чаще оценивают как удобные или приятные в общении, не всегда отличаются высокой степенью точности ответов.

Эксперты из Giskard советуют тщательнее подбирать инструкции для ИИ и избегать строгих ограничений на длину ответов. «Кажущиеся безобидными подсказки вроде "будь лаконичным" могут незаметно ухудшить качество информации», — предупреждают они.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
«Соболезную фанатам, которые ждали так долго»: новый трейлер Vampire: The Masquerade — Bloodlines 2 подтвердил дату релиза и разозлил игроков 5 ч.
Разработчики Black Myth: Wukong анонсировали фэнтезийный боевик Black Myth: Zhong Kui, но «путешествие на Запад ещё не окончено» 6 ч.
Новая статья: Vampire: The Masquerade — Bloodlines 2 — у крови странный привкус. Предварительный обзор 6 ч.
Авторы Ghostrunner анонсировали Valor Mortis — экшен от первого лица в стиле Dark Souls про восставшего из мёртвых солдата армии Наполеона 8 ч.
Первый геймплейный трейлер Call of Duty: Black Ops 7 подтвердил утечку даты выхода и «бесконечный» эндгейм сюжетной кампании 8 ч.
Спасать BioShock 4 из производственного ада доверили экс-руководителю Diablo 9 ч.
Phison пообещала разобраться с ломающим SSD обновлением Windows 11 24H2 9 ч.
Adobe представила Acrobat Studio — платформу на базе ИИ для работы со множеством разношёрстных файлов 9 ч.
Nvidia выпустила драйвер с поддержкой Smooth Motion и глобальными настройками DLSS Override для карт RTX 40-й серии 9 ч.
Dragon Age: The Veilguard, возвращение Persona 4 Golden и новые релизы: Microsoft раскрыла, какие игры пополнят Game Pass в конце августа 10 ч.
Власти США намерены обменять субсидии на доли в капитале TSMC, Micron и Samsung 3 мин.
Meta официально «перезагрузила» свою ИИ-команду в попытке догнать OpenAI и Google 32 мин.
NVIDIA готовит для Китая урезанный ИИ-ускоритель на архитектуре Blackwell 6 ч.
Foxconn будет производить ИИ-оборудование для проекта Stargate на заводе, который она продала SoftBank 7 ч.
LG представила 49-дюймовый монитор UltraWide 49U950A-W — DWQHD, 144 Гц и зарядка на 90 Вт 7 ч.
Google почти бесплатно обогреет жителей целого города в Финляндии «мусорным» теплом дата-центра 8 ч.
Xbox Ally получит всего четыре ядра Zen 2 — не ровня Xbox Ally X с восьмёркой Zen 5 8 ч.
Каждый россиянин теперь тратит на мобильную связь в среднем более 1100 рублей в месяц 9 ч.
SoftBank рассматривала поглощение Intel Foundry, но в итоге ограничилась инвестициями в $2 млрд 10 ч.
Asus представила ROG Matrix GeForce RTX 5090 30th Anniversary Limited Edition с четырьмя вентиляторами и TDP до 800 Вт 10 ч.