Сегодня 21 августа 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

ИИ-боты начинают чаще привирать, когда их просят о лаконичных ответах — исследование

Исследователи из французской компании Giskard, занимающейся тестированием искусственного интеллекта, пришли к выводу, что чем короче ответы ChatGPT и других ИИ-помощников, тем выше вероятность выдачи недостоверной информации. Такие запросы, как «ответь кратко» или «объясни в двух предложениях» заставляют модели привирать и быть неточными.

 Источник изображения: AI

Источник изображения: AI

Как пишет TechCrunch, в ходе исследования специалисты проанализировали поведение популярных языковых моделей, включая GPT-4o от OpenAI, Mistral Large и Claude 3.7 Sonnet от Anthropic и установили, что при запросах на краткие ответы, особенно по неоднозначным или спорным темам, модели чаще выдают ошибочную информацию. «Наши данные показывают, что даже простые изменения в инструкциях значительно влияют на склонность моделей к галлюцинациям», — отметили в Giskard.

Галлюцинации остаются одной из главных нерешённых проблем в области генеративного ИИ. Даже передовые модели, основанные на вероятностных алгоритмах, могут придумывать несуществующие факты. По словам авторов исследования, новые модели, ориентированные на рассуждение, такие как o3 от OpenAI, склонны к галлюцинациям даже чаще, чем их предшественники, что не может не снижать доверие к их ответам.

Отмечается, что одной из причин повышенной склонности к ошибкам является ограниченность пространства для объяснений. Когда модель просят быть краткой, она не может полностью раскрыть тему и опровергнуть ложные предпосылки в запросе. Однако этот момент очень важен для разработчиков кода, поскольку промпт, содержащий инструкцию типа «будь кратким» может навредить качеству ответа.

Кроме того, было замечено, что модели реже опровергают спорные утверждения, если их высказывают уверенно. Также оказалось, что те ИИ, которые пользователи чаще оценивают как удобные или приятные в общении, не всегда отличаются высокой степенью точности ответов.

Эксперты из Giskard советуют тщательнее подбирать инструкции для ИИ и избегать строгих ограничений на длину ответов. «Кажущиеся безобидными подсказки вроде "будь лаконичным" могут незаметно ухудшить качество информации», — предупреждают они.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Google отлучила «Ассистента» от умного дома — представлен продвинутый ИИ-помощник Gemini for Home 2 ч.
«Лучшее, что я видел за последние годы»: безумный платформер Denshattack! отправит игроков выполнять трюки на неподвластном гравитации поезде 2 ч.
Ярость войны, напалм и масштаб: анонсирован многопользовательский шутер Hell Let Loose: Vietnam 3 ч.
Сюжетная ролевая игра Rue Valley, вдохновлённая Disco Elysium и «Днём сурка», получила дату выхода и новый геймплейный трейлер 5 ч.
«Не терпится купить 12 DLC, чтобы получить полную игру»: Paradox раскрыла дату выхода Europa Universalis V, но фанаты делать предзаказ не спешат 6 ч.
Китайцы запустили ИИ-стримера-продавца, который превосходит человека и готов работать круглосуточно 7 ч.
Как Overwatch, но с танками: создатели World of Tanks анонсировали геройский шутер World of Tanks: Heat 7 ч.
Тысячи приватных диалогов с Grok утекли в поиск Google 8 ч.
Больше никаких «Меня слышно?» — в Microsoft Teams появится индикатор работы микрофона 8 ч.
В новом трейлере Resident Evil Requiem показали встречу главной героини с матерью, которая пошла не по плану 9 ч.
Новая статья: Curator — и пусть DDoS подождёт 2 ч.
Lenovo откроет в Саудовской Аравии штаб-квартиру и развернёт производство IT-оборудования 2 ч.
Qualcomm представила процессоры Snapdragon W5 Gen 2 и W5+ Gen 2 для смарт-часов со спутниковой связью 3 ч.
Google представила смарт-часы Pixel Watch 4 с поддержкой спутниковой связи 4 ч.
Google сделала свой MagSafe: магнитное крепление Pixelsnap для зарядки и не только 4 ч.
Портрет всего человечества с расстояния 290 млн км: межпланетная станция «Психея» запечатлела Землю и Луну 4 ч.
«Роскосмос» запустил на орбиту 75 мышей и 1500 мух на спутнике «Бион-М» — через месяц они вернутся в Россию 4 ч.
Google представила беспроводные наушники Pixel Buds 2a со сменной батареей в чехле и активным шумоподавлением за $129 4 ч.
MSI представила самую оверклокерскую плату MEG X870E Godlike X Edition, а также модели X870E MAX попроще 5 ч.
MSI показала видеокарту GeForce RTX 5000 в стиле World of Warcraft: Midnight 5 ч.