Сегодня 19 июня 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

ИИ-боты начинают чаще привирать, когда их просят о лаконичных ответах — исследование

Исследователи из французской компании Giskard, занимающейся тестированием искусственного интеллекта, пришли к выводу, что чем короче ответы ChatGPT и других ИИ-помощников, тем выше вероятность выдачи недостоверной информации. Такие запросы, как «ответь кратко» или «объясни в двух предложениях» заставляют модели привирать и быть неточными.

 Источник изображения: AI

Источник изображения: AI

Как пишет TechCrunch, в ходе исследования специалисты проанализировали поведение популярных языковых моделей, включая GPT-4o от OpenAI, Mistral Large и Claude 3.7 Sonnet от Anthropic и установили, что при запросах на краткие ответы, особенно по неоднозначным или спорным темам, модели чаще выдают ошибочную информацию. «Наши данные показывают, что даже простые изменения в инструкциях значительно влияют на склонность моделей к галлюцинациям», — отметили в Giskard.

Галлюцинации остаются одной из главных нерешённых проблем в области генеративного ИИ. Даже передовые модели, основанные на вероятностных алгоритмах, могут придумывать несуществующие факты. По словам авторов исследования, новые модели, ориентированные на рассуждение, такие как o3 от OpenAI, склонны к галлюцинациям даже чаще, чем их предшественники, что не может не снижать доверие к их ответам.

Отмечается, что одной из причин повышенной склонности к ошибкам является ограниченность пространства для объяснений. Когда модель просят быть краткой, она не может полностью раскрыть тему и опровергнуть ложные предпосылки в запросе. Однако этот момент очень важен для разработчиков кода, поскольку промпт, содержащий инструкцию типа «будь кратким» может навредить качеству ответа.

Кроме того, было замечено, что модели реже опровергают спорные утверждения, если их высказывают уверенно. Также оказалось, что те ИИ, которые пользователи чаще оценивают как удобные или приятные в общении, не всегда отличаются высокой степенью точности ответов.

Эксперты из Giskard советуют тщательнее подбирать инструкции для ИИ и избегать строгих ограничений на длину ответов. «Кажущиеся безобидными подсказки вроде "будь лаконичным" могут незаметно ухудшить качество информации», — предупреждают они.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
В Elden Ring Nightreign без предупреждения добавили хардкорную версию одного из финальных боссов, и это только начало 4 ч.
Telegram временно запретили в Малайзии за отказ сотрудничать с властями 4 ч.
Входить в Facebook можно будет с помощью ключей доступа 4 ч.
Capcom анонсировала игровую презентацию Capcom Spotlight — покажут Resident Evil Requiem, Pragmata и не только 7 ч.
«Весёлая, простая и красивая»: Midjourney запустила V1 — свою первую ИИ-модель для генерации видео по изображениям 7 ч.
OpenAI перестанет работать с ИИ-стартапом Scale AI из-за его сближения с Meta 7 ч.
Google интегрирует в YouTube Shorts свою новую ИИ-модель генерации видео Veo 3 8 ч.
В переговорах OpenAI и Microsoft сохраняется несколько важных противоречий 10 ч.
OpenAI вскрыла тёмные личности в ИИ, отвечающие за ложь, сарказм и токсичные ответы 17 ч.
ИИ-поисковик Google научился понимать голосовые запросы, но доступна функция не всем 18 ч.
Беспилотные такси в городах России появятся не раньше 2030 года 10 мин.
Здесь ЦОД с ИИ, здесь Grok'ом пахнет: экоактивисты подали в суд на xAI за использование газовых турбин для суперкомпьютера Colossus 12 мин.
Космический шедевр — создано самое детальное и самое многоцветное изображение галактики 2 ч.
Разработку российского электромобиля e-Neva заморозили 3 ч.
«Билайн» выходит на орбиту: оператор подключится к спутникам «российского Starlink» 3 ч.
Bloom Energy: к 2030 году более четверти ЦОД в США обзаведутся собственными электростанциями 4 ч.
Учёные MIT научили 3D-принтеры печатать из стекла — и для этого не нужен жар печи 4 ч.
«Лаборатория Касперского» спасла от ликвидации свою компанию в Великобритании 4 ч.
Антирекорд SpaceX: корабль Starship зрелищно взорвался, даже не оторвавшись от земли 5 ч.
Honor выпустит самый тонкий и лёгкий складной смартфон в мире раньше, чем Samsung 5 ч.