Сегодня 30 мая 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

ИИ-боты начинают чаще привирать, когда их просят о лаконичных ответах — исследование

Исследователи из французской компании Giskard, занимающейся тестированием искусственного интеллекта, пришли к выводу, что чем короче ответы ChatGPT и других ИИ-помощников, тем выше вероятность выдачи недостоверной информации. Такие запросы, как «ответь кратко» или «объясни в двух предложениях» заставляют модели привирать и быть неточными.

 Источник изображения: AI

Источник изображения: AI

Как пишет TechCrunch, в ходе исследования специалисты проанализировали поведение популярных языковых моделей, включая GPT-4o от OpenAI, Mistral Large и Claude 3.7 Sonnet от Anthropic и установили, что при запросах на краткие ответы, особенно по неоднозначным или спорным темам, модели чаще выдают ошибочную информацию. «Наши данные показывают, что даже простые изменения в инструкциях значительно влияют на склонность моделей к галлюцинациям», — отметили в Giskard.

Галлюцинации остаются одной из главных нерешённых проблем в области генеративного ИИ. Даже передовые модели, основанные на вероятностных алгоритмах, могут придумывать несуществующие факты. По словам авторов исследования, новые модели, ориентированные на рассуждение, такие как o3 от OpenAI, склонны к галлюцинациям даже чаще, чем их предшественники, что не может не снижать доверие к их ответам.

Отмечается, что одной из причин повышенной склонности к ошибкам является ограниченность пространства для объяснений. Когда модель просят быть краткой, она не может полностью раскрыть тему и опровергнуть ложные предпосылки в запросе. Однако этот момент очень важен для разработчиков кода, поскольку промпт, содержащий инструкцию типа «будь кратким» может навредить качеству ответа.

Кроме того, было замечено, что модели реже опровергают спорные утверждения, если их высказывают уверенно. Также оказалось, что те ИИ, которые пользователи чаще оценивают как удобные или приятные в общении, не всегда отличаются высокой степенью точности ответов.

Эксперты из Giskard советуют тщательнее подбирать инструкции для ИИ и избегать строгих ограничений на длину ответов. «Кажущиеся безобидными подсказки вроде "будь лаконичным" могут незаметно ухудшить качество информации», — предупреждают они.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
«Лучший сезон в Fortnite»: Elden Ring Nightreign стартовала в Steam со «смешанными» отзывами и вторым по успешности пиковым онлайном для FromSoftware 2 мин.
Microsoft закрепляет лидерство в сфере ИИ, предлагая клиентам почти 2 тыс. моделей, в том числе от конкурентов 2 ч.
Point-and-click без тормозов: спустя восемь лет разработки приключенческий триллер The Drifter получил дату выхода 2 ч.
«Базис» признан «Национальным чемпионом» 3 ч.
Apple грозит штраф не менее 500 млн евро за нарушение законов ЕС 5 ч.
Apple: разработчики приложений заработали $406 млрд через App Store в 2024 году 11 ч.
В Steam вышло демо Dispatch — комедийной игры про агентство супергероев от бывших разработчиков Tales from the Borderlands и The Wolf Among Us 12 ч.
Bandai Namco предупредила владельцев «новейших видеокарт» о проблемах Elden Ring Nightreign на ПК — игра уже получила первый патч 13 ч.
Yandex B2B Tech запустила YTsaurus — платформу обработки данных любого объёма для бизнеса 14 ч.
CD Projekt подтвердила разработку двух секретных игр, о которых никто ничего не знает 15 ч.
Pure Storage превзошла ожидания Уолл-стрит, но сотрудничество с гиперскейлерами пока не отразилось на её доходах 1 мин.
Япония планирует крупные закупки ИИ-чипов для сокращения торгового дефицита с США 42 мин.
Блокировка трамповских пошлин отменена — Белый дом оспорил решение суда 59 мин.
Nvidia придётся до 20 июня ответить на парламентский запрос о создании исследовательского центра в Шанхае 3 ч.
AMD приобрела разработчика кремниевой фотоники Enosemi 3 ч.
Китайские техногиганты начали готовиться к жизни без ускорителей Nvidia 4 ч.
Учёные создали наклейку на лицо за $20, которая предупредит о «выгорании» 6 ч.
Dell удалось воодушевить инвесторов прогнозом увеличения выручки от ИИ-серверов в полтора раза 6 ч.
ASRock признала, что её материнские платы ломают процессоры Ryzen 9000 11 ч.
Lian Li представила СЖО HydroShift II LCD-C с радиатором 360 мм и тремя конфигурациями 11 ч.