Сегодня 08 мая 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

ИИ-боты начинают чаще привирать, когда их просят о лаконичных ответах — исследование

Исследователи из французской компании Giskard, занимающейся тестированием искусственного интеллекта, пришли к выводу, что чем короче ответы ChatGPT и других ИИ-помощников, тем выше вероятность выдачи недостоверной информации. Такие запросы, как «ответь кратко» или «объясни в двух предложениях» заставляют модели привирать и быть неточными.

 Источник изображения: AI

Источник изображения: AI

Как пишет TechCrunch, в ходе исследования специалисты проанализировали поведение популярных языковых моделей, включая GPT-4o от OpenAI, Mistral Large и Claude 3.7 Sonnet от Anthropic и установили, что при запросах на краткие ответы, особенно по неоднозначным или спорным темам, модели чаще выдают ошибочную информацию. «Наши данные показывают, что даже простые изменения в инструкциях значительно влияют на склонность моделей к галлюцинациям», — отметили в Giskard.

Галлюцинации остаются одной из главных нерешённых проблем в области генеративного ИИ. Даже передовые модели, основанные на вероятностных алгоритмах, могут придумывать несуществующие факты. По словам авторов исследования, новые модели, ориентированные на рассуждение, такие как o3 от OpenAI, склонны к галлюцинациям даже чаще, чем их предшественники, что не может не снижать доверие к их ответам.

Отмечается, что одной из причин повышенной склонности к ошибкам является ограниченность пространства для объяснений. Когда модель просят быть краткой, она не может полностью раскрыть тему и опровергнуть ложные предпосылки в запросе. Однако этот момент очень важен для разработчиков кода, поскольку промпт, содержащий инструкцию типа «будь кратким» может навредить качеству ответа.

Кроме того, было замечено, что модели реже опровергают спорные утверждения, если их высказывают уверенно. Также оказалось, что те ИИ, которые пользователи чаще оценивают как удобные или приятные в общении, не всегда отличаются высокой степенью точности ответов.

Эксперты из Giskard советуют тщательнее подбирать инструкции для ИИ и избегать строгих ограничений на длину ответов. «Кажущиеся безобидными подсказки вроде "будь лаконичным" могут незаметно ухудшить качество информации», — предупреждают они.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Первое сюжетное дополнение к Kingdom Come: Deliverance 2 не заставит себя долго ждать — новый трейлер и дата выхода Brushes with Death 6 мин.
THQ Nordic объявила о переносе раннего доступа Titan Quest 2 и поделилась итогами закрытого тестирования 2 ч.
Meta наделит следующие умные очки Ray-Ban «супервосприятием» — функцией распознавания лиц окружающих 2 ч.
Первый геймплейный трейлер подтвердил дату выхода Mafia: The Old Country — игру будут продавать за $50 3 ч.
ИИ-боты начинают чаще привирать, когда их просят о лаконичных ответах — исследование 4 ч.
Перенос GTA VI прибавил Electronic Arts уверенности в успехе новой Battlefield 4 ч.
Apple начала принимать заявки на компенсации по иску о подслушивании Siri 5 ч.
Saber Interactive «выкатила» системные требования амбициозного симулятора RoadCraft 6 ч.
Microsoft отстояла сделку века: Activision Blizzard остаётся в империи Xbox 8 ч.
Huawei избавится от Windows вслед за Android — представлена ПК-версия HarmonyOS 8 ч.
Alienware представила тонкие и доступные геймерские ноутбуки Aurora 16 и 16X в сдержанном дизайне 2 ч.
Cadence представила суперкомпьютер Millennium M2000 на базе NVIDIA Blackwell 3 ч.
IBM представила сервер LinuxONE Emperor 5 на платформе Telum II для ИИ-задач 3 ч.
Samsung представила смартфон Galaxy F56 с чипом Exynos 1480 и толщиной 7,2 мм 3 ч.
Nvidia оставила прессу без драйвера для GeForce RTX 5060 — так обзоры не испортят старт продаж 4 ч.
Суперкомпьютер Colossus Илона Маска запустили на полную мощность — он потребляет, как 300 000 домов 4 ч.
Поставки OLED-мониторов за год взлетели на 175 % — Asus наступает на пятки лидирующей Samsung 4 ч.
Arctic представила доступные башенные кулеры Freezer 8, заточенные под современные AMD Ryzen и Intel Core 5 ч.
OpenAI намерена развивать «демократический ИИ» за пределами США в рамках мегапроекта Stargate 6 ч.
Экс-сотрудника SK hynix обвинили в передаче Huawei технологии выпуска памяти HBM 7 ч.