Сегодня 26 марта 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Теги → роль

Популярный лайфхак для ИИ оказался вредным: просьба «представь себя экспертом» ухудшает ответы

Запросы к системам искусственного интеллекта, в которых чат-ботам предлагается примерить на себя образ профессионала, могут снизить качество генерируемого контента, в том числе программного кода. К такому выводу пришли учёные Университета Южной Калифорнии в своём исследовании.

 Источник изображения: Steve Johnson / unsplash.com

Источник изображения: Steve Johnson / unsplash.com

Ещё в 2023 году, в момент становления бума ИИ, исследователи рекомендовали начинать запрос к чат-ботам на генерацию программного кода с фраз вроде: «Ты — опытный программист в области машинного обучения». Считалось, что это способно повысить качество программного кода в ответе. Подобные рекомендации встречаются и теперь, но в новом исследовании учёные установили, что эффективность запросов с установкой ролевой модели зависит от поставленной задачи. Если речь идёт о задачах, связанных с материалами предварительного обучения, такими как математика или программирование, то качество ответа может, напротив, снизиться.

Причина заключается в том, что упоминание профессиональной роли в запросе на самом деле не добавляет ей никаких экспертных знаний — объёмы обучающих данных остаются теми же. А при обращении к материалам, полученным на этапе предварительного обучения, установка ролевой модели может стать даже препятствием. Это подтвердилось при прохождении популярного теста MMLU (Massive Multitask Language Understanding): с установкой роли эксперта в запросе качество ответов снизилось по всем четырём категориям, а общая точность снизилась с 71,6 % до 68,0 %.

Выбор ролевой модели повышает вероятность того, что ИИ даст ответ, которого ожидает пользователь, и это может отрицательно сказаться на качестве непосредственно поставленной задачи, потому что ИИ больше стремится соответствовать поставленной роли. В случае написания программного кода ролевая модель, однако, способствует более детальной и качественной проработке пользовательского интерфейса, архитектуры проекта и выбору инструментов. Для решения поставленной проблемы учёные предложили схему PRISM (Persona Routing via Intent-based Self-Modeling), при которой ИИ автоматически выбирает ролевую модель или просто генерирует контент по запросу — в зависимости от типа поставленной задачи подключается механизм основе низкоранговой адаптации LoRA. «Если вам важнее соответствие требованиям (безопасности, правилам, установленной структуре и т. д.), конкретизируйте их; если же важнее точность и факты, просто отправляйте запрос», — заключили учёные.


window-new
Soft
Hard
Тренды 🔥
МТС Exolve представила сервис для централизованной работы с клиентскими чатами 7 мин.
Цифровые версии эксклюзивов Nintendo Switch 2 в США скоро станут дешевле розничных 25 мин.
В американских вузах стали возвращаться к устным экзаменам — из-за ИИ студенты перестали думать сами 35 мин.
Samsung Browser вышел за пределы смартфонов и теперь доступен на ПК с Windows 42 мин.
Google сократила потребление памяти ИИ-моделями в шесть раз без потери точности — с алгоритмом TurboQuant 2 ч.
Закрытие OpenAI ИИ-генератора видео Sora обрушило миллиардную сделку с Walt Disney 3 ч.
Разработчики Lords of the Fallen 2 показали, как прокачали царство мёртвых после критики игроков — новый геймплейный тизер 4 ч.
Суд в США впервые обязал Google и Meta выплатить $6 млн пользователю по делу о зависимости от соцсетей 6 ч.
Google назвала Android в связке с Chrome самой быстрой платформой для веб-сёрфинга 7 ч.
Microsoft запустила ИИ-рестайлинг фотографий — и это не Copilot 12 ч.
Бизнес-компьютер Dell Pro 5 Micro в литровом корпусе получил чип Intel Panther Lake с ИИ-быстродействием 50 TOPS 2 ч.
HP представила рабочую станцию Z8 Fury G6i с поддержкой четырёх ускорителей NVIDIA RTX Pro 6000 Blackwell Max-Q Workstation Edition 2 ч.
ИИ помог открыть неизвестные ранее экзопланеты в архивах телескопа-охотника TESS 2 ч.
Samsung Galaxy Z Fold8 Wide показался на изображениях — он станет ответом на первый складной iPhone 3 ч.
Китай может занять до 42 % рынка массовых чипов к 2028 году благодаря ИИ 3 ч.
Половина компаний, заменивших людей ИИ-ботами, вернётся к найму персонала в следующем году 4 ч.
Дорожает всё: вслед за памятью и CPU подорожают даже «простые» чипы 5 ч.
Потребительское подразделение Sennheiser снова выставили на продажу 7 ч.
В Meta новая волна увольнений — всё ради искусственного интеллекта 7 ч.
Sandisk купила кусочек тайваньского производителя памяти Nanya, чтобы обеспечить себе доступ к DRAM для SSD 8 ч.