Сегодня 24 мая 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Теги → роль

Популярный лайфхак для ИИ оказался вредным: просьба «представь себя экспертом» ухудшает ответы

Запросы к системам искусственного интеллекта, в которых чат-ботам предлагается примерить на себя образ профессионала, могут снизить качество генерируемого контента, в том числе программного кода. К такому выводу пришли учёные Университета Южной Калифорнии в своём исследовании.

 Источник изображения: Steve Johnson / unsplash.com

Источник изображения: Steve Johnson / unsplash.com

Ещё в 2023 году, в момент становления бума ИИ, исследователи рекомендовали начинать запрос к чат-ботам на генерацию программного кода с фраз вроде: «Ты — опытный программист в области машинного обучения». Считалось, что это способно повысить качество программного кода в ответе. Подобные рекомендации встречаются и теперь, но в новом исследовании учёные установили, что эффективность запросов с установкой ролевой модели зависит от поставленной задачи. Если речь идёт о задачах, связанных с материалами предварительного обучения, такими как математика или программирование, то качество ответа может, напротив, снизиться.

Причина заключается в том, что упоминание профессиональной роли в запросе на самом деле не добавляет ей никаких экспертных знаний — объёмы обучающих данных остаются теми же. А при обращении к материалам, полученным на этапе предварительного обучения, установка ролевой модели может стать даже препятствием. Это подтвердилось при прохождении популярного теста MMLU (Massive Multitask Language Understanding): с установкой роли эксперта в запросе качество ответов снизилось по всем четырём категориям, а общая точность снизилась с 71,6 % до 68,0 %.

Выбор ролевой модели повышает вероятность того, что ИИ даст ответ, которого ожидает пользователь, и это может отрицательно сказаться на качестве непосредственно поставленной задачи, потому что ИИ больше стремится соответствовать поставленной роли. В случае написания программного кода ролевая модель, однако, способствует более детальной и качественной проработке пользовательского интерфейса, архитектуры проекта и выбору инструментов. Для решения поставленной проблемы учёные предложили схему PRISM (Persona Routing via Intent-based Self-Modeling), при которой ИИ автоматически выбирает ролевую модель или просто генерирует контент по запросу — в зависимости от типа поставленной задачи подключается механизм основе низкоранговой адаптации LoRA. «Если вам важнее соответствие требованиям (безопасности, правилам, установленной структуре и т. д.), конкретизируйте их; если же важнее точность и факты, просто отправляйте запрос», — заключили учёные.


window-new
Soft
Hard
Тренды 🔥
Новая статья: Zero Parades: For Dead Spies — шпион, выйди вон. Рецензия 6 ч.
ИИ-супермодель Claude Mythos всего за месяц обнаружила свыше 10 тыс. уязвимостей в ПО 10 ч.
В Linux обнаружена очередная серьёзная уязвимость — и ей уже десять лет 13 ч.
Firefox перестал вылетать на ПК с процессорами Intel Raptor Lake — на исправление ошибки ушёл год 14 ч.
Outlook Classic перестал показывать картинки, но Microsoft обещала всё починить 14 ч.
На GitHub напал Megalodon — вредоносный код заразил более чем 5500 репозиториев 17 ч.
Марк Цукерберг высказался в защиту тотальной слежки за действиями сотрудников Meta — для обучения ИИ, но это не точно 18 ч.
Техногиганты в последний момент отговорили Трампа подписывать указ об обязательных проверках ИИ 18 ч.
Новый поиск Google оказался капризным: из-за ИИ запросы «стой» и «игнорируй» ломают выдачу 20 ч.
Глава DeepMind спрогнозировал появление сильного искусственного интеллекта (AGI) к 2030 году 23-05 04:46
Первый полёт Starship V3 доказал живучесть обновлённой мегаракеты, хоть и закончился взрывом 9 ч.
Трамп случайно вложил $1 млн в сеть суши-ресторанов вместо производителя ИИ-оборудования 12 ч.
Первая женщина-тайконавт из Гонконга отправится на китайскую космическую станцию 13 ч.
Производитель умных колец Oura подал заявку на IPO 13 ч.
Производителей компонентов для жёстких дисков заподозрили в завышении цен на протяжении 13 лет 14 ч.
Dell представила «элитные» All-Flash СХД PowerStore Elite вместимостью до 5,8 Пбайт 14 ч.
YADRO представила коммутаторы KORNFELD SE для кампусных сетей 16 ч.
Lenovo представила ноутбук IdeaPad Slim 5i на чипе Intel Wildcat Lake — это прямой конкурент MacBook Neo 17 ч.
С началом строительства ЦОД Meta в США вода в близлежащем округе помутнела 17 ч.
Cолнечная и ветровая энергетика впервые обогнали газовые электростанции по выработке электричества 20 ч.