Сегодня 17 марта 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Microsoft защитила клиентские ИИ-приложения от галлюцинаций

Корпорация Microsoft разработала насколько новых средств безопасности приложений на основе искусственного интеллекта — эти инструменты адресованы клиентам, которые не имеют возможности самостоятельно проводить стресс-тесты своих продуктов.

 Источник изображения: azure.microsoft.com

Источник изображения: azure.microsoft.com

Средства безопасности, сами основанные на большой языковой модели, обнаруживают галлюцинации ИИ-приложений, то есть выдаваемую ими правдоподобную, но не соответствующую действительности информацию, и в реальном времени блокируют потенциально опасные пользовательские запросы. Это поможет избежать нежелательных дискуссий о генеративном ИИ, порождённых различными инцидентами: дипфейками со знаменитостями, попытками фальсификации истории и созданием прочих недопустимых материалов.

На начальном этапе средства безопасности включают три основные функции. Prompt Shields («защита запросов») блокирует потенциально опасные подсказки, которые провоцируют ИИ нарушать заданные правила. Groundedness Detection («оценка связи с действительностью») обнаруживает и блокирует галлюцинации. И, наконец, это обнаружение защищённых материалов — тех, на которые распространяется авторское право. Скоро к набору добавятся инструменты, направляющие ИИ давать безопасные ответы и отслеживающие потенциально проблемных пользователей. Средства защиты призваны оценивать безопасность и запросов к ИИ, и ответов на них.

В ходе недавнего инцидента генератор изображений Google Gemini сам пострадал от фильтров, направленных на расширение расовой инклюзивности — в Microsoft решили подстраховаться от подобных происшествий, применив метод индивидуального контроля. С другой стороны, компания не хочет брать на себя роль диктатора и голоса истины в последней инстанции в области морального облика ИИ, поэтому клиенты Azure могут отключать предлагаемые ей фильтры.

В перспективе система предложит клиентам Azure отчёты о пользователях, которые пытаются провоцировать ИИ на недопустимые ответы — это поможет администраторам ресурсов выяснять, какие из этих запросов отправлялись в рамках тестирования, а какие исходили от людей с вероятными недобрыми намерениями. Средства безопасности уже доступны для работы с наиболее популярными моделями, включая GPT-4 и Llama 2. Проработка безопасности менее популярных платформ будет осуществляться в индивидуальном порядке.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Решение TrueNAS Connect обеспечит пользователям Community Edition и сторонних СХД бесплатный доступ к продвинутым функциям TrueNAS Enterprise 2 ч.
Крупнейший архив видеоигр Myrient спасён фанатами от забвения 3 ч.
Календарь релизов 16–22 марта: Crimson Desert, Starship Troopers: Ultimate Bug War! и DS2 на ПК 4 ч.
70 % российских компаний продолжают использовать софт Atlassian 4 ч.
Для PS5 Pro вышел ИИ-апскейлер PSSR 2 — улучшенную графику получат Silent Hill 2, Alan Wake 2 и другие игры 4 ч.
«Британская энциклопедия» подала в суд на OpenAI — ChatGPT почти дословно воспроизводит её статьи 5 ч.
Бэтмен спешит на помощь: амбициозный боевик Lego Batman: Legacy of the Dark Knight выйдет на неделю раньше запланированного 5 ч.
«КРИ официально возвращается»: летом в Москве впервые с 2013 года пройдёт конференция разработчиков игр 6 ч.
В Европе потребовали срочно оштрафовать Google за подыгрывание своим сервисам в поиске 7 ч.
Обновление Windows 11 заблокировало доступ к диску C на компьютерах Samsung 8 ч.
ИИ-ускорители Groq прописались в платформе NVIDIA Vera Rubin 25 мин.
Apple наконец признала устаревшими смартфоны iPhone 5 и iPhone 4 8GB 2 ч.
«Космические вычисления уже здесь»: Nvidia представила модуль Space-1 Vera Rubin для орбитальных ИИ-серверов 2 ч.
Nvidia ударила по Intel и AMD: представлены серверные 88-ядерные CPU Vera, которые сгодятся не только для ИИ 3 ч.
ИИ-бум наплодил миллиардеров: рейтинг Forbes пополнили сразу 45 новоиспечённых богачей 4 ч.
От тысяч к десяткам миллионов: гонка ИИ разогнала спрос на углеродные кредиты среди техногигантов 6 ч.
Creative выпустила звуковую карту Sound Blaster Audigy FX Pro — звук 32 бит / 384 кГц и 7.1 для ПК 8 ч.
Vivo и iQOO анонсировали повышение цен на смартфоны, но не все 9 ч.
Apple представила наушники AirPods Max 2 с улучшенным шумоподавлением и переводом в реальном времени за $549 9 ч.
MSI рассказала, кто виноват в дефиците видеокарт, и предупредила о росте цен на игровое железо на 15–30 % 10 ч.