Сегодня 11 июля 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Microsoft представила ИИ-инструмент для защиты ИИ от галлюцинаций и ошибок

Microsoft представила новую функцию Content Safety в облачной инфраструктуре Azure — она направлена на борьбу со сбоями в работе генеративного искусственного интеллекта. Функция автоматически обнаруживает и даже исправляет ошибки в ответах моделей ИИ.

 Источник изображения: youtube.com/@MicrosoftAzure

Источник изображения: youtube.com/@MicrosoftAzure

Content Safety доступна в предварительной версии в пакете Azure AI Studio — это набор средств безопасности, предназначенных для обнаружения уязвимостей, поиска «галлюцинаций» у систем ИИ, а также блокировки недопустимых запросов от пользователей. Content Safety сканирует ответы ИИ и выявляет в них неточности, сравнивая выходные данные с исходными материалами клиента.

Обнаружив ошибку, система выделяет её, сопровождает сведениями, почему предоставленная информация неверна, и переписывает проблемный контент — всё это происходит ещё «до того, как пользователь сможет увидеть» неточность. Впрочем, гарантии надёжности эта функция не даёт. На корпоративной платформе Google Vertex AI тоже есть функция «заземления» моделей ИИ посредством сверки ответов по поисковой машине Google, собственным данным компании и в перспективе сторонним наборам данных.

Система Microsoft Content Safety осуществляет согласование ответов с базовыми документами при помощи больших и малых языковых моделей, рассказал представитель компании, но и она не застрахована от ошибок. «Важно отметить, что обнаружение [ошибок при помощи функции] "заземления" не решает проблему "точности", но помогает согласовывать ответы генеративного ИИ с базовыми документами», — пояснили в Microsoft.

Источники:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Миллионы Mercedes-Benz, Volkswagen и Škoda оказалось можно взломать по Bluetooth 16 мин.
Олдскульный хоррор Heartworm в духе Resident Evil и Silent Hill не заставит себя долго ждать — дата выхода и новый трейлер 2 ч.
В Windows 11 появился ИИ-агент, помогающий с настройками ОС 2 ч.
У разработчиков «Мира танков» появился новый управляющий — это компания, учреждённая несколько дней назад 3 ч.
Фанаты нашли подтверждение недавних слухов о Red Dead Redemption 2 и GTA IV на официальном сайте Rockstar 4 ч.
Россиянина приговорили к трём годам тюрьмы за кражу технологий ASML для создания производства чипов в России 4 ч.
В Telegram появится реклама, как в YouTube — прямо на видео 4 ч.
Apple создала ИИ, который определяет состояние здоровья человека с точностью до 92 % 6 ч.
ИИ-бот Grok 4 уличён в использовании мнения Илона Маска для ответов на спорные вопросы 7 ч.
Созданные ИИ вирусы научились обходить защиту Microsoft Defender, но пока с переменным успехом 8 ч.
Суд обязал МТС выплатить штраф в 3 млрд рублей за необоснованное повышение тарифов 25 мин.
Разработчик зрения для роботов RealSense отделился от Intel и привлёк $50 млн инвестиций 59 мин.
Смарт-часы станут производительнее и эффективнее — Qualcomm, наконец, разработает для них новый процессор 2 ч.
«Самая старая комета, которую мы когда-либо видели» — учёные оценили возраст третьего межзвёздного объекта в 7 млрд лет 2 ч.
Бюрократы да экологи: Microsoft посетовала на трудность развития ЦОД в Европе 3 ч.
Умные серьги и ожерелья не за горами — Samsung задумалась о новых формфакторах носимых устройств 4 ч.
Colorful показала видеокарту GeForce RTX 5000 iGame Ultra с двумя слотами M.2 для SSD 4 ч.
Sony показала спецверсии PlayStation 5 Ghost of Yotei Limited Edition 4 ч.
Silicon Motion представила SSD-контроллер с PCIe 6.0 и скоростью до 28 Гбайт/с 4 ч.
Curator: DDoS-атак во втором квартале стало в 1,5 раза больше, а рекордный ботнет вырос до 4,6 млн устройств 6 ч.