Сегодня 04 октября 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Microsoft представила ИИ-инструмент для защиты ИИ от галлюцинаций и ошибок

Microsoft представила новую функцию Content Safety в облачной инфраструктуре Azure — она направлена на борьбу со сбоями в работе генеративного искусственного интеллекта. Функция автоматически обнаруживает и даже исправляет ошибки в ответах моделей ИИ.

 Источник изображения: youtube.com/@MicrosoftAzure

Источник изображения: youtube.com/@MicrosoftAzure

Content Safety доступна в предварительной версии в пакете Azure AI Studio — это набор средств безопасности, предназначенных для обнаружения уязвимостей, поиска «галлюцинаций» у систем ИИ, а также блокировки недопустимых запросов от пользователей. Content Safety сканирует ответы ИИ и выявляет в них неточности, сравнивая выходные данные с исходными материалами клиента.

Обнаружив ошибку, система выделяет её, сопровождает сведениями, почему предоставленная информация неверна, и переписывает проблемный контент — всё это происходит ещё «до того, как пользователь сможет увидеть» неточность. Впрочем, гарантии надёжности эта функция не даёт. На корпоративной платформе Google Vertex AI тоже есть функция «заземления» моделей ИИ посредством сверки ответов по поисковой машине Google, собственным данным компании и в перспективе сторонним наборам данных.

Система Microsoft Content Safety осуществляет согласование ответов с базовыми документами при помощи больших и малых языковых моделей, рассказал представитель компании, но и она не застрахована от ошибок. «Важно отметить, что обнаружение [ошибок при помощи функции] "заземления" не решает проблему "точности", но помогает согласовывать ответы генеративного ИИ с базовыми документами», — пояснили в Microsoft.

Источники:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Новая статья: Hades II — титан вне времени. Рецензия 9 ч.
«Делаем всё, чтобы каждый покупатель игры был в восторге»: амбициозная песочница с тотальными разрушениями Kingmakers не выйдет 8 октября 10 ч.
Безумный роглайк Megabonk в духе Vampire Survivors уже стал хитом Steam — миллион проданных копий за две недели 11 ч.
ИИ-браузер Comet заставили воровать письма из Gmail и другие данные — в Perplexity только отмахнулась 11 ч.
Геймерскую мышь превратили в шпионский микрофон для прослушки пользователей 12 ч.
Облачный игровой сервис Xbox Cloud Gaming скоро станет бесплатным, но есть нюанс 13 ч.
Слухи: ремейк культовой Halo: Combat Evolved создаётся на гибридном движке при участии студии в ответе за The Elder Scrolls IV: Oblivion Remastered 14 ч.
Microsoft устранила ещё два препятствия, мешавших обновиться до Windows 11 25H2 14 ч.
Microsoft предсказала биологические угрозы «нулевого дня» из-за ИИ 15 ч.
Обнаружена уязвимость, которая ставит под угрозу пользователей всех игр на Unity с 2017 года 15 ч.
Властям США придётся ответить в суде за повышение стоимости рабочих виз H-1B до $100 000 6 мин.
Китай запустит эксплуатацию подводных центров обработки данных с целью снижения углеродных выбросов 38 мин.
Создание орбитальных центров обработки данных станет возможным через десять лет, как считает Джефф Безос 2 ч.
В южнокорейском Тэджоне загорелся уже второй ЦОД за неделю, сразу после инспекции пожарных — виноватым снова назначили ИБП 8 ч.
Google начала продавать запчасти для Pixel 10 и показала, как их ремонтировать 9 ч.
В Китае собрали крупнейший в мире плавучий ветрогенератор — его ротор охватывает площадь семи футбольных полей 12 ч.
Samsung представит гарнитуру смешанной реальности на Android XR уже в этом месяце 13 ч.
Thermal Grizzly представила эффективные термопрокладки Minus Pad extreme 2 и очень пластичные Minus Pad High Compression 13 ч.
До 2,8 МВт за 45 с: Rolls-Royce представила газовый генератор mtu 20V4000 L64 для дата-центров 15 ч.
UKPN начнёт отапливать дома британских малоимущих кластерами из сотен Raspberry Pi 16 ч.