Сегодня 10 июня 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

OpenAI представила две почти открытые модели для систем безопасности

OpenAI представила две рассуждающие модели искусственного интеллекта, предназначенные для обнаружения различных угроз безопасности на интернет-платформах. Они доступны по лицензии с открытыми весами.

 Источник изображения: Andrew Neel / unsplash.com

Источник изображения: Andrew Neel / unsplash.com

Новые открытые модели OpenAI получили названия gpt-oss-safeguard-120b и gpt-oss-safeguard-20b — последние показатели свидетельствуют о числе параметров. Это адаптированные версии анонсированных в августе бесплатных gpt-oss. Новые варианты также доступны с открытыми весами, то есть предлагают пользователям прозрачность и контроль, но это не модели с полностью открытым исходным кодом.

Организации могут настраивать их в соответствии со своими требованиями политики — модели выводят цепочки рассуждений, а значит, у разработчиков будет представление о том, как они приходят к тому или иному результату. Так, на сайте с обзорами модели серии gpt-oss-safeguard помогут для фильтрации отзывов, которые они сочтут поддельными; аналогичным образом на игровом форуме они смогут автоматически удалять сообщения о читерских схемах.

OpenAI разработала их совместно с Discord, SafetyKit и организацией ROOST, которая специализируется на инфраструктуре безопасности для систем ИИ. Модели доступны в формате предварительных версий для исследователей — OpenAI хочет собрать отзывы экспертов.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Вышло официальное приложение Telegram для Apple Watch 2 мин.
«Рад за своих праправнуков, которые доживут до релиза»: Kingdom Hearts 4 вернулась из небытия с новым трейлером 22 мин.
Еврокомиссия требует от Meta восстановить доступ конкурирующих ИИ-агентов к WhatsApp 2 ч.
Microsoft исправила три опасные уязвимости нулевого дня и ещё 200 багов в своём ПО 10 ч.
Orion soft представил платформу StarGuard AI для безопасной работы с ИИ 11 ч.
В ядре Linux нашли серьёзную уязвимость, созданную всего одним лишним символом в коде 13 ч.
«Могли бы обойтись электронным письмом»: новый трейлер боевика The Duskbloods от авторов Bloodborne и Elden Ring разочаровал фанатов 13 ч.
Meta будет использовать активность пользователей на других сайтах для персонализации их лент и ответов ИИ 14 ч.
Nintendo подтвердила ремейк легендарной The Legend of Zelda: Ocarina of Time эксклюзивно для Switch 2 14 ч.
«Всё по-честному, без обмана»: Сулейман из Microsoft отказался от своих слов о полной замене офисных сотрудников ИИ 15 ч.
Мечта о полёте к соседним звёздам на световых парусах столкнулась с суровой физикой 2 мин.
В России поступил в продажу смартфон Huawei nova 15 Max с батареей на 8500 мА·ч 37 мин.
ФАС проверит операторов на законность рекламы 5G — «не реализованных в настоящее время технологий» 3 ч.
Тайвань задумался об ограничении поставок ИИ-чипов в Китай в составе готовых систем 3 ч.
Автоконцерн GM будет выпускать аккумуляторы для инфраструктуры ИИ 4 ч.
Инвесторы готовы купить акций SpaceX на сумму более $250 млрд, вчетверо превышая предложение 5 ч.
Новая статья: Обзор игрового ноутбука ASUS ROG Zephyrus G14 GU405: пример удачной погони за двумя зайцами 10 ч.
NASA представило экипаж луной миссии Artemis 3, но до Луны он не доберётся 12 ч.
Финская твердотельная чудо-батарея Donut Lab оказалась фикцией — и способом выманить $25 млн у инвесторов 12 ч.
MaxSun выпустила низкопрофильную GeForce RTX 5060 с тройкой вентиляторов за $501 14 ч.