Сегодня 10 апреля 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

OpenAI представила две почти открытые модели для систем безопасности

OpenAI представила две рассуждающие модели искусственного интеллекта, предназначенные для обнаружения различных угроз безопасности на интернет-платформах. Они доступны по лицензии с открытыми весами.

 Источник изображения: Andrew Neel / unsplash.com

Источник изображения: Andrew Neel / unsplash.com

Новые открытые модели OpenAI получили названия gpt-oss-safeguard-120b и gpt-oss-safeguard-20b — последние показатели свидетельствуют о числе параметров. Это адаптированные версии анонсированных в августе бесплатных gpt-oss. Новые варианты также доступны с открытыми весами, то есть предлагают пользователям прозрачность и контроль, но это не модели с полностью открытым исходным кодом.

Организации могут настраивать их в соответствии со своими требованиями политики — модели выводят цепочки рассуждений, а значит, у разработчиков будет представление о том, как они приходят к тому или иному результату. Так, на сайте с обзорами модели серии gpt-oss-safeguard помогут для фильтрации отзывов, которые они сочтут поддельными; аналогичным образом на игровом форуме они смогут автоматически удалять сообщения о читерских схемах.

OpenAI разработала их совместно с Discord, SafetyKit и организацией ROOST, которая специализируется на инфраструктуре безопасности для систем ИИ. Модели доступны в формате предварительных версий для исследователей — OpenAI хочет собрать отзывы экспертов.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Microsoft заверила, что исправила все ошибки Windows 11 25H2 — по крайней мере известные 40 мин.
Google внедрила сквозное шифрование в Gmail на Android и iOS, но не для всех 46 мин.
После года жалоб игроков разработчики Dune: Awakening всё-таки сделают PvP полностью опциональным 55 мин.
Утилиты CPU-Z и HWMonitor подменили вредоносами на официальном сайте — разработчики уже всё исправили 4 ч.
Microsoft опровергла своё же заявление, что Copilot — только для развлечений 5 ч.
Wasabi купит у Seagate сервис облачного хранения Lyve Cloud 5 ч.
Экранизация Metal Gear Solid спустя 20 лет после анонса подала признаки жизни — фильм снимут режиссёры ужастика «Пункт назначения: Узы крови» 5 ч.
Mozilla раскритиковала Microsoft, которая навязывает ИИ Copilot 6 ч.
Европа оштрафовала американских бигтехов на $7 млрд за два года и разозлила Трампа 6 ч.
OpenAI вслед за Anthropic объявила о создании мощнейшего ИИ, который опасно давать в руки всем подряд 6 ч.
Big Battlemage наконец предстал на фото: в Сети показали разборку видеокарты Intel Arc Pro B70 26 мин.
«Удачи вам в ваших сборках!»: EK Water Blocks подняла цены на компоненты для систем жидкостного охлаждения 29 мин.
На падающем рынке смартфонов Apple нарастила поставки iPhone и выбилась в лидеры 32 мин.
Xiaomi представила доступного конкурента MacBook Pro на процессоре Intel Panther Lake 42 мин.
Спотовые цены на DDR4 упали на 5 % — впервые за год 42 мин.
Xiaomi 15T, Redmi Note 15 Pro 5G и Poco M8 — производительные и надёжные смартфоны 45 мин.
Framework предрекла смерть ПК в их теперешнем виде 46 мин.
В Южной Корее ввели бесплатный базовый мобильный интернет — даже после исчерпания трафика 48 мин.
Миллиард за мегаватт: «Ростелеком» построит 100-МВт дата-центр за 100 млрд рублей 3 ч.
DJI выпустила электродвигатели, которые стирают грань между мотоциклом и велосипедом — Avinox M2S выдаст до двух «лошадок» 4 ч.