Сегодня 07 февраля 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

OpenAI представила две почти открытые модели для систем безопасности

OpenAI представила две рассуждающие модели искусственного интеллекта, предназначенные для обнаружения различных угроз безопасности на интернет-платформах. Они доступны по лицензии с открытыми весами.

 Источник изображения: Andrew Neel / unsplash.com

Источник изображения: Andrew Neel / unsplash.com

Новые открытые модели OpenAI получили названия gpt-oss-safeguard-120b и gpt-oss-safeguard-20b — последние показатели свидетельствуют о числе параметров. Это адаптированные версии анонсированных в августе бесплатных gpt-oss. Новые варианты также доступны с открытыми весами, то есть предлагают пользователям прозрачность и контроль, но это не модели с полностью открытым исходным кодом.

Организации могут настраивать их в соответствии со своими требованиями политики — модели выводят цепочки рассуждений, а значит, у разработчиков будет представление о том, как они приходят к тому или иному результату. Так, на сайте с обзорами модели серии gpt-oss-safeguard помогут для фильтрации отзывов, которые они сочтут поддельными; аналогичным образом на игровом форуме они смогут автоматически удалять сообщения о читерских схемах.

OpenAI разработала их совместно с Discord, SafetyKit и организацией ROOST, которая специализируется на инфраструктуре безопасности для систем ИИ. Модели доступны в формате предварительных версий для исследователей — OpenAI хочет собрать отзывы экспертов.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
В системе автообновления драйверов AMD обнаружена опасная уязвимость, но компания её не замечает 2 ч.
Команда из 16 ИИ-агентов Anthropic Claude смогла самостоятельно написать компилятор языка Си 2 ч.
Стриминговый сервис Disney+ лишился поддержки Dolby Vision, HDR10+ и 3D на фоне патентного спора 4 ч.
Apple откроет сторонним чат-ботам с ИИ доступ в CarPlay 4 ч.
Проблемное обновление Windows серьёзно замедлило видеокарты Nvidia 8 ч.
Распространяющийся через пиратские копии игр вирус RenEngine loader заразил 400 тыс. ПК 8 ч.
Из-за ошибки в коде программа-вымогатель Nitrogen шифрует файлы жертв безвозвратно 18 ч.
Новая статья: Highguard — хаос с потенциалом. Рецензия 21 ч.
Названы 26 ключевых технологий, которые в ближайшие 5 лет получат широкое применение в российском бизнесе 23 ч.
«Death Stranding в XIII столетии»: игроков впечатлил геймплей симулятора монгольского средневекового курьера The Legend of Khiimori 24 ч.
Китай в четвёртый раз запустил собственный космоплан — миссия засекречена 2 ч.
Asus выпустила внешний контейнер ROG Strix Aiolos для M.2 SSD со скоростью до 20 Гбит/с 3 ч.
AWS: ни один сервер с NVIDIA A100 не выведен из эксплуатации, а некоторые клиенты всё ещё используют Intel Haswell — не всем нужен ИИ 4 ч.
SpaceX разрешили возобновить запуски Falcon 9 после аварии — полёт на МКС намечен на 11 февраля 5 ч.
Акции американских бигтехов вернулись к росту после трёхдневного падения 5 ч.
Nintendo ожидает, что рост цен на память не особо повлияет на бизнес компании до конца марта 5 ч.
Военные США заплатят за разработку фотонных чипов для ИИ — для этого придётся в чём-то обмануть физику 5 ч.
Trump Mobile показала очередной вариант смартфона T1 Phone и рассказала о причинах задержки его запуска 7 ч.
Broadcom представила первые в отрасли решения Wi-Fi 8 для точек доступа и коммутаторов корпоративного класса 7 ч.
Montage Technology представила активные кабели PCIe 6.x/CXL 3.x 7 ч.