Сегодня 23 марта 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

OpenAI представила две почти открытые модели для систем безопасности

OpenAI представила две рассуждающие модели искусственного интеллекта, предназначенные для обнаружения различных угроз безопасности на интернет-платформах. Они доступны по лицензии с открытыми весами.

 Источник изображения: Andrew Neel / unsplash.com

Источник изображения: Andrew Neel / unsplash.com

Новые открытые модели OpenAI получили названия gpt-oss-safeguard-120b и gpt-oss-safeguard-20b — последние показатели свидетельствуют о числе параметров. Это адаптированные версии анонсированных в августе бесплатных gpt-oss. Новые варианты также доступны с открытыми весами, то есть предлагают пользователям прозрачность и контроль, но это не модели с полностью открытым исходным кодом.

Организации могут настраивать их в соответствии со своими требованиями политики — модели выводят цепочки рассуждений, а значит, у разработчиков будет представление о том, как они приходят к тому или иному результату. Так, на сайте с обзорами модели серии gpt-oss-safeguard помогут для фильтрации отзывов, которые они сочтут поддельными; аналогичным образом на игровом форуме они смогут автоматически удалять сообщения о читерских схемах.

OpenAI разработала их совместно с Discord, SafetyKit и организацией ROOST, которая специализируется на инфраструктуре безопасности для систем ИИ. Модели доступны в формате предварительных версий для исследователей — OpenAI хочет собрать отзывы экспертов.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Ролевой боевик The Expanse: Osiris Reborn в духе Mass Effect скоро выйдет из тени — анонсирована новая презентация Xbox Partner Preview 29 мин.
В России разрешат искать экстремистские материалы в интернете, но только учёным и правоохранителям 4 ч.
«Не все изменения окончательны»: разработчики Slay the Spire 2 отреагировали на панику фанатов из-за первого обновления баланса игры 5 ч.
Capcom заинтриговала фанатов Dragon’s Dogma 2 — на иллюстрации ко второй годовщине игры углядели тизер крупного DLC 6 ч.
Марк Цукерберг создаёт ИИ-гендира: агента, который поможет ему руководить Meta 6 ч.
Ошибочка вышла: разработчики Crimson Desert попались на использовании генеративного ИИ, но пообещали всё исправить 7 ч.
«Ждал этого пять лет»: ролевой экшен Minecraft Dungeons в духе Diablo всё же получит продолжение, причём уже скоро 9 ч.
Microsoft пообещала сделать Windows 11 «более расслабленной и спокойной» 17 ч.
Программисты всё больше пользуются ИИ, а в некоторых компаниях это даже превратилось в соревнование 22-03 15:39
Франция обвинила Илона Маска в завышении стоимости X и xAI дипфейками с обнажёнкой 22-03 13:05
В Bloomberg назвали главного кандидата на замену Тиму Куку на посту главы Apple 13 мин.
iPhone Air оказался намного популярнее iPhone 16 Plus, а модем Apple C1X почти догнал аналоги Qualcomm 2 ч.
После волны критики разработчик Crimson Desert пообещал добавить поддержку видеокарт Intel Arc 2 ч.
Intel признала, что её новые настольные Core Ultra Plus почти не быстрее Ryzen в играх 3 ч.
Москвичи вынужденно пересели на Wi-Fi: трафик публичных точек доступа вырос в разы из-за отключений мобильного интернета 3 ч.
Мировой рынок чипов разросся до $831 млрд в прошлом году — сильнее всех выросла не Nvidia 3 ч.
DDoS нового уровня: Curator нейтрализовала длительную атаку в 2 Тбит/с на платформу онлайн-ставок 4 ч.
Обновлённый Xiaomi SU7 оказался популярнее предшественника — электромобиль уже собрал более 30 000 заказов 5 ч.
Сначала Kyber, потом Feynman: NVIDIA раскрыла планы по выпуску ИИ-решений до 2028 года 5 ч.
Мини-ПК ASUS ExpertCenter PN55 получил чип AMD Ryzen AI 400 с ИИ-производительностью до 91 TOPS 6 ч.