Сегодня 07 мая 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

OpenAI представила две почти открытые модели для систем безопасности

OpenAI представила две рассуждающие модели искусственного интеллекта, предназначенные для обнаружения различных угроз безопасности на интернет-платформах. Они доступны по лицензии с открытыми весами.

 Источник изображения: Andrew Neel / unsplash.com

Источник изображения: Andrew Neel / unsplash.com

Новые открытые модели OpenAI получили названия gpt-oss-safeguard-120b и gpt-oss-safeguard-20b — последние показатели свидетельствуют о числе параметров. Это адаптированные версии анонсированных в августе бесплатных gpt-oss. Новые варианты также доступны с открытыми весами, то есть предлагают пользователям прозрачность и контроль, но это не модели с полностью открытым исходным кодом.

Организации могут настраивать их в соответствии со своими требованиями политики — модели выводят цепочки рассуждений, а значит, у разработчиков будет представление о том, как они приходят к тому или иному результату. Так, на сайте с обзорами модели серии gpt-oss-safeguard помогут для фильтрации отзывов, которые они сочтут поддельными; аналогичным образом на игровом форуме они смогут автоматически удалять сообщения о читерских схемах.

OpenAI разработала их совместно с Discord, SafetyKit и организацией ROOST, которая специализируется на инфраструктуре безопасности для систем ИИ. Модели доступны в формате предварительных версий для исследователей — OpenAI хочет собрать отзывы экспертов.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Anthropic наделила управляемых ИИ-агентов Claude «сновидениями» — в некотором роде 41 мин.
Лаконичный трейлер раскрыл дату выхода и цену олдскульного приключения Mina the Hollower от создателей Shovel Knight 4 ч.
AMD выпустила драйвер с поддержкой Pragmata и других новых игр 5 ч.
Славянская Devil May Cry: разработчики балетного слешера «Царевна: Эпоха сказок» показали пять минут чистого геймплея 6 ч.
Meta готовит персонального ИИ-помощника для миллиардов пользователей — проект на $145 млрд пугает инвесторов 7 ч.
Второй трейлер GTA VI вышел ровно год назад, а фанаты вычислили дату следующего показа по расположению планет 7 ч.
Серверы Ubuntu снова заработали после пятидневной DDoS-атаки 8 ч.
Соавтор Mortal Kombat подтвердил работу над новой Mortal Kombat «и не только» 8 ч.
Google проведёт 12 мая мероприятие Android Show I/O Edition — там расскажут об Android 17 и, вероятно, об Aluminium OS 9 ч.
Gemini в «Google Документах» научился запоминать «постоянные» инструкции 9 ч.
1 Тбайт/с на x16: PCI-SIG раньше срока предоставила спецификации PCI Express 8.0 версии 0.5 42 мин.
Новая статья: Обзор и тестирование корпуса Xastra A700 ARGB «башня» для всего 2 ч.
Инвесторы требуют от Nintendo поднять цену Switch 2 — сейчас консоль убыточна 3 ч.
Corning построит в США три завода по выпуску оптоволокна для ИИ ЦОД с чипами NVIDIA 4 ч.
Смарт-кольцо Samsung Galaxy Ring 2 выйдет не раньше 2027 года — с упором на автономность и мониторинг здоровья 5 ч.
Мировой рынок чипов идёт к $1 трлн — первый квартал принёс почти $300 млрд 5 ч.
Energizer представила безопасные для детей и питомцев батарейки-таблетки — они не вызывают ожогов при проглатывании 5 ч.
Nvidia с помощью Corning заменит тысячи медных кабелей в дата-центрах оптикой — ради скорости и экономии энергии 5 ч.
AMD уйдёт от универсальных серверных CPU — EPYC ждёт дробление под ИИ, облака и другие сценарии 8 ч.
Россияне смогут с 1 сентября сохранять номера телефонов при переезде в другие регионы 8 ч.