Сегодня 30 апреля 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

OpenAI представила две почти открытые модели для систем безопасности

OpenAI представила две рассуждающие модели искусственного интеллекта, предназначенные для обнаружения различных угроз безопасности на интернет-платформах. Они доступны по лицензии с открытыми весами.

 Источник изображения: Andrew Neel / unsplash.com

Источник изображения: Andrew Neel / unsplash.com

Новые открытые модели OpenAI получили названия gpt-oss-safeguard-120b и gpt-oss-safeguard-20b — последние показатели свидетельствуют о числе параметров. Это адаптированные версии анонсированных в августе бесплатных gpt-oss. Новые варианты также доступны с открытыми весами, то есть предлагают пользователям прозрачность и контроль, но это не модели с полностью открытым исходным кодом.

Организации могут настраивать их в соответствии со своими требованиями политики — модели выводят цепочки рассуждений, а значит, у разработчиков будет представление о том, как они приходят к тому или иному результату. Так, на сайте с обзорами модели серии gpt-oss-safeguard помогут для фильтрации отзывов, которые они сочтут поддельными; аналогичным образом на игровом форуме они смогут автоматически удалять сообщения о читерских схемах.

OpenAI разработала их совместно с Discord, SafetyKit и организацией ROOST, которая специализируется на инфраструктуре безопасности для систем ИИ. Модели доступны в формате предварительных версий для исследователей — OpenAI хочет собрать отзывы экспертов.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Epic Games Store устроил раздачу Hogwarts Legacy в честь 25-летия кинофраншизы «Гарри Поттер» — россиян оставили без подарка 16 мин.
Microsoft запустила тестирование универсального апскейлера Auto SR для Windows 11 — пока только на Xbox Ally X 2 ч.
Атмосферный трейлер раскрыл дату погружения Subnautica 2 в ранний доступ — ждать осталось недолго 3 ч.
Google готова показывать рекламу в Gemini — OpenAI уже делает это в ChatGPT 3 ч.
«Продолжаете удивлять, капитаны!»: пиратский хит Windrose достиг новой вершины продаж и получил патч с техническими улучшениями 4 ч.
Обновлённые Microsoft PowerToys научились управлять мониторами и улучшили работу с окнами 4 ч.
OpenAI объяснила борьбу с гремлинами в ответах ИИ — и позволила снять ограничения 5 ч.
Работник Warner Bros. Games проговорился, что следующей игрой создателей Mortal Kombat станет Injustice 3 5 ч.
«DLSS 5 у нас дома»: Roblox готовит Reality — фотореалистичную игровую платформу с ИИ-рендерингом 5 ч.
Провайдер Cloudflare назвал мессенджер Max шпионским и вредоносным — разработчики ответили 7 ч.
Продажи AWS растут благодаря ИИ, но не так быстро, как у конкурентов 60 мин.
ИИ-ассистент Gemini появится в миллионах автомобилей с поддержкой сервисов Google 2 ч.
Noctua объяснила, почему чёрные вентиляторы выходят позже стандартных бежево-коричневых 3 ч.
Бум ИИ сделал микросхемы памяти одним из самых прибыльных продуктов в мире 3 ч.
Запуск телескопа NASA «Роман» не свернёт работу «Хаббла» — её продолжат, а то и расширят 3 ч.
Samsung предупредила, что дефицит оперативной памяти может ещё больше усугубиться в 2027 году 3 ч.
Представлены ретрофутуристические портативные консоли, вдохновлённые легендарными Commodore 64 и ZX Spectrum 4 ч.
Reliance потратит $17 млрд на крупнейший в Индии кластер ЦОД мощностью 1,5 ГВт 4 ч.
Бум ИИ оставил стройки жилых домов без электриков — в дата-центрах платят больше 5 ч.
Samsung готовит ноутбуки на Aluminium OS — компьютерный Android получит интерфейс One UI 5 ч.