Сегодня 04 февраля 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

OpenAI представила две почти открытые модели для систем безопасности

OpenAI представила две рассуждающие модели искусственного интеллекта, предназначенные для обнаружения различных угроз безопасности на интернет-платформах. Они доступны по лицензии с открытыми весами.

 Источник изображения: Andrew Neel / unsplash.com

Источник изображения: Andrew Neel / unsplash.com

Новые открытые модели OpenAI получили названия gpt-oss-safeguard-120b и gpt-oss-safeguard-20b — последние показатели свидетельствуют о числе параметров. Это адаптированные версии анонсированных в августе бесплатных gpt-oss. Новые варианты также доступны с открытыми весами, то есть предлагают пользователям прозрачность и контроль, но это не модели с полностью открытым исходным кодом.

Организации могут настраивать их в соответствии со своими требованиями политики — модели выводят цепочки рассуждений, а значит, у разработчиков будет представление о том, как они приходят к тому или иному результату. Так, на сайте с обзорами модели серии gpt-oss-safeguard помогут для фильтрации отзывов, которые они сочтут поддельными; аналогичным образом на игровом форуме они смогут автоматически удалять сообщения о читерских схемах.

OpenAI разработала их совместно с Discord, SafetyKit и организацией ROOST, которая специализируется на инфраструктуре безопасности для систем ИИ. Модели доступны в формате предварительных версий для исследователей — OpenAI хочет собрать отзывы экспертов.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
ChatGPT «упал» по всему миру: тысячи человек остались без ответов чат-бота OpenAI 11 мин.
Стала известна дата «смерти» ChromeOS — Google обеспечит достойный срок поддержки угасающей ОС 2 ч.
Магазин Epic Games Store станет быстрее и удобнее для пользователей 2 ч.
В Steam и VK Play вышла демоверсия российского шутера Grimps с «плюшевым» насилием и креативным арсеналом 2 ч.
Драматичный трейлер подтвердил новую дату выхода Forgotlings — нарисованной вручную метроидвании в мире оживших потерянных вещей 3 ч.
The Outer Worlds 2 и Avowed не оправдали ожиданий Microsoft, но это не конец для Obsidian 4 ч.
PayPal обзавёлся новым гендиректором — это бывший глава HP Энрике Лорес 5 ч.
Тратили больше, играли меньше: Epic Games Store подвёл итоги 2025 года 5 ч.
Новым курсом: российские ИБ-вендоры изучают перспективы выхода на рынки Китая и Индии 6 ч.
Китай вырвался вперёд: в шестёрке лучших открытых ИИ-моделей в мире не осталось американских 6 ч.
Новая статья: Почему MSI Spatium M560 дешевле других PCIе 5.0 SSD? Обзор с ответом 5 мин.
Western Digital раскрыла сроки выпуска HDD на 100 Тбайт — модели на 40–44 Тбайт с HAMR уже почти готовы 2 ч.
В межзвёздной среде впервые нашли сложное соединение серы — ещё одно свидетельство космического происхождения органики 6 ч.
В Китае запретили электромобили с выдвижными дверными ручками 6 ч.
OpenAI не устроили чипы NVIDIA для инференса, теперь она ищет альтернативы 7 ч.
Apple захватила 69 % американского рынка смартфонов — у Samsung в пять раз меньше 8 ч.
Xiaomi выпустила на глобальный рынок 27-дюймовый 200-Гц FHD-монитор G27i 2026 за $157 9 ч.
«Шоковая заморозка» для серверов: китайские учёные научились охлаждать системы ИИ за 20 секунд без фреона 9 ч.
Сделка на триллион с четвертью: SpaceX приобрела xAI 9 ч.
«Байкал Электроникс» открыл свободный доступ к документации на серийный микроконтроллер Baikal-U 10 ч.