Сегодня 11 февраля 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

OpenAI представила две почти открытые модели для систем безопасности

OpenAI представила две рассуждающие модели искусственного интеллекта, предназначенные для обнаружения различных угроз безопасности на интернет-платформах. Они доступны по лицензии с открытыми весами.

 Источник изображения: Andrew Neel / unsplash.com

Источник изображения: Andrew Neel / unsplash.com

Новые открытые модели OpenAI получили названия gpt-oss-safeguard-120b и gpt-oss-safeguard-20b — последние показатели свидетельствуют о числе параметров. Это адаптированные версии анонсированных в августе бесплатных gpt-oss. Новые варианты также доступны с открытыми весами, то есть предлагают пользователям прозрачность и контроль, но это не модели с полностью открытым исходным кодом.

Организации могут настраивать их в соответствии со своими требованиями политики — модели выводят цепочки рассуждений, а значит, у разработчиков будет представление о том, как они приходят к тому или иному результату. Так, на сайте с обзорами модели серии gpt-oss-safeguard помогут для фильтрации отзывов, которые они сочтут поддельными; аналогичным образом на игровом форуме они смогут автоматически удалять сообщения о читерских схемах.

OpenAI разработала их совместно с Discord, SafetyKit и организацией ROOST, которая специализируется на инфраструктуре безопасности для систем ИИ. Модели доступны в формате предварительных версий для исследователей — OpenAI хочет собрать отзывы экспертов.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Discord объяснил, почему большинству пользователей не придётся проходить проверку возраста 3 ч.
Облачная служба Apple хранения данных iCloud столкнулась с массовым техническим сбоем 3 ч.
Facebook научился оживлять фото профиля с помощью ИИ 4 ч.
Nothing запустила бета-версию Essential Apps — ИИ-конструктора мини-приложений 10 ч.
Nebius Аркадия Воложа купит за $275 млн разработчика поисковых систем для ИИ-агентов Tavily 10 ч.
Тактический роглайк о разведении кошек Mewgenics от автора The Binding of Isaac и Super Meat Boy стартовал в Steam с рейтингом 97 % 10 ч.
Анонсирована Terrinoth: Heroes of Descent — тактическая RPG по популярной настольной игре Descent 11 ч.
Спустя шесть лет после релиза средневековая песочница Besiege отправит игроков покорять космос — подробности аддона The Broken Beyond 12 ч.
ИИ научился формировать политические взгляды так же эффективно, как человек — и людей это не смущает 12 ч.
DuckDuckGo добавила голосовое общение с ИИ-ботом Duck.ai с защитой приватности 12 ч.
Илон Маск потерял ещё одного ключевого сотрудника стартапа xAI 3 ч.
ЕС предложил полностью запретить криптовалютные операции с Россией в рамках нового пакета санкций 3 ч.
По итогам 2026 года ёмкость рынка памяти в два с лишним раза превысит оборот рынка контрактных услуг по производству чипов 4 ч.
Новая статья: Обзор смартфона vivo X300 Pro: маленькие изменения, которые ведут к большому результату 9 ч.
Filum представила серию беспроводных клавиатур FL-WKB с ярким дизайном и подключением по Bluetooth или 2,4 ГГц 10 ч.
Представлены доступные геймерские мониторы AOC Gaming 24G4ZR и AOC Gaming 27G4ZR на панелях Fast IPS 13 ч.
Камера для звёзд и туманностей: OM System представила OM-3 Astro, которая видит больше обычных беззеркалок 13 ч.
Путь к 1 нм: в TSMC одобрили рекордные $45 млрд инвестиций в производство 14 ч.
Cisco представила 102,4-Тбит/с чип-коммутатор Silicon One G300 15 ч.
Китай поднял в небо крупнейшую «летающую маршрутку» — eVTOL на 10 пассажиров и с 28 двигателями 15 ч.