Сегодня 21 мая 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

OpenAI представила две почти открытые модели для систем безопасности

OpenAI представила две рассуждающие модели искусственного интеллекта, предназначенные для обнаружения различных угроз безопасности на интернет-платформах. Они доступны по лицензии с открытыми весами.

 Источник изображения: Andrew Neel / unsplash.com

Источник изображения: Andrew Neel / unsplash.com

Новые открытые модели OpenAI получили названия gpt-oss-safeguard-120b и gpt-oss-safeguard-20b — последние показатели свидетельствуют о числе параметров. Это адаптированные версии анонсированных в августе бесплатных gpt-oss. Новые варианты также доступны с открытыми весами, то есть предлагают пользователям прозрачность и контроль, но это не модели с полностью открытым исходным кодом.

Организации могут настраивать их в соответствии со своими требованиями политики — модели выводят цепочки рассуждений, а значит, у разработчиков будет представление о том, как они приходят к тому или иному результату. Так, на сайте с обзорами модели серии gpt-oss-safeguard помогут для фильтрации отзывов, которые они сочтут поддельными; аналогичным образом на игровом форуме они смогут автоматически удалять сообщения о читерских схемах.

OpenAI разработала их совместно с Discord, SafetyKit и организацией ROOST, которая специализируется на инфраструктуре безопасности для систем ИИ. Модели доступны в формате предварительных версий для исследователей — OpenAI хочет собрать отзывы экспертов.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Postgres Professional представила СУБД Postgres Pro AXE для гибридных нагрузок 4 ч.
Цукерберг успокоил сотрудников Meta: новых массовых увольнений в этом году не ожидается 5 ч.
Microsoft позвала звёздного аналитика Мэттью Болла спасать стратегию Xbox 5 ч.
«Очередной шедевр Amanita»: авангардная головоломка Phonopolis от авторов Machinarium и Samorost стартовала в Steam с рейтингом 96 % 7 ч.
Embracer подтвердила сроки релиза следующей игры Warhorse Studios — новая Kingdom Come может выйти уже в 2027 году 8 ч.
Хакеры слили данные клиентов Trump Mobile и раскрыли реальные продажи смартфона T1 9 ч.
Сетевой боевик Spellcasters Chronicles от авторов Detroit: Become Human закроется спустя четыре месяца раннего доступа, зато у Star Wars Eclipse всё хорошо 9 ч.
Apple похвалилась, что пресекла мошеннические транзакции на $11,2 млрд за шесть лет и на этом не остановится 10 ч.
Owlcat раскрыла статистику участников «беты» The Expanse: Osiris Reborn и рассказала, как будет улучшать игру после критики фанатов 10 ч.
Настольные приложения «Яндекс Диска» перестанут нормально работать у бесплатных пользователей 11 ч.
Samsung увернулась от забастовки, способной взвинтить цены на память — рабочие добились повышения премий 6 ч.
Китайские учёные впервые в истории запитали несколько движущихся по воздуху целей микроволновым лучом 7 ч.
Founders Edition, но не от Nvidia: китайская Lisuan Tech показала игровую видеокарту LX 7G100 в эталонном исполнении 7 ч.
Alibaba представила ИИ-ускоритель Zhenwu M890, который втрое быстрее предшественника 9 ч.
Суперкомпьютер по подписке: Bull предоставила Airbus инфраструктуру HPC-as-a-service 10 ч.
«Билайн бизнес» сообщил о массовом внедрении аудиобейджей с ИИ — они проанализировали 600 тысяч часов разговоров 10 ч.
Intel запустила разработку сверхтонких техпроцессов Intel 10A и 7A, а первые 14-ангстремные чипы отправят на опыты уже в октябре 11 ч.
Представлен iQOO 15T — игровой смартфон с разогнанным Dimensity 9500, 200-Мп камерой и батареей на 8000 мА⋅ч 11 ч.
AMD готовит мини-ПК Ryzen AI Halo для вайб-кодинга без облака за $3999 11 ч.
Производитель премиальной мебели Herman Miller выпустил геймерский стол Coyl — от $1095 11 ч.