Сегодня 30 июня 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

OpenAI представила две почти открытые модели для систем безопасности

OpenAI представила две рассуждающие модели искусственного интеллекта, предназначенные для обнаружения различных угроз безопасности на интернет-платформах. Они доступны по лицензии с открытыми весами.

 Источник изображения: Andrew Neel / unsplash.com

Источник изображения: Andrew Neel / unsplash.com

Новые открытые модели OpenAI получили названия gpt-oss-safeguard-120b и gpt-oss-safeguard-20b — последние показатели свидетельствуют о числе параметров. Это адаптированные версии анонсированных в августе бесплатных gpt-oss. Новые варианты также доступны с открытыми весами, то есть предлагают пользователям прозрачность и контроль, но это не модели с полностью открытым исходным кодом.

Организации могут настраивать их в соответствии со своими требованиями политики — модели выводят цепочки рассуждений, а значит, у разработчиков будет представление о том, как они приходят к тому или иному результату. Так, на сайте с обзорами модели серии gpt-oss-safeguard помогут для фильтрации отзывов, которые они сочтут поддельными; аналогичным образом на игровом форуме они смогут автоматически удалять сообщения о читерских схемах.

OpenAI разработала их совместно с Discord, SafetyKit и организацией ROOST, которая специализируется на инфраструктуре безопасности для систем ИИ. Модели доступны в формате предварительных версий для исследователей — OpenAI хочет собрать отзывы экспертов.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Ведущий дизайнер Baldur's Gate 2 отказался делать Baldur's Gate 4, потому что испугался конкуренции с Baldur's Gate 3 30 мин.
Apple ускорила выпуск обновлений безопасности в свете растущей угрозы со стороны ИИ 2 ч.
«Не терпится ждать это семь лет»: амбициозный мод Silksoul для Hollow Knight: Silksong впечатлил фанатов первым трейлером 3 ч.
State of Decay 3 может не выйти — Undead Labs оказалась под угрозой закрытия 4 ч.
Netflix выпустит сериал по мотивам Persona — первые подробности 6 ч.
Oracle пообещала сделать управление развитием MySQL более открытым, но сообщество требует гарантий 13 ч.
В WhatsApp появились никнеймы для скрытия телефонного номера — резервирование уже доступно 13 ч.
Календарь релизов — 29 июня – 5 июля: Undergrounded, Monopoly: Star Wars Heroes vs. Villains 15 ч.
Власти США предложили $10 млн за информацию о хакерах, атакующих пользователей WhatsApp и Signal 15 ч.
AMD выпустила драйвер Radeon с решением проблем с установкой на Windows 10 15 ч.
51,3 Тбит/с на 206,5 км без усилителей — китайская YOFC успешно протестировала полое оптоволокно 2 мин.
Первый ЦОД, построенный в действующей шахте, открылся в Доломитовых Альпах 27 мин.
NVIDIA Jetson поможет в ИИ-обработке данных на орбите Луны 34 мин.
GL.iNet представила первый в мире KVM для управления смартфонами Comet Q 42 мин.
Sony заявила, что не будет продавать PlayStation с большими для себя убытками 58 мин.
США оказались слишком зависимы от TSMC в технологиях передовой упаковки чипов 2 ч.
В Китае разогнали оптоволокно до 51,3 Тбит/с на дистанции более 200 км без ретрансляторов 4 ч.
Секреты Apple растеклись по миру: хакеры опубликовали изображения iPhone 18 Pro и другие данные, похищенные у Tata Electronics 5 ч.
Microsoft объявила о достижении положительного водного баланса, но не раскрыла объёмы потребления воды 5 ч.
ByteDance начнёт распространять ИИ-чипы собственной разработки со следующего года 7 ч.