Сегодня 23 февраля 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Теги → gpt-4o mini

OpenAI повысит безопасность своих ИИ-моделей с помощью «иерархии инструкций»

OpenAI разработала новый метод под названием «Иерархия инструкций» для повышения безопасности своих больших языковых моделей (LLM). Этот метод, впервые применённый в новой модели GPT-4o Mini, направлен на предотвращение нежелательного поведения ИИ, вызванного манипуляциями недобросовестных пользователей с помощью определённых команд.

 Источник изображения: Copilot

Источник изображения: Copilot

Руководитель платформы API в OpenAI Оливье Годеман (Olivier Godement) объяснил, что «иерархия инструкций» позволит предотвращать опасные инъекции промтов с помощью скрытых подсказок, которые пользователи используют для обхода ограничений и изначальных установок модели, и блокировать атаки типа «игнорировать все предыдущие инструкции».

Новый метод, как пишет The Verge, отдаёт приоритет исходным инструкциям разработчика, делая модель менее восприимчивой к попыткам конечных пользователей заставить её выполнять нежелательные действия. В случае конфликта между системными инструкциями и командами пользователя, модель будет отдавать наивысший приоритет именно системным инструкциям, отказываясь выполнять инъекции.

Исследователи OpenAI считают, что в будущем будут разработаны и другие, более сложные средства защиты, особенно для агентных сценариев использования, при которых ИИ-агенты создаются разработчиками для собственных приложений. Учитывая, что OpenAI сталкивается с постоянными проблемами в области безопасности, новый метод, применённый к GPT-4o Mini, имеет большое значение для последующего подхода к разработке ИИ-моделей.

OpenAI представила облегченную мощную ИИ-модель GPT-4o Mini — она заменит GPT-3.5 для всех пользователей

Компания OpenAI официально представила упрощённую и более доступную версию своей самой мощной большой языковой модели GPT-4o. Речь идёт о нейросети GPT-4o Mini, использование которой для разработчиков будет более выгодно с экономической точки зрения, но при этом её производительность выше, чем у GPT-3.5.

 Источник изображения: Growtika / unsplash.com

Источник изображения: Growtika / unsplash.com

Создание приложений с использованием языковых моделей OpenAI может обернуться огромными расходами. При отсутствии достаточного количества средств разработчики могут отказаться от их использования в пользу более доступных аналогов, таких как Gemini 1.5 Flash от Google или Claude 3 Haiku от Anthropic. Теперь же с запуском GPT-4o Mini в этом сегменте конкуренция будет более острой.

«Я думаю, что GPT-4o Mini действительно соответствует миссии OpenAI — сделать более доступный для людей ИИ-алгоритм. Если мы хотим, чтобы ИИ приносил пользу в каждом уголке мира, в каждой отрасли, в каждом приложении, мы должны сделать ИИ гораздо более доступным», — рассказал представитель OpenAI.

Начиная с сегодняшнего дня, пользователи ChatGPT на тарифах Free, Plus и Team могут использовать GPT-4o Mini вместо GPT-3.5 Turbo, а пользователи на тарифе Enterprise получат такую возможность на следующей неделе. Это означает, что языковая модель GPT-3.5 больше не будет доступна для пользователей ChatGPT, но её по-прежнему смогут задействовать разработчики через соответствующий API, если они не планируют перейти на GPT-4o Mini. Когда именно доступ к GPT-3.5 будет закрыт полностью, пока неизвестно.

Языковая модель GPT-4o Mini поддерживает работу с текстом, изображениями, аудио- и видеоконтентом. При этом алгоритм всё же предназначен для решения простых задач, поэтому он может оказаться полезным для добавления разных узконаправленных функций в приложения сторонних разработчиков. В эталонном тесте MMLU новая языковая модель OpenAI набрала 82 %. Для сравнения, результат GPT-3.5 в этом же тесте 70 %, GPT-4o — 88,7 %, Gemini Ultra — 90 %. Конкурирующие с GPT-4o Mini языковые модели Claude 3 Haiku и Gemini 1.5 Flash набрали в этом тесте 75,2 % и 78,9 % соответственно.


window-new
Soft
Hard
Тренды 🔥
«Даже местные разработчики ничего подобного не делали»: трейлер Forza Horizon 6 с живописными видами Японии впечатлил геймеров 2 ч.
На Android вышел ИИ-сервис диктовки Wispr Flow — без смены клавиатуры, более 100 языков, бесплатно и без лимитов 3 ч.
Tencent закрыла новую студию скандального режиссёра Assassin’s Creed IV: Black Flag и Origins — за пять лет она не выпустила ни одной игры 4 ч.
Новый гендиректор Microsoft Gaming рассекретила личный аккаунт Xbox — геймеры заподозрили подвох 4 ч.
xAI отложила релиз новой версии Grok из-за Baldur’s Gate 3, а Илон Маск одержим идеей научить чат-бот играть в League of Legends 5 ч.
Samsung улучшит ИИ-функции Galaxy AI за счёт партнёрства с Perplexity 22-02 12:34
AMD прекратила выпускать обновления драйверов для Ryzen Z1 Extreme 22-02 11:59
Активисты Stop Killing Games будут «кошмарить» издателей за закрытие старых игр на юридической основе 22-02 10:55
Новая статья: Reanimal — мастер-класс, но не без изъянов. Рецензия 22-02 00:09
Не только Cyberpunk 2077: на мощных Android-устройствах заработали AAA-игры для ПК, но с ограничениями 21-02 16:59
Nothing показала смартфон Phone (4a) в преддверии анонса — Glyph Bar вместо светодиодных полос 20 мин.
Утечка объяснила, как работает защита от подглядываний на экранах Galaxy S26 57 мин.
Honor ворвётся на рынок человекоподобных роботов — первенца покажут уже на этой неделе 3 ч.
Разработчики человекоподобных роботов теперь стараются делать их милыми и больше похожими на людей 3 ч.
Индустриальный компьютер OnLogic Factor 101 получил чип Qualcomm QCS6490 и порт 10GbE 3 ч.
Акции Nvidia упёрлись в потолок и даже отличный квартальный отчёт вряд ли их поднимет — скорее наоборот 3 ч.
Плееры iPod вернулись в моду — продажи подскочили на 20–25 %, и вот почему 3 ч.
Китайская CXMT обрушила цены на DDR4 — вдвое дешевле Samsung и SK hynix 3 ч.
Спрос на виниловые пластинки в России взлетел на 15 % в 2025 году 4 ч.
США отправят «миссионеров ИИ» по всему миру — Трамп запустил Tech Corps, чтобы укрепить влияние и сдержать Китай 6 ч.