Сегодня 18 января 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

У ИИ-бота Grok Илона Маска оказалось очень легко выпытать рекомендации по совершению преступлений

Модель генеративного искусственного интеллекта Grok, разработанная под руководством Илона Маска (Elon Musk), оказалась наиболее уязвимой к атакам, направленным на нарушение запретов — в отдельных случаях она без лишних ухищрений рассказывает, как совершать преступления, например, вскрыть чужую машину или создать запрещённые вещества.

 Источник изображения: x.ai

Источник изображения: x.ai

Открытие сделали специалисты Adversa AI. Они провели серию тестов на наиболее популярных чат-ботах с ИИ. В их число вошло семейство OpenAI ChatGPT, Mistral Le Chat, Meta LLaMA, Google Gemini, Microsoft Bing и Grok. Применив к ним наиболее известные методики атак, исследователи сделали вывод, что наиболее слабая защита у чат-бота Grok, который работает в соцсети X.

Атаки производятся посредством ввода в качестве запросов специальных запросов, провоцирующих ИИ игнорировать защитные механизмы и выдавать ответы, которые нарушают общепризнанные этические нормы. В частности, применялись методы лингвистических логических манипуляций UCAR (подражание аморальному компьютеру); манипуляции с логикой программирования (просьба к ИИ переводить запросы в формат SQL); логические манипуляции; а также метод «Тома и Джерри», маскирующий недопустимые запросы к ИИ под диалог.

Когда доступ к ИИ осуществляется через API или интерфейс чат-бота, создатели сервисов накладывают на них ограничения, блокирующие вывод нежелательного контента. Эти средства в той или иной мере работают эффективно на большинстве платформ, но Grok оказался готовым выдавать сомнительную информацию по прямым запросам: так, он рассказал, как изготовить бомбу, взломать автомобиль или самостоятельно получить запрещённый во многих странах сильнодействующий галлюциноген. От других чат-ботов авторам исследования не удалось добиться вразумительных ответов о жестоком обращении с детьми — не работал ни один из методов атаки. Grok поделился и этой информацией, поддавшись на две атаки из четырёх.

Условия использования Grok требуют, чтобы его пользователи были совершеннолетними и не использовали чат-бот для нарушения или попыток нарушить закон. Предоставляемая им порой информация в той или иной мере доступна в поисковых системах, но бум современных систем ИИ поставил перед обществом другой вопрос: хотим ли мы, чтобы потенциально опасную информацию распространяли ещё и чат-боты.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Вечерний 3DNews
Каждый будний вечер мы рассылаем сводку новостей без белиберды и рекламы. Две минуты на чтение — и вы в курсе главных событий.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Новая статья: Marvel Rivals — нужна ли теперь Overwatch? Рецензия 7 ч.
Ремастер Tomb Raider: The Angel of Darkness для сборника Tomb Raider IV-VI Remastered раскроет потенциал худшей игры серии — подробности улучшений 9 ч.
Первый «геймплей» Virtua Fighter 6 оказался точной копией боевой сцены из фильма «Драконы навсегда» с Джеки Чаном 11 ч.
Руководитель разработки Dragon Age: The Veilguard покинет BioWare после 18 лет в Electronic Arts 12 ч.
Верховный суд США поддержал закон о блокировке TikTok — соцсети осталось два дня 12 ч.
ЕС потребовал от соцсети X раскрыть алгоритм рекомендаций и политику модерирования 13 ч.
Российские пользователи пожаловались на сбой Steam, но Роскомнадзор тут ни при чём 13 ч.
Планшеты Android 16 смогут запускать до трёх приложений на одном экране 14 ч.
Google заявила, что не будет соблюдать грядущий закон ЕС о фактчекинге 14 ч.
Байден не будет блокировать TikTok в США в свой последний рабочий день — судьбу соцсети решит Трамп 15 ч.
Трамп планирует объявить криптовалюту национальным приоритетом и создать консультативный совет по криптовалютам 6 ч.
Sparkle и OEC переработают 22 тыс. км подводных кабелей 7 ч.
Lenovo купила поставщика СХД Infinidat 8 ч.
Aligned Data Centers получила $12 млрд на расширение парка ИИ ЦОД 9 ч.
Вышел смартфон RedMagic X Golden Saga с позолоченной системой охлаждения и карбоновой крышкой 10 ч.
Россиянам разрешили до конца года бесплатно ездить по платным трассам на электромобилях, но не всех 11 ч.
Thermal Grizzly представила термопасту Duronaut с исключительной долговечностью 11 ч.
Arm пообещала разобраться с Qualcomm и существенно ускорить чипы для ПК в 2025 году 11 ч.
В США создали крошечного робота-насекомое с самым продолжительным полётом 11 ч.
Не лучше Скайнета: бум ИИ только в США станет причиной тысяч смертей и роста расходов на здравоохранение на $20 млрд ежегодно 12 ч.