Сегодня 19 июня 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

ChatGPT «по собственной воле» стал генерировать изображения интимного и насильственного характера

Последняя публичная версия чат-бота с искусственным интеллектом ChatGPT оказалась способной генерировать изображения деликатного характера или сцены насилия в ответ на простой запрос, установили исследователи из британской компании Mindgard.

 Источник изображения: BoliviaInteligente / unsplash.com

Источник изображения: BoliviaInteligente / unsplash.com

Специалисты британского стартапа Mindgard, который занимается поиском уязвимостей в системах ИИ, нашли способ, как заставить ChatGPT создавать изображения с недопустимым содержимым, немного изменив некий широко распространённый запрос, первоначально разработанный для получения результатов юмористического характера. Особенно тревожным оказалось то, что в запросе не указывается тематика изображений, и ИИ «по собственной воле» создаёт явно недопустимые кровавые и деликатные изображения. В одном случае это был мужчина с серьёзной травмой головы, в другом — окровавленная женщина, на которой был минимум одежды.

На изображениях присутствовали взрослые люди, чьи образы были сгенерированы ИИ, но, как показали предыдущие исследования Mindgard, ChatGPT можно обманным путём заставить создавать дипфейки реальных обнажённых людей, подставляя их лица. Не исключается, что ИИ способен создавать картинки ещё более шокирующего содержания, если исследователи потратят на эту задачу больше времени. Результаты работы ChatGPT отражают данные, которые использовались в его разработке и обучении — генерируемый ИИ недопустимый контент «имеет связи с реальными изображениями и реальным миром», подчёркивают эксперты.

Результаты своей работы специалисты Mindgard раскрыли компании OpenAI в мае, но в ответ получили отписку. Когда инцидент был предан огласке, разработчик всё-таки отреагировал. «Изучив эту тенденцию, мы ввели дополнительные меры защиты от запросов такого рода. <..> Мы также сочетаем автоматизированные системы и проверку человеком для выявления и блокировки вредоносных материалов», — заявил представитель OpenAI и добавил, что в системах компании имеется многоуровневая защита, предназначенная для предотвращения показа пользователям изображений, нарушающих её политику. Исследователи, однако, обратили внимание, что и после внесения изменений ChatGPT в ответ на проблемный запрос по-прежнему выдавал вызывающий опасения контент. Содержание запроса по понятным причинам не раскрывается.

Настоящая проблема в том, указывают эксперты, что модели ИИ не понимают, как люди, что они создают, и чего разработчики просят их не делать. «Модели не понимают намерений. Они не понимают контекста. Они не понимают принципов, правильного и неправильного», — напоминают учёные. Поэтому внедрение защитных механизмов и средств их обхода — это «игра в кошки-мышки»: по мере совершенствования одних более изощрёнными становятся и другие.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Японский GlobalSign провёл вторую волну отзыва сертификатов у российских организаций 12 мин.
Русский язык, новый регион и встреча с Ведьмой: ролевой шутер Witchfire от ветеранов Painkiller получил последнее крупное обновление в раннем доступе 31 мин.
ChatGPT «по собственной воле» стал генерировать изображения интимного и насильственного характера 2 ч.
Получившие ранний доступ к Mythos клиенты Anthropic сохранили его даже после недавней блокировки 2 ч.
Белый дом работает с Anthropic над созданием правил безопасного применения ИИ-моделей 5 ч.
В российском Epic Games Store стартовала раздача Citizen Sleeper — текстовой RPG на обломках межпланетного капитализма 11 ч.
Duke Nukem 3D, Blood, Shadow Warrior и не только: российский разработчик портировал в браузер классические шутеры на движке Build Engine 14 ч.
Epic Games пообещала, что ИИ в Unreal Engine 6 «изменит создание игр» и «сократит рутину» у разработчиков 15 ч.
Adobe добавила в Photoshop и Premiere ИИ-помощников 15 ч.
Журналисты нашли подтверждения, что новой студии создателя Yakuza больше не существует 16 ч.
Huawei назвала условия лицензирования патентов на технологию Wi-Fi 7 2 ч.
SpaceX готовится выпустить облигации на сумму $20 млрд, чтобы погасить кредит на покупку xAI 2 ч.
Valve представила три сценария сроков доставки Steam Controller — вплоть до 2027 года 2 ч.
Власти США подозревают, что передовое EUV-оборудование ASML для производства чипов могло попасть в Китай 3 ч.
Исполнительным вице-президентом Intel Foundry назначен бывший глава SK hynix 5 ч.
Акции SanDisk и Micron резко выросли после того, как Apple пообещала поднять цены 10 ч.
Новая статья: Обзор игрового ноутбука MAIBENBEN Typhoon X16C: рабочий класс, версия 2026 10 ч.
Lenovo выпустила доступный игровой QHD-монитор с частотой обновления 275 Гц за $130 10 ч.
Муравейник Шрёдингера: физики нашли квантовую запутанность в сантиметровом кристалле странного металла 10 ч.
Акции Intel выросли на 10 % на фоне публикации Трампа о сделке по производству чипов для Apple 10 ч.