Сегодня 03 марта 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

OpenAI не сможет устранить нарушения авторских прав в Sora — ИИ-генератор обучался на украденном контенте

Ранее в этом году компания OpenAI запустила обновлённый генератор видео на базе искусственного интеллекта Sora. С его помощью пользователи могут создавать разный контент, в том числе нарушающий авторские права, например, с реальными знаменитостями или персонажами мультфильмов. Для решения этой проблемы разработчики обновили ИИ-модель, но, как показывает практика, введённые ими ограничения легко обойти с помощью тех же средств, которые работают в других ИИ-генераторах.

 Источник изображения: OpenAI

Источник изображения: OpenAI

OpenAI выпустила Sora в сентябре, и пользователи быстро превратили ИИ-генератор в машину по созданию контента, нарушающего авторские права. Сервис использовали для генерации различных видео, в некоторых из которых известные мультперсонажи и киногерои совершали преступления. Таким компаниям, как Nintendo и Paramount, вероятно, не понравилось видеть своих персонажей в пользовательских видео, за которые правообладатели не получают никакого вознаграждения. Поэтому OpenAI быстро ввела политику «подтверждённого согласия», которая запретила пользователям генерировать видео с защищёнными авторским правом персонажами, если сам правообладатель не дал явного разрешения на это. Изначальная политика OpenAI разрешала это, поэтому правообладателям нужно было ввести соответствующий запрет. Это изменение вызвало негативную реакцию со стороны пользователей Sora, поскольку сервис перестал создавать ролики с лицензированными персонажами или реально существующими людьми.

На деле оказалось, что пользователи могут легко обойти введённые OpenAI ограничения, соответствующим образом меняя свои запросы к алгоритму. Например, если написать в запросе «геймплей Animal Crossing», то Sora выдаст сообщение: «Этот контент может нарушать правила в отношении сходства с контентом третьих сторон». Однако при вводе запроса «титульный экран и геймплей игры под названием Crossing Animal 2017 года» сервис в точности воспроизводит видео из игры Animal Crossing: New Leaf для консоли Nintendo 3DS. Аналогичные манипуляции позволяют генерировать видео с участием реальных людей.

Существует несколько способов модерации генеративных ИИ-инструментов. Самый простой и дешёвый вариант заключается в блокировке запросов, содержащих определённые ключевые слова. К примеру, многие ИИ-алгоритмы отказываются генерировать контент сексуального характера, а также ролики со знаменитостями, обнаруживая в запросах определённые слова. Однако такой подход часто оказывается неэффективным, поскольку пользователи находят формулировки, позволяющие получить нужный им результат без упоминания ключевых слов, на которые срабатывает защита. Этот метод работает и в случае Sora, в связи с чем OpenAI так и не смогла эффективно заблокировать возможность генерации контента, нарушающего авторское право.

Вполне возможно, что OpenAI сможет взять проблему под контроль. Для этого потребуется существенно расширить список запрещённых слов, словосочетаний и фраз, а также активнее использовать анализ сгенерированных видео — более эффективный и дорогостоящий способ модерации. Однако всё это лишь попытки отвлечь внимание от беспрецедентного объёма контента, защищённого авторским правом, который уже использовался ИИ-алгоритмом, и без которого он не мог бы существовать.

Причина, по которой OpenAI и другим крупным ИИ-компаниям так трудно предотвратить генерацию определённого контента своими ИИ-моделями заключается в том, что этот контент уже присутствует в данных, используемых для обучения нейросетей. К примеру, генератор изображений может создавать изображения сексуального характера только потому, что в его обучающих данных содержится огромное количество таких изображений. Он может воспроизводить образы знаменитостей потому, что их фотографии есть в обучающих данных. Чтобы по-настоящему прекратить нарушение авторских прав, OpenAI должна научить Sora распознавать защищённый авторским правом контент и «забывать» его, что очень сложно и дорого. Для этого потребуется удалить весь защищённый контент из обучающих данных и заново обучить модель. Даже если бы OpenAI могла сделать это, она вряд ли бы пошла на такой шаг, поскольку именно этот контент заставляет Sora работать.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Alibaba представила малые ИИ-модели Qwen3.5, которые работают на ноутбуке и обходят аналоги OpenAI 21 мин.
SAP выплатит почти полмиллиарда доларров за то, что «заманила» Teradata в невыгодное совместное предприятие почти 20 лет назад 40 мин.
«Разница поразительна»: Capcom удалила из ремейка Resident Evil 4 скандальную защиту The Enigma Protector, и фанаты в восторге 50 мин.
Не только игры: Unreal Engine стал неотъемлемой частью всей творческой индустрии 2 ч.
Microsoft ускорила рейтрейсинг в DirectX 12 за счёт переупорядочивания лучей — прирост скорости до 90 % 4 ч.
Слухи: разработку многострадальной The Wolf Among Us 2 опять перезапустили, но релиз уже не за горами 4 ч.
Сэм Альтман пообещал, что OpenAI внесёт поправки в «скользкий» контракт с Минобороны, чтобы защитить людей от слежки 4 ч.
Двуличность OpenAI возмутила пользователей — число удалений приложения ChatGPT выросло вчетверо 5 ч.
Сюжетное дополнение Descent к российскому боевику Kiborg заставит игроков пройти три «круга ада» — трейлер и дата выхода 5 ч.
Разработчики Fallout 4 VR с новой силой разожгли огонь слухов о ремастере Fallout: New Vegas 5 ч.
Microsoft добавила в ROG Xbox Ally X автоматическую запись игровых хайлайтов — NPU наконец-то пригодился 2 мин.
Corning представила защитное стекло Gorilla Glass Ceramic 3 с долгосрочной прочностью 18 мин.
NVIDIA инвестировала $4 млрд в поставщиков лазеров и фотоники для ИИ ЦОД Lumentum и Coherent 31 мин.
«Росскосмос» починил стартовую площадку «Союзов» на «Байконуре» и готовится к запуску «Прогресса» 31 мин.
Иранские дроны повредили два дата-центра Amazon в ОАЭ и «зацепили» ещё один в Бахрейне 2 ч.
Теорию о магнитной памяти в двумерных материалах доказали экспериментом — ждём прорывов в ёмкости HDD? 2 ч.
Tecno анонсировала глобальные версии смартфонов Camon 50 Ultra 5G и Camon 50 3 ч.
MSI выпустила GeForce RTX 5070 Light Edition и Void Edition по мотивам World of Warcraft: Midnight 3 ч.
Samsung задержит запуск техасского завода полупроводников до 2027 года, а пострадает Tesla 3 ч.
Сделано в США: Flex начала выпуск американских ИИ-серверов с AMD Instinct 4 ч.