Сегодня 10 марта 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

На OpenAI подали в суд за незаконное использование литературных произведений для обучения нейросетей

На OpenAI снова подали в суд за использование произведений для обучения ИИ. Два известных писателя подали иск против компании, которая стоит за ChatGPT и Bing Chat, в нарушении авторских прав. По их мнению, OpenAI использовала их произведения в качестве обучающих данных. Это, по всей видимости, первый поданный иск об использовании текста (в отличие от изображений или кода) в качестве обучающих данных.

В поданном в окружной суд Северного округа Калифорнии иске истцы Пол Тремблей (Paul Tremblay) и Мона Авад (Mona Awad) утверждают, что OpenAI и её дочерние компании нарушили авторские права, нарушили Закон об авторском праве в цифровую эпоху (DMCA), а также нарушили калифорнийские и общие законодательные ограничения на недобросовестную конкуренцию.

Писатели представлены юридической фирмой Джозефа Савери (Joseph Saveri) и Мэттью Баттерика (Matthew Butterick), той же командой, которая стоит за недавними исками, поданными против Stable Diffusion AI и GitHub. В жалобе утверждается, что роман Тремблея «Хижина на краю света» и два романа Авад: «13 способов посмотреть на толстую девушку» и «Зайка» использовались в качестве обучающих данных для GPT-3.5 и GPT-4. Хотя OpenAI не раскрывала, что эти романы находятся в её обучающих данных (которые держатся в секрете), истцы делают вывод, что они должны быть там, поскольку ChatGPT смог предоставить подробные резюме сюжетов и ответить на вопросы о книгах, что потребовало бы доступа к их текстам.

«Поскольку языковые модели OpenAI не могут функционировать без выразительной информации, извлечённой из произведений истцов (и других лиц) и сохранённой в них, языковые модели OpenAI сами являются нарушающими авторские права производными произведениями, созданными без разрешения истцов и в нарушение их исключительных прав по Закону об авторском праве», — говорится в жалобе.

Все три книги содержат информацию о защите авторских прав (CMI), такую как ISBN и номера регистрации авторских прав. Закон об авторском праве в цифровую эпоху (DMCA) утверждает, что удаление или фальсификация CMI является незаконной, и поскольку ответы ChatGPT не содержат этой информации, истцы утверждают, что OpenAI виновна в нарушении этого закона, помимо факта нарушения авторских прав.

Хотя в настоящее время в иске участвуют только два истца, адвокаты намерены сделать иск коллективным, что позволило бы другим авторам, чьи авторские произведения использовались OpenAI, также получить компенсацию. Адвокаты требуют денежных возмещений, судебных издержек и судебного запрета, принуждающего OpenAI изменить своё программное обеспечение и деловые практики в отношении авторских материалов. На сайте юридической фирмы LLM Litigation подробно изложена позиция истцов и причины подачи иска. «Мы подали коллективный иск против OpenAI, обвиняя ChatGPT и его базовые большие языковые модели, GPT-3.5 и GPT-4, в том, что они перерабатывают авторские произведения тысяч писателей — и многих других — без согласия, компенсации или признания», — сообщают адвокаты.

Они также критикуют концепцию генеративного ИИ, утверждая: «Генеративный искусственный интеллект — это просто человеческий интеллект, переупакованный и проданный как новый продукт. Это не новый вид интеллекта. Это просто новый способ использования чужого интеллекта без разрешения или компенсации». Они отмечают, что, хотя OpenAI заявляет, что не знает, какие именно книги использовались для обучения ИИ, это не имеет значения, поскольку: «OpenAI знает, что она использовала множество книг, и она знает, что она не получила разрешения от их авторов».

Это не первый случай, когда OpenAI сталкивается с подобными обвинениями. Однако новый иск, станет первым, затрагивающим использование текстовых данных, и он может создать прецедент для будущих судебных дел о нарушении авторских прав в области ИИ.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Sony отреагировала на слухи об анонсе переизданий God of War в честь 20-летия серии 25 мин.
Спустя три года игры серий Company of Heroes и Warhammer 40,000: Dawn of War вернулись в российский Steam 2 ч.
Календарь релизов — 10–16 марта: Wanderstop, Rise of the Ronin на ПК и Beyond the Ice Palace 2 2 ч.
Сбой в X сделал соцсеть недоступной для десятков тысяч пользователей 2 ч.
Microsoft скоро начнёт масштабное внедрение ИИ Copilot в видеоигры 2 ч.
Foxconn представила свою первую ИИ-модель FoxBrain — она умеет рассуждать и была обучена с помощью Nvidia 6 ч.
Сложно, но можно: глава разработки Doom: The Dark Ages уверен, что фанаты смогут пройти игру без огнестрельного оружия 7 ч.
Xbox продолжает захват PlayStation — для игры в Forza Horizon 5 на PS5 понадобится аккаунт Microsoft 8 ч.
Биткоин подешевел более чем на 5 % — инвесторы недовольны действиями властей США 8 ч.
Психогеографическая ролевая игра Hopetown в духе Disco Elysium и Planescape: Torment вышла из тени — опубликован первый скриншот 9 ч.
TSMC захватила 2/3 мирового рынка контрактного производства чипов благодаря ИИ — спрос на зрелые техпроцессы упал 27 мин.
Apple не оставила попытки создать умные очки, но вряд ли сможет сделать прорывной продукт 2 ч.
Первый электрический экраноплан успешно испытали с пассажирами на борту 2 ч.
Microsoft вложит ещё $300 млн в облачную и ИИ-инфраструктуру в Южной Африке 2 ч.
Российские силовики столкнулись с дефицитом инструментов для взлома iPhone и других смартфонов 2 ч.
Goldman Sachs: китайские телеком-операторы станут крупнейшими бенефициарами ИИ-бума, раньше всех взяв на вооружение продукты DeepSeek 2 ч.
Россия договорилась о совместном производстве микроэлектроники с Ираном 4 ч.
Репортаж со стенда HONOR на выставке MWC 2025: передовые новинки и стратегические планы на будущее с ИИ 6 ч.
Посадочный модуль Intuitive Machines опрокинулся, но Lonestar успела испытать свой лунный ЦОД 6 ч.
«Это очень мало»: российскому ИИ потребуется в семь раз нарастить число GPU-ускорителей к 2030 году 8 ч.