Издатели: Цукерберг лично одобрил массовое пиратство книг для обучения ИИ

Читать в полной версии

Пять крупных издательств и писатель Скотт Туроу (Scott Turow) подали коллективный иск против Meta и лично её гендиректора Марка Цукерберга (Mark Zuckerberg), обвинив компанию в одном из крупнейших нарушений авторских прав в истории. По утверждению истцов, Meta незаконно скопировала миллионы книг, статей и других произведений для обучения ИИ-модели Llama.

Источник изображения: about.fb.com

Иск поступил в Окружной суд США по Южному округу Нью-Йорка от издательств Hachette, Macmillan, McGraw Hill, Elsevier и Cengage. Истцы утверждают, что Meta скачивала через торренты миллионы защищённых авторским правом книг и журнальных статей с пиратских сайтов, занималась несанкционированным веб-скрейпингом «практически всего интернета», а затем многократно копировала эти материалы для обучения Llama.

Новое дело принципиально отличается от прежних попыток авторов оспорить действия ИИ-компаний. Истцы делают акцент на личной роли Цукерберга: он, по их словам, «лично санкционировал и активно поощрял» нарушение авторского права. Meta по его указанию удалила из украденных произведений информацию об управлении авторскими правами, чтобы скрыть источники обучающих данных. После выпуска Llama 1 компания ненадолго задумалась о лицензировании и с января по апрель 2023 года обсуждала увеличение бюджета на эти цели вплоть до $200 млн.

Однако в начале апреля 2023 года Meta внезапно прекратила переговоры. Вопрос о том, платить правообладателям или продолжать пиратство, «эскалировали до Цукерберга», после чего команда по развитию бизнеса получила устные указания свернуть лицензионную работу. Один из сотрудников Meta, как следует из иска, дальновидно объяснил логику решения: «Если мы лицензируем хотя бы одну книгу, то не сможем опираться на стратегию добросовестного использования».

13 декабря 2023 года сотрудники Meta распространили внутреннюю записку о правовых рисках использования LibGen. Хранилище в ней описано как «набор данных, заведомо полученный путём пиратства», а авторы документа отметили: «Мы не будем раскрывать использование наборов данных Libgen для обучения». Несмотря на эти опасения, Цукерберг и другие руководители компании одобрили скачивание через торренты более 267 Тбайт пиратских материалов. По данным иска, этот объём эквивалентен сотням миллионов публикаций и многократно превышает всю печатную коллекцию Библиотеки Конгресса.

Истцы утверждают, что ИИ-система Meta генерирует в массовом масштабе заменители их произведений и подстраивает ответы под стиль конкретных авторов, имитируя их выразительные элементы и творческие решения.

Ранее авторы уже проигрывали подобные дела. В июне 2025 года федеральный судья Винсент Чхабриа (Vincent Chhabria) отклонил иск тринадцати авторов, среди которых Сара Сильверман (Sarah Silverman) и Джуно Диас (Junot Díaz), и признал использование Meta набора данных из почти 200 000 книг для обучения Llama добросовестным. Meta заявила, что будет агрессивно оспаривать новый иск, ссылаясь на ту же доктрину добросовестного использования (fair use) — норму американского авторского права, разрешающую при определённых условиях использовать защищённые произведения без согласия правообладателя.