В окружной суд Северного округа Калифорнии подали исправленную версию коллективного иска, в котором утверждается, что сотрудники Nvidia обращались за материалами к администрации Anna’s Archive — пиратского сайта, на котором вразрез с авторским правом размещены миллионы книг и научных работ.
Источник изображения: BoliviaInteligente / unsplash.com
Предметом переговоров был «высокоскоростной доступ» к данным архива. Представители Anna’s Archive якобы прямым текстом заявили, что материалы были получены незаконным путём, и спросили, есть ли у Nvidia разрешение от руководства на продолжение работы. Вскоре такое согласие было получено, говорится в иске.
Ресурс Anna’s Archive предложил Nvidia доступ к примерно 500 Тбайт данных — коллекция содержит несколько миллионов книг, некоторые из которых доступны на платформе Internet Archive через систему цифрового проката. Авторы иска не уточняют, платила ли Nvidia за доступ к информации и воспользовалась ли пиратскими данными.
Истцы, впрочем, обвиняют Nvidia в использовании других пиратских источников: набора данных Books3, а также сайтов Library Genesis, Sci-Hub и Z-Library. Ещё один иск гласит, что Nvidia предоставляла средства, которые позволяли клиентам загружать данные из набора The Pile, включающего Books3 — около 200 000 книг. Это привело к косвенному и опосредованному нарушению авторских прав, потому что клиенты могли получить доступ к пиратским книгам посредством предоставленных компанией средств. Ранее Nvidia заявила, что обучение ИИ подпадает под норму о добросовестном использовании данных, потому что модели ИИ изучают закономерности, а не хранят тексты книг. Рассмотрение дела продолжается.