Сегодня 22 января 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Meta✴ обвинили в использовании пиратских копий книг для обучения ИИ

Юристы Meta предостерегали компанию от использования пиратских копий книг для обучения искусственного интеллекта, но это всё равно было сделано, гласит поданный против компании иск по авторским правам, поданный ещё минувшим летом, сообщает Reuters.

 Источник изображения: Lukas / pixabay.com

Источник изображения: Lukas / pixabay.com

Накануне были объединены иски против Meta, поданные комиком Сарой Сильверман (Sarah Silverman), лауреатом Пулитцеровской премии Майклом Шейбоном (Michael Chabon) и рядом других авторов, которые утверждают, что компания без разрешения использовала их произведения для обучения большой языковой модели Llama. В документах приводятся журналы переписки на одном из серверов Discord, один из участников которой, работающий в Meta исследователь Тим Деттмерс (Tim Dettmers), описывает свою дискуссию с юридическим отделом компании о том, будет ли законным обучение ИИ на электронных копиях книг.

Адвокаты Meta заявили ему, что «данные нельзя использовать [для обучения модели], или модели нельзя будет публиковать, если они обучены на этих данных». Но в компании признали, что всё-таки использовали эти данные для обучения первой версии Llama. Собеседники Деттмерса, впрочем, уверяют, что использование защищённой авторским правом литературы должно «подпадать под добросовестное использование» — действующую в США правовую доктрину, которая в определённых случаях допускает использование защищённых авторским правом произведений без согласия их авторов.

В этом году в адрес технологических компаний было подано множество исков со стороны различных авторов, которые обвиняют разработчиков ИИ в незаконном использовании произведений, защищённых авторским правом. Их победа может создать угрозу для зарождающейся отрасли генеративного ИИ, поскольку из-за необходимости выплаты отчислений стоимость разработки моделей вырастет. Прошедший предварительное одобрение европейский «Закон об ИИ» предписывает разработчикам раскрывать данные, которые они используют для обучения своих моделей.

В феврале Meta представила первую версию большой языковой модели Llama и раскрыла массив использованных для её обучения данных, в том числе блок, объём которого, по некоторым сведениям, содержит 196 640 книг. Минувшим летом была представлена вторая версия Llama, и Meta уже не стала раскрывать, какие данные были использованы для её обучения. Компании, управляющие сервисами с аудиторией менее 700 млн пользователей в месяц, могут использовать Llama 2 бесплатно.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Вечерний 3DNews
Каждый будний вечер мы рассылаем сводку новостей без белиберды и рекламы. Две минуты на чтение — и вы в курсе главных событий.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Google вложит ещё $1 млрд в конкурента OpenAI — ИИ-стартап Anthropic 7 мин.
Трамп помиловал основателя даркнет-платформы Silk Road, осуждённого на пожизненный срок 8 мин.
Регулирование криптовалют станет простым и понятным — сторонники Трампа запустили глубинные изменения в SEC 9 мин.
Аналитики подсчитали траты российских геймеров на игры в 2024 году и назвали главные хиты продаж 41 мин.
Журналисты случайно «засветили» дату выхода Doom: The Dark Ages, которую анонсируют на Developer_Direct 2 ч.
Аудитория Netflix взлетела до 302 млн благодаря «Игре в кальмара» — сервис поднял цены на подписку 2 ч.
Microsoft разрешила OpenAI пользоваться облачными сервисами конкурентов 6 ч.
Microsoft встроила свой браузер Edge во все игры сразу 7 ч.
Хардкорный режим, скачки и три сюжетных дополнения: Warhorse рассказала, как будет поддерживать Kingdom Come: Deliverance 2 после релиза 15 ч.
HPE проводит расследование в связи с заявлением хакеров о взломе её систем 15 ч.
Silicon Motion разрабатывает SSD-контроллер SM8466 с поддержкой PCIe 6.0 46 мин.
OpenAI, Softbank и Oracle запустили Stargate — предприятие на $500 млрд по превращению США в ИИ-сверхдержаву 2 ч.
Transcend выпустила SSD серии ETD410T формата U.2 для дата-центров 3 ч.
Владелец TikTok потратит в этом году $12 млрд на ИИ-ускорители от Nvidia и китайских производителей 3 ч.
Samsung вложит в контрактное производство чипов на порядок меньше, чем TSMC 5 ч.
Ускорители Ascend не готовы состязаться с чипами NVIDIA в деле обучения ИИ, но за эффективность инференса Huawei будет бороться всеми силами 5 ч.
Meta планирует выпустить умные очки Oakley, часы и наушники с ИИ 7 ч.
Nvidia в третий раз обошла Apple, став самой дорогой компанией в мире 7 ч.
AMD рассказала, какой будет игровая производительность Ryzen 9 9950X3D и 9900X3D 7 ч.
GeForce RTX 5000 Kingpin не будет — легендарный оверклокер рассказал о планах на будущее, в которых есть место не только Nvidia 13 ч.