Сегодня 30 апреля 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Meta✴ обвинили в использовании пиратских копий книг для обучения ИИ

Юристы Meta предостерегали компанию от использования пиратских копий книг для обучения искусственного интеллекта, но это всё равно было сделано, гласит поданный против компании иск по авторским правам, поданный ещё минувшим летом, сообщает Reuters.

 Источник изображения: Lukas / pixabay.com

Источник изображения: Lukas / pixabay.com

Накануне были объединены иски против Meta, поданные комиком Сарой Сильверман (Sarah Silverman), лауреатом Пулитцеровской премии Майклом Шейбоном (Michael Chabon) и рядом других авторов, которые утверждают, что компания без разрешения использовала их произведения для обучения большой языковой модели Llama. В документах приводятся журналы переписки на одном из серверов Discord, один из участников которой, работающий в Meta исследователь Тим Деттмерс (Tim Dettmers), описывает свою дискуссию с юридическим отделом компании о том, будет ли законным обучение ИИ на электронных копиях книг.

Адвокаты Meta заявили ему, что «данные нельзя использовать [для обучения модели], или модели нельзя будет публиковать, если они обучены на этих данных». Но в компании признали, что всё-таки использовали эти данные для обучения первой версии Llama. Собеседники Деттмерса, впрочем, уверяют, что использование защищённой авторским правом литературы должно «подпадать под добросовестное использование» — действующую в США правовую доктрину, которая в определённых случаях допускает использование защищённых авторским правом произведений без согласия их авторов.

В этом году в адрес технологических компаний было подано множество исков со стороны различных авторов, которые обвиняют разработчиков ИИ в незаконном использовании произведений, защищённых авторским правом. Их победа может создать угрозу для зарождающейся отрасли генеративного ИИ, поскольку из-за необходимости выплаты отчислений стоимость разработки моделей вырастет. Прошедший предварительное одобрение европейский «Закон об ИИ» предписывает разработчикам раскрывать данные, которые они используют для обучения своих моделей.

В феврале Meta представила первую версию большой языковой модели Llama и раскрыла массив использованных для её обучения данных, в том числе блок, объём которого, по некоторым сведениям, содержит 196 640 книг. Минувшим летом была представлена вторая версия Llama, и Meta уже не стала раскрывать, какие данные были использованы для её обучения. Компании, управляющие сервисами с аудиторией менее 700 млн пользователей в месяц, могут использовать Llama 2 бесплатно.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Доминирование Google пошатнулось — его доля на мировом рынке поиска скатилась ниже 90 % впервые за десять лет 20 мин.
Intel раскрыла потенциал встроенной графики Core Ultra 200V — свежий драйвер повысил FPS на 10 % и не только 41 мин.
«Яндекс Маркет» обзавёлся чат-ботом на мощнейшем ИИ «Яндекса» — он поможет выбрать покупки 54 мин.
Футуристический шутер La Quimera от бывших разработчиков Metro пройдёт через ранний доступ Steam, чтобы стать «большой и цельной» игрой 55 мин.
Xiaomi выпустила открытую рассуждающую ИИ-модель MiMo и заявила, что она быстрее OpenAI o1-mini 2 ч.
Глава Gearbox опроверг, что Borderlands 4 перенесли ради GTA VI или «любого другого продукта» 2 ч.
Релиз амбициозного китайского боевика Lost Soul Aside отложили на три месяца — объявлена новая дата выхода 4 ч.
Криптобиржу Grinex заподозрили в связях с заблокированной российской биржей Garantex 5 ч.
Reddit заблокировала учёных за тайный эксперимент с ИИ-ботами в дискуссиях 8 ч.
OpenAI откатила обновление ChatGPT из-за подхалимского поведения ИИ 8 ч.
В Можайском округе построят очередной ЦОД «Яндекса» 3 мин.
Dell представила ноутбуки Dell 16 Plus с чипами AMD Ryzen AI 300 по цене от $850 10 мин.
Экипаж «Шэньчжоу-19» приземлился после шести месяцев космической вахты на станции «Тяньгун» 15 мин.
Электролёт Joby Aviation впервые с пилотом на борту полетал в режимах вертолёта и самолёта 24 мин.
Innodisk выпустила 128-Тбайт E3.L SSD с интерфейсом PCIe 5.0 2 ч.
Nvidia опровергла слухи о намерениях создать совместное предприятие в Китае 2 ч.
У Apple произошли перестановки в музыкальном и международном отделах 3 ч.
Российские производители потребовали полностью запретить госзакупки иностранной электроники 3 ч.
США собрались пересмотреть экспортные ограничения на ИИ-чипы, но вряд ли остальным странам станет от этого лучше 3 ч.
AWS построит в Индиане дата-центр, который будет потреблять энергии как половина населения штата 5 ч.