Восемь интернет-изданий подали иск к OpenAI и Microsoft за незаконное использование статей для обучения ИИ

01.05.2024 10:16, Алексей Разин

Текстовые материалы, находящиеся в общем доступе, являются одним из самых простых источников данных для обучения больших языковых моделей, но разработчики систем искусственного интеллекта то и дело сталкиваются с претензиями правообладателей. Новый иск к OpenAI выдвинуло американское издательство MediaNews Group, владеющее несколькими интернет-изданиями.

Источник изображения: Unsplash, Praswin Prakashan

Как сообщает Reuters, представители истца упрекают OpenAI в незаконном копировании миллионов статей, размещенных в изданиях New York Daily News, Chicago Tribune, Orlando Sentinel, Sun Sentinel, The Mercury News, The Denver Post, The Orange County Register и Pioneer Press для обучения своих языковых моделей. В общей сложности претензии к создателям ChatGPT и Microsoft Copilot выдвигают восемь интернет-изданий из шести американских штатов. Ответчиком по этому иску выступает и корпорация Microsoft, которая оказывает финансовую поддержку создавшей ChatGPT компании OpenAI, а также использует её разработки для совершенствования своего ИИ-ассистента Copilot.

Это не первый случай возникновения подобных претензий со стороны интернет-изданий к OpenAI и Microsoft. Аналогичные иски уже были поданы The New York Times, The Intercept, Raw Story и AlterNet. Представители MediaNews утверждают, что OpenAI строит свой успех на чужой работе, и «почему-то считает, что не нужно платить за контент». Системы искусственного интеллекта ответчиков, по словам стороны обвинения, способны дословно воспроизводить тексты публикаций по запросу пользователей ChatGPT. Кроме того, этот чат-бот способен добавлять к текстам оригинальных публикаций недостоверную информацию, что вредит репутации исходных СМИ. Microsoft обвиняется в том, что по запросу поисковой системы Bing ассистент Copilot может выдавать защищённые авторскими правами фрагменты публикаций указанных интернет-изданий, при этом не ссылаясь на первоисточник. Они требуют некую материальную компенсацию ущерба и судебного запрета на использование своих материалов для обучения систем искусственного интеллекта. Когда ранее с аналогичными претензиями к OpenAI обратилась The New York Post, представители первой заявили, что выдача фрагментов публикаций происходила в результате технической ошибки в процессе обучения больших языковых моделей.