Писатели подали в суд на компании OpenAI и Microsoft за использование их книг для обучения интеллектуального чат-бота ChatGPT. В иске утверждается, что Microsoft «глубоко вовлечена» в процесс обучения ChatGPT, поэтому она несёт полную ответственность за любые нарушения наряду с OpenAI.
ChatGPT и аналогичные ИИ, использующие в своей основе большие языковые модели (Large Language Model, LLM), «тренируются» на огромных массивах данных. При этом OpenAI загружает значительную часть информации из интернета, а некоторые данные поступают из таких источников, как нехудожественная литература. Поэтому авторы таких книг теперь требуют компенсации в новом судебном процессе.
По сообщениям Reuters, автор Джулиан Санктон (Julian Sancton) заявляет, что OpenAI без разрешения скопировала десятки тысяч нехудожественных книг для обучения ChatGPT. Автор возглавляет коллектив, подавший в минувший вторник иск в федеральный суд Манхэттена. В иске заявители отмечают, что «модели ответчиков были откалиброваны (обучены) путём воспроизведения огромного массива материалов, защищённых авторским правом, включая десятки или даже сотни тысяч нон-фикшн книг».
Иск подан в очень «удачный» для OpenAI момент, когда компания столкнулась с рядом других юридических и внутренних проблем. На компанию уже поданы другие иски, касающиеся частных данных, использования авторского контента. Кроме того, в минувшие выходные OpenAI столкнулась с кризисом управления, когда совет директоров уволил генерального директора компании Сэма Альтмана (Sam Altman), но затем компания отказалась от этого решения, пообещав под давлением сотрудников набрать новый состав совета директоров.
Новый иск отличается от предыдущих заявлений тем, что в нём наряду с OpenAI впервые фигурирует технологический гигант Microsoft, который к тому же является крупным инвестором OpenAI. ИИ-чат-бот в Microsoft Bing, поиск на основе искусственного интеллекта и новая функция Copilot в значительной степени опираются на технологии OpenAI. Фигурально выражаясь, это почти что ChatGPT, но со вкусом Microsoft.
Несмотря на то, что OpenAI и Microsoft не комментируют этот последний иск, OpenAI ранее заявляла, что контент, генерируемый ChatGPT, не является «производным произведением» и, следовательно, не нарушает чьих бы то ни было авторских прав.
В течение текущего года произошёл буквально взрыв в развитии LLM, и многие вопросы, затрагивающие тему авторских прав, ещё не решены в судах. Вероятно, судебные иски так ни к чему и не приведут или заставят изменить порядок выплат авторам контента, используемого при тренировке LLM. Однако, пока говорить об этом несколько преждевременно.
Источник: