Более 14 крупнейших новостных изданий из топ-1000 закрыли доступ к своим материалам для ИИ-поисковика SearchGPT компании OpenAI через неделю после его запуска. Это решение может повлиять на полноту и точность результатов поисковой выдачи SearchGPT, а также вызывает вопросы о доверии к OpenAI и её практике использования данных.
Около недели назад OpenAI запустила ИИ-поисковик SearchGPT, но уже 14 из 1000 крупнейших новостных сайтов, включая The New York Times, Wired, The New Yorker, Vogue, Vanity Fair и GQ, успели заблокировать работу его поискового робота. Бот OAI-SearchBot индексирует информацию, чтобы SearchGPT мог выдавать пользователям релевантные результаты.
По данным компании Originality.ai, следящей за подобными блокировками, это решение оказалось неожиданным. Джон Гиллам (Jon Gillham), генеральный директор Originality.ai, выразил недоумение по поводу этой ситуации: «Я не понимаю, зачем издатели его блокируют. Им нужен этот трафик».
OpenAI подчеркнула, что OAI-SearchBot не собирает данные для обучения ИИ-моделей, таких как GPT-5, и рекомендовала владельцам сайтов разрешить работу бота для обеспечения видимости сайтов в результатах поиска. По мнению OpenAI, это поможет ресурсам оставаться в поисковой выдаче и привлекать больше трафика. Однако отсутствие доступа к некоторым веб-сайтам может сделать поисковую выдачу SearchGPT менее полной, чем у Google.
Другой поисковый бот OpenAI, GPTbot, который собирает данные для обучения ИИ-моделей, уже заблокирован сотнями сайтов. Это решение более понятно, ведь издатели хотят получать трафик от поисковых систем, но не желают делиться контентом для обучения ИИ. OpenAI потратила годы на сбор данных в интернете без разрешения, поэтому недоверие к компании может быть одной из причин блокировки.
Гиллам предполагает, что издатели могут не доверять заявлению OpenAI о том, что её новый бот не собирает данные для обучения ИИ-моделей. Другой причиной может быть желание избежать ситуации, когда новые ИИ-поисковики, чтобы удержать пользователей, показывают им краткое содержание материалов, а не перенаправляют их на оригинальные сайты, что снижает трафик и доход издателей.
Гиллам также отметил, что OpenAI в этом году активно заключала сделки с издателями на использование их архивных материалов. Это может выглядеть как продуманная стратегия OpenAI: сначала наладить отношения с издателями через партнёрские соглашения, а затем объявить о запуске SearchGPT.
Издание The New York Times выступило главным противником OpenAI среди издателей, подав иск против неё и Microsoft. Издательство утверждает, что эти две технологические компании незаконно используют её материалы для создания конкурирующих продуктов. Как заявил Чарли Стадтландер (Charlie Stadtlander), представитель The New York Times: «The Times не разрешает использование своих материалов для генеративного поиска или обучения ИИ без письменного соглашения, независимо от того, блокируем ли мы доступ какому-либо боту к нашему контенту или нет».
В жалобе на OpenAI и Microsoft, The New York Times подчеркнула, что поисковые системы с ИИ потенциально могут отбирать трафик у издателей, ухудшая их финансовое положение: «Предоставляя контент The Times без разрешения, инструменты ответчиков подрывают отношения The Times с читателями и лишают доходов от подписки, лицензирования, рекламы и партнёрских программ».
«Ответчики также используют поисковик Bing компании Microsoft, копирующий и классифицирующий онлайн-контент The Times для генерации ответов с дословными выдержками и подробными резюме статей The Times, которые гораздо длиннее и детальнее, чем те, что выдают традиционные поисковые системы», — говорится в жалобе издательства.
Появление SearchGPT и реакция издателей показывают сложность взаимоотношений между ИИ-технологиями и традиционными СМИ. Недоверие к OpenAI и желание защитить свои доходы подталкивают издателей к принятию мер предосторожности. В будущем нам предстоит наблюдать, как эти противоречия будут разрешаться и какое влияние это окажет на доступность и качество информации в интернете.
Источники: