Google разрешила самой себе использовать всю общедоступную информацию для обучения ИИ

В англоязычной версии «Политики конфиденциальности» Google обнаружено небольшое, но важное изменение, согласно которому компания предоставляет самой себе право использовать всю публикуемую в интернете информацию для обучения собственных моделей искусственного интеллекта.

Источник изображения: Google

Первоначально документ гласил, что общедоступные данные будут использоваться в коммерческих и исследовательских целях, а также для улучшения работы службы «Google Переводчик». В новой версии «Политики конфиденциальности» говорится: «Google использует информацию для улучшения своих сервисов и разработки новых продуктов, функций и технологий для пользователей и общества. Компания использует общедоступную информацию для обучения ИИ-моделей Google и создания продуктов и функций, таких как „Google Переводчик”, Bard и Cloud AI».

Далее документ уточняет, что подразумевается под «общедоступной» информацией: «Если информация о вашей компании появляется на веб-сайте, мы можем проиндексировать и отобразить её в службах Google». Изменения вступили в силу с 1 июля 2023 года. Учитывая количество и время существования многих учётных записей Google, новая политика конфиденциальности может также включать в себя данные, которые собирались на протяжении десятилетий. И пока нет ясности, существует ли механизм, позволяющий пользователям исключать из этого массива связанную с ними информацию, как это делается в отношении поисковой машины.

В новой редакции документа Google фактически отразила современные реалии — многочисленные разработчики ИИ-моделей уже используют крупные массивы данных для их обучения, не рассуждая об их принадлежности. Некоторые ресурсы пытаются от этого защититься: Reddit и Twitter резко ограничили доступ к контенту на своих платформах, невзирая на гнев общественности и возможные долгосрочные последствия.

Источники: