Осенью 2020 года работающие в удалённом режиме сотрудники Scale AI из Венесуэлы разместили на онлайн-форумах несколько снимков, герои которых явно не хотели бы их публикации. На одном из них оказалась женщина во время посещения уборной. Фотографии сделал не человек, а робот-пылесос iRobot Roomba J7 — далее они оказались в компании Scale AI, которая нанимает людей по всему миру для маркировки фото, аудио и видео с целью обучения систем искусственного интеллекта.
Представители компании iRobot (сейчас находится в процессе поглощения компанией Amazon) подтвердили, что снимки были сделаны пылесосами Roomba в 2020 году. Однако производитель отметил, что это были модифицированные версии машин, которые никогда не поступали в свободную продажу, а передавались сотрудникам компании и другим лицам, которые за вознаграждение согласились транслировать данные для обучения системы искусственного интеллекта. Когда на устройстве включается запись, на корпусе загорается специальный индикатор, а участники исследования имеют возможность удалять все материалы конфиденциального характера.
Однако, как отмечает MIT Technology Review, сбор данных сегодня ведётся и на потребительских устройствах от смартфонов до стиральных машин — это необходимо для обучения многочисленных алгоритмов искусственного интеллекта, и чем сильнее среда, в которой собирается эта информация, приближена к естественной, тем выше ценность этих данных. Производители зачастую пользуются расплывчатыми формулировками, чтобы получить максимальную свободу в сборе и распространении информации о потребителях.
Одной из важнейших задач при этом является разметка собираемых данных — создание кратких пояснений, описывающих, что изображено на фото или видео, или о чём говорят на аудиозаписи. Решением этой задачи занимаются специальные компании — это молодая, но активно развивающаяся отрасль, годовой оборот которой к 2030 году, по прогнозам аналитиков, достигнет $13,3 млрд. Одним из крупнейших игроков этой индустрии является основанная в 2016 году Scale AI, которая в формате краудсорсинга пользуется услугами граждан развивающихся стран — утечку данных пылесосов Roomba допустили её сотрудники, обсуждавшие рабочие вопросы онлайн.
По словам представителей iRobot, одной только Scale AI были переданы более 2 млн изображений для обучения искусственного интеллекта, но разметкой данных для производителя занимаются и другие платформы. Глава iRobot Колин Энгл (Colin Angle) заявил, что производитель будет вынужден разорвать отношения с подрядчиком, допустившим такую утечку — компания также проведёт расследование инцидента и предпримет меры для предотвращения подобного в будущем.
Источник: