Meta✴ использует для обучения ИИ контент из Instagram✴ и Facebook✴

Читать в полной версии

В то время как технологические компании, занимающиеся разработкой ИИ, находятся в поиске источников данных для обучения своих ИИ-моделей, у Meta, как оказалось, есть большое преимущество перед ними, поскольку она может использовать для этих целей контент Instagram и Facebook. Об этом сообщил директор по продукту Meta Крис Кокс (Chris Cox) на саммите Bloomberg Tech Summit, прошедшем на этой неделе.

Источник изображения: geralt/Pixabay

Крис Кокс уточнил, что Meta использует для обучения своего генератора изображений по текстовым запросам на базе ИИ общедоступные фотографии и текст из Instagram и Facebook. «Мы не тренируемся на личных данных, мы не тренируемся на данных, которыми люди делятся со своими друзьями, мы тренируемся на публичных данных», — сказал он.

Крис Кокс отметил, что Meta AI позволяет создавать изображения «действительно потрясающего качества», поскольку в Instagram много фотографий «искусства, моды, культуры, а также просто изображений людей и нас». Чтобы создать изображение с помощью Meta AI, пользователю достаточно набрать запрос, начинающийся со слова «нарисовать», и, как указано на сайте сайт Meta.ai, он сгенерирует четыре изображения.

Для получения данных, используемых для обучения ИИ, компании объединяют усилия с другими фирмами. Например, OpenAI договорилась о сотрудничестве с несколькими СМИ, чтобы лицензировать их контент для разработки своих ИИ-моделей. В свою очередь, Meta рассматривала возможность приобретения издательства Simon & Schuster, чтобы получить больше данных для обучения собственных ИИ-моделей, сообщила в прошлом месяце газета The New York Times.

Помимо наборов необработанных данных, компании используют так называемые «петли обратной связи», представляющие собой процесс использования результатов работы системы ИИ и соответствующих действий конечного пользователя для переобучения и улучшения моделей.

Гендиректор Meta Марк Цукерберг (Mark Zuckerberg) ранее заявил, что циклы обратной связи будут «более ценными», чем любой «предварительный контент».