Meta✴ использует для обучения ИИ контент из Instagram✴ и Facebook✴

11.05.2024 15:39, Владимир Мироненко

В то время как технологические компании, занимающиеся разработкой ИИ, находятся в поиске источников данных для обучения своих ИИ-моделей, у Meta✴, как оказалось, есть большое преимущество перед ними, поскольку она может использовать для этих целей контент Instagram✴ и Facebook✴. Об этом сообщил директор по продукту Meta✴ Крис Кокс (Chris Cox) на саммите Bloomberg Tech Summit, прошедшем на этой неделе.

Источник изображения: geralt/Pixabay

Крис Кокс уточнил, что Meta✴ использует для обучения своего генератора изображений по текстовым запросам на базе ИИ общедоступные фотографии и текст из Instagram✴ и Facebook✴. «Мы не тренируемся на личных данных, мы не тренируемся на данных, которыми люди делятся со своими друзьями, мы тренируемся на публичных данных», — сказал он.

Крис Кокс отметил, что Meta✴ AI позволяет создавать изображения «действительно потрясающего качества», поскольку в Instagram✴ много фотографий «искусства, моды, культуры, а также просто изображений людей и нас». Чтобы создать изображение с помощью Meta✴ AI, пользователю достаточно набрать запрос, начинающийся со слова «нарисовать», и, как указано на сайте сайт Meta✴.ai, он сгенерирует четыре изображения.

Для получения данных, используемых для обучения ИИ, компании объединяют усилия с другими фирмами. Например, OpenAI договорилась о сотрудничестве с несколькими СМИ, чтобы лицензировать их контент для разработки своих ИИ-моделей. В свою очередь, Meta✴ рассматривала возможность приобретения издательства Simon & Schuster, чтобы получить больше данных для обучения собственных ИИ-моделей, сообщила в прошлом месяце газета The New York Times.

Помимо наборов необработанных данных, компании используют так называемые «петли обратной связи», представляющие собой процесс использования результатов работы системы ИИ и соответствующих действий конечного пользователя для переобучения и улучшения моделей.

Гендиректор Meta✴ Марк Цукерберг (Mark Zuckerberg) ранее заявил, что циклы обратной связи будут «более ценными», чем любой «предварительный контент».