Apple планирует начать анализировать данные на устройствах пользователей, чтобы усовершенствовать свою платформу искусственного интеллекта. Отмечается, что этот шаг призван защитить информацию о пользователях и в то же время помочь компании догнать конкурентов в области ИИ.

В настоящее время Apple обучает ИИ-модели на синтетических данных, которые лишь имитируют реальные и не содержат какой-либо пользовательской информации. Однако синтетические данные не всегда соответствуют реальной информации о клиентах, что в конечном счёте затрудняет корректную работу ИИ-алгоритмов, которые обучались на этих данных.
Новый подход позволит решить эту проблему, гарантируя при этом, что пользовательские данные останутся на устройствах клиентов и не будут напрямую использоваться для обучения ИИ-моделей. Основная задача нововведения заключается в том, чтобы помочь Apple догнать конкурентов, таких как OpenAI и Alphabet, у которых меньше ограничений в плане конфиденциальности данных клиентов.
Технология работает следующим образом: алгоритм берёт сгенерированные Apple синтетические данные и сравнивает их с актуальной выборкой писем пользователей в почтовом приложении компании для iPhone, iPad и Mac. Используя реальные письма для проверки точности генерируемых синтетических данных, Apple будет лучше понимать, какие именно части синтетических данных наиболее соответствуют реальным сообщениям, а, следовательно, подходят для обучения ИИ-моделей. Эти данные помогут компании сделать лучше ИИ-функции, связанные с генерацией текста инструментами, входящими в состав платформы Apple Intelligence.
«Генерируя синтетические данные, мы стремимся получить синтетические предложения или письма, достаточно похожие по теме или стилю на реальные, чтобы улучшить наши модели для обобщения, но без сбора писем с устройств пользователей Apple», — сказано в сообщении разработчиков.
Помимо синтетических данных, Apple обучает свои ИИ-модели на информации, которую лицензирует у сторонних компаний или собирает в открытом доступе в интернете. Использование синтетических данных имеет свои недостатки, из-за чего алгоритмы Apple зачастую не слишком хорошо справляются с выполнением задач, например, по обобщению текста.
Теоретически новый подход поможет улучшить ИИ-модели Apple, что станет ключевым шагом на пути к тому, чтобы составить конкуренцию лидерам сегмента ИИ. Apple признаёт отставание своих продуктов от аналогов лидеров рынка и прилагает усилия для того, чтобы исправить ситуацию. «Опираясь на многолетний опыт использования таких методов, как дифференциальная конфиденциальность, а также новые технологии, такие как генерация синтетических данных, мы можем улучшить функции Apple Intelligence, защищая при этом конфиденциальность пользователей, которые согласились на участие в программе аналитики устройств», — сказано в заявлении Apple.
Источник: