Компания Apple переманила из Google несколько десятков специалистов в области искусственного интеллекта и открыла в швейцарском Цюрихе секретную лабораторию по разработке соответствующих решений.
В последние годы Apple произвела массовый набор сотрудников для расширения подразделения по ИИ и машинному обучению, показал анализ профилей профессиональной соцсети LinkedIn, общедоступных объявлений о вакансиях и исследовательских работ, проведённый Financial Times. Наибольшую ценность для Apple представляют сотрудники Google: в 2018 году производитель iPhone переманил Джона Джаннандреа (John Giannandrea) на руководящую должность в области ИИ — ранее он курировал лабораторию ИИ Google Brain, которую впоследствии объединили с DeepMind. После этого из Google в Apple перешли не менее 36 инженеров.
Большая часть команды Apple по ИИ работает в офисах компании в Калифорнии и Сиэтле, но значительно был расширен и офис в Цюрихе. Компания поглотила два местных стартапа — разработчика технологий виртуальной реальности FaceShift и создателя систем распознавания изображений Fashwell, — после чего решила построить здесь исследовательскую лабораторию Vision Lab. Сотрудники из Цюриха разрабатывают большие языковые модели, способные в качестве запросов принимать текст и изображения. При этом работники расположенных поблизости организаций даже не знают о присутствии здесь офиса Apple.
Компания традиционно не распространяется о своих планах в области ИИ, тогда как её конкуренты в лице Microsoft, Google и Amazon, напротив, объявляют о многомиллиардных инвестициях в передовые технологии. С начала года акции Apple упали, что побудило компанию объявить о революционных функциях ИИ, которые могут увеличить продажи устройств. Apple сейчас сосредоточена на развёртывании систем генеративного ИИ локально на мобильных устройствах — это значит, что чат-боты и другие приложения с ИИ будут обходиться без облачных ресурсов.
В компании уже более десяти лет разрабатывают продукты в области ИИ, включая голосовой помощник Siri, и потенциал нейросетей здесь давно осознали — ещё до появления больших языковых моделей. В 2016 году Apple поглотила компанию Perceptual Machines, основанную Русланом Салахутдиновым (Ruslan Salakhutdinov) и двумя его студентами из университета Карнеги — Меллона. Эта компания работала над системой ИИ для распознавания изображений. Салахутдинов учился в университете Торонто у «крёстного отца» технологий ИИ Джеффри Хинтона (Geoffrey Hinton), который в прошлом году оставил пост вице-президента Google из-за опасений по поводу систем генеративного ИИ. До 2020 года Салахутдинов занимал пост директор по исследованиям в области ИИ в Apple, после чего вернулся в университет Карнеги — Меллона.
Помимо Джона Джаннандреа, в Apple работают и другие выходцы из Google. Сами Бенджио (Samy Bengio), старший директор по исследованиям в области ИИ и машинного обучения ранее был одним из ведущих учёных Google в этой области. Руоминг Панг (Ruoming Pang), который сейчас возглавляет подразделение Apple Foundation Models, работающее над большими языковыми моделями, до этого руководил исследованием Google по распознаванию речи с использованием ИИ. Некоторое время в Apple работал пионер в области технологий глубокого обучения Ян Гудфеллоу (Ian Goodfellow), но он вернулся в Google, потому что был недоволен условиями работы в Apple. В марте Apple опубликовала исследовательский документ, посвящённый разработке семейства ИИ-моделей MM1, воспринимающих запросы в текстовом и визуальном форматах — среди авторов работы указаны шестеро бывших сотрудников Google.
За последние десять лет Apple приобрела около двух десятков стартапов в области ИИ — они специализируются на технологиях распознавания изображений и видео, обработки данных, поиска и управления музыкальным контентом. Основатели компаний Musicmetric, Emotient, Silk Labs, PullString, CamerAI, Fashwell, Spectral Edge, Inductiv Inc, Vilynx, AI Music и WaveOne до сих пор значатся сотрудниками Apple. Сейчас компания сосредоточена на том, чтобы делать «как можно больше на устройстве», что приведёт к потребности в более мощных чипах с динамической оперативной памятью (DRAM), способных обрабатывать огромные объёмы данных, которые необходимы для ИИ, отметил господин Салахутдинов. Если сегодня средний объём памяти на смартфоне составляет 8 Гбайт, то для работы больших языковых моделей на устройстве потребуются не менее 12 Гбайт, добавил исполнительный вице-президент и главный бизнес-директор Micron Technology Сумит Садана (Sumit Sadana) — компания является одним из поставщиков компонентов для Apple.
Ещё одной причиной недостаточно оперативного внедрения ИИ в экосистему Apple является склонность языковых моделей давать не соответствующие действительности или недопустимые ответы — компания проявляет осторожность, не желая выпускать то, что не может полностью контролировать, говорит Руслан Салахутдинов. О первых значительных шагах в области ИИ компания, как ожидается, расскажет на своём мероприятии WWDC. Среди новых продуктов, считают аналитики, может стать значительно поумневший персональный голосовой помощник — обновлённая Siri, которая, например, сможет взаимодействовать с приложениями на смартфоне посредством голосового управления. Возможно, одна или две функции смогут «изменить правила игры для среднего потребителя».