Сегодня 18 июля 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Android-приложения получат доступ к ИИ-модели Gemini Nano, которая работает прямо на смартфоне

Быстрое развитие генеративного искусственного интеллекта радикально изменило продукты технологических гигантов. Большинство новых функций обрабатываются на удалённых серверах, поскольку мобильные устройства располагают весьма ограниченными вычислительными ресурсами. Однако Google готова предоставить разработчикам возможность обращаться и к локальному ИИ — то есть работающему прямо на устройстве.

Google без громких анонсов опубликовала документацию о новых расширенных возможностях ИИ, которыми могут воспользоваться разработчики: в обновлённом ML Kit SDK появилась поддержка API для функций генеративного ИИ на основе локальной языковой модели Gemini Nano. Она построена на платформе AI Core, как и экспериментальный комплект Edge AI SDK, но предполагает подключение к существующей модели с заданным набором функций, которые разработчики смогут легко реализовать.

 Здесь и далее источник изображений: Google

Здесь и далее источник изображений: Google

С ML Kit в приложениях появятся такие функции, как подготовка сводок текста, редактирование, переформулирование, а также описание изображений — всё это без отправки данных в облако. Однако по своим возможностям локальная модель Gemini Nano значительно уступает облачным, поэтому придётся мириться с некоторыми, порой существенными, ограничениями. Например, текстовые сводки могут содержать не более трёх пунктов, а описания изображений доступны только на английском языке. Качество результатов также может различаться в зависимости от версии Gemini Nano, установленной на телефоне. Стандартная Gemini Nano XS занимает около 100 Мбайт, а Gemini Nano XXS, установленная, например, на смартфоне Google Pixel 9a, в четыре раза меньше, работает только с текстом и имеет гораздо меньшее контекстное окно.

Модель Gemini Nano уже используется на устройствах Pixel, а также на смартфонах OnePlus 13, Samsung Galaxy S25 и Xiaomi 15 — их число, вероятно, будет расти, как и количество приложений с функциями локального генеративного ИИ.

Документация для разработчиков уже доступна, и, как ожидается, компания подробнее расскажет об этом проекте на конференции Google I/O. Одна из сессий носит название: «Gemini Nano на Android: разработка с использованием генеративного ИИ на устройстве». До недавнего времени работа с локальным генеративным ИИ на мобильных устройствах была непростой задачей: экспериментальный Edge AI SDK открывает доступ к аппаратному ускорению (NPU) для запуска моделей, но работает только с устройствами серии Pixel 9 и ограничен исключительно текстом. Собственные API для запуска ИИ-нагрузок предлагают также Qualcomm и MediaTek, однако их возможности варьируются от устройства к устройству, что делает их использование в долгосрочных проектах рискованным. К тому же запуск собственной модели ИИ требует серьёзной подготовки, поэтому новые API значительно упростят и ускорят реализацию локального ИИ.

Несмотря на ограниченные возможности локальных моделей на мобильных устройствах, это яркий пример практической пользы ИИ. Большинство пользователей, скорее всего, предпочтут не передавать свои персональные данные на удалённые серверы. Есть и наглядные примеры: функция Google Pixel Screenshots обрабатывает снимки экрана непосредственно на смартфоне, как и сводки по уведомлениям на Motorola Razr Ultra формируются без использования облака — хотя базовая версия Razr всё же обращается к удалённым серверам. Появление API для подключения к Gemini Nano обеспечит некоторую унификацию подходов к мобильному ИИ, но панацеей эта инициатива не станет — многие смартфоны пока не обладают достаточной вычислительной мощностью для таких задач.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Saber Interactive опубликовала загадочный тизер — фанаты убеждены, что студия делает игру по «Восставшему из ада» 26 мин.
WhatsApp скоро ограничат в России — на это прозрачно намекнули в Думе 39 мин.
Хакеры приспособили GitHub для массового распространения вредоносов как услуги 2 ч.
Java-инспекция: новая политики лицензирования Oracle привела к бесконечной череде аудитов 3 ч.
Telegram не планирует открывать офис в России, заявил бывший пресс-секретарь Дурова 4 ч.
Инсайдер заинтриговал фанатов Dark Souls и Armored Core первыми подробностями неанонсированной игры FromSoftware 4 ч.
Meta воспользовалась неразберихой в Apple и переманила ещё двух специалистов по ИИ 5 ч.
Китайские разработчики за полгода вложили в рекламу в RuStore больше, чем за весь прошлый год 7 ч.
Mistral добавила в Le Chat функции конкурентов: глубокие исследования, редактирование фото и мультиязычность 7 ч.
Илон Маск получил больше времени на подготовку к судебному заседанию по делу о покупке Twitter 7 ч.
Китайский охотник за астероидами испытал камеры на Земле и Луне — и поделился впечатляющими снимками 60 мин.
Российскому рынку электромобилей грозит обвал на 40 % в этом году 2 ч.
У США собрались обложить палладий из России пошлинами — это может ударить по производителям электроники 2 ч.
Маск назвал себя неблагополучным гражданином, пытаясь выбить льготы для своего «малого бизнеса» — стартапа Neuralink ценой $9 млрд 2 ч.
Razer вдохновилась покемонами и выпустила яркие клавиатуру, мышь, гарнитуру и коврик для геймеров 2 ч.
Самый большой ЦОД Центральной Азии появится в 2026 году в Астане 3 ч.
В Китае создан спасательный беспилотник самолётного типа с вертикальным взлётом и посадкой 3 ч.
HBM скоро утратит статус «золотой жилы»: передовой памяти спрогнозировали падение цен 4 ч.
Учёные впервые обнаружили начало рождения экзопланеты 4 ч.
Lenovo анонсировала четырёхсокетные серверы ThinkSystem SR850 V4 и SR860 V4 на базе Intel Xeon 6 4 ч.