Сегодня 13 августа 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Android-приложения получат доступ к ИИ-модели Gemini Nano, которая работает прямо на смартфоне

Быстрое развитие генеративного искусственного интеллекта радикально изменило продукты технологических гигантов. Большинство новых функций обрабатываются на удалённых серверах, поскольку мобильные устройства располагают весьма ограниченными вычислительными ресурсами. Однако Google готова предоставить разработчикам возможность обращаться и к локальному ИИ — то есть работающему прямо на устройстве.

Google без громких анонсов опубликовала документацию о новых расширенных возможностях ИИ, которыми могут воспользоваться разработчики: в обновлённом ML Kit SDK появилась поддержка API для функций генеративного ИИ на основе локальной языковой модели Gemini Nano. Она построена на платформе AI Core, как и экспериментальный комплект Edge AI SDK, но предполагает подключение к существующей модели с заданным набором функций, которые разработчики смогут легко реализовать.

 Здесь и далее источник изображений: Google

Здесь и далее источник изображений: Google

С ML Kit в приложениях появятся такие функции, как подготовка сводок текста, редактирование, переформулирование, а также описание изображений — всё это без отправки данных в облако. Однако по своим возможностям локальная модель Gemini Nano значительно уступает облачным, поэтому придётся мириться с некоторыми, порой существенными, ограничениями. Например, текстовые сводки могут содержать не более трёх пунктов, а описания изображений доступны только на английском языке. Качество результатов также может различаться в зависимости от версии Gemini Nano, установленной на телефоне. Стандартная Gemini Nano XS занимает около 100 Мбайт, а Gemini Nano XXS, установленная, например, на смартфоне Google Pixel 9a, в четыре раза меньше, работает только с текстом и имеет гораздо меньшее контекстное окно.

Модель Gemini Nano уже используется на устройствах Pixel, а также на смартфонах OnePlus 13, Samsung Galaxy S25 и Xiaomi 15 — их число, вероятно, будет расти, как и количество приложений с функциями локального генеративного ИИ.

Документация для разработчиков уже доступна, и, как ожидается, компания подробнее расскажет об этом проекте на конференции Google I/O. Одна из сессий носит название: «Gemini Nano на Android: разработка с использованием генеративного ИИ на устройстве». До недавнего времени работа с локальным генеративным ИИ на мобильных устройствах была непростой задачей: экспериментальный Edge AI SDK открывает доступ к аппаратному ускорению (NPU) для запуска моделей, но работает только с устройствами серии Pixel 9 и ограничен исключительно текстом. Собственные API для запуска ИИ-нагрузок предлагают также Qualcomm и MediaTek, однако их возможности варьируются от устройства к устройству, что делает их использование в долгосрочных проектах рискованным. К тому же запуск собственной модели ИИ требует серьёзной подготовки, поэтому новые API значительно упростят и ускорят реализацию локального ИИ.

Несмотря на ограниченные возможности локальных моделей на мобильных устройствах, это яркий пример практической пользы ИИ. Большинство пользователей, скорее всего, предпочтут не передавать свои персональные данные на удалённые серверы. Есть и наглядные примеры: функция Google Pixel Screenshots обрабатывает снимки экрана непосредственно на смартфоне, как и сводки по уведомлениям на Motorola Razr Ultra формируются без использования облака — хотя базовая версия Razr всё же обращается к удалённым серверам. Появление API для подключения к Gemini Nano обеспечит некоторую унификацию подходов к мобильному ИИ, но панацеей эта инициатива не станет — многие смартфоны пока не обладают достаточной вычислительной мощностью для таких задач.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Блогер встроил «чит» прямо в руку — электростимуляция ускорила прицеливание в CS2 3 ч.
ИИ-бот Claude теперь может прочитать «Войну и мир» за раз — Anthropic увеличила контекстное меню в 5 раз 4 ч.
ИБ-платформа Security Vision 5 получила множество доработок 5 ч.
Krafton: увольнение руководителей Unknown Worlds спасло Subnautica 2 от судьбы Kerbal Space Program 2 и «непоправимого ущерба всей франшизе» 5 ч.
Chrome начнёт блокировать скрипты для слежки, но только в режиме «Инкогнито» 5 ч.
VK Tech увеличила в I полугодии 2025 года выручку в полтора раза, а количество клиентов выросло более чем втрое 6 ч.
Догоняя X: месячная аудитория Threads превысила 400 млн активных пользователей 7 ч.
Perplexity предложила выкупить Google Chrome за $34,5 млрд — сам стартап стоит почти вдвое меньше 7 ч.
Персонализация поиска Google стала по-настоящему персональной — теперь можно самому выбирать источники 9 ч.
Capcom устроит «эксклюзивный показ» Resident Evil Requiem на Gamescom: Opening Night Live 9 ч.
Новая статья: Обзор складного смартфона Samsung Galaxy Z Flip7: самая изящная раскладушка 4 ч.
Легенда со 133-летней историей собралась на свалку истории — Kodak признала, что скоро не сможет продолжать работу 7 ч.
Samsung выпустила первый телевизор с подсветкой Micro RGB и улучшенной цветопередачей 8 ч.
Учёные придумали невидимые для глаз световые водяные знаки для выявления дипфейков 10 ч.
Анонсирован смартфон Vivo V60 с оптикой Zeiss и ценой от $425 10 ч.
Мобильная графика Arm станет производительнее — в GPU встроят нейронные ускорители 11 ч.
Nvidia представила GeForce RTX 5090D V2: специальный флагман для Китая с урезанной памятью за те же деньги 11 ч.
Жаркая катка: видеокарта GeForce RTX 5090 вспыхнула во время игры в Battlefield 6 12 ч.
Supermicro представила 4U-сервер на базе NVIDIA HGX B200 с СЖО 12 ч.
Tesla запустила редкую рекламу своего автопилота, но пытается скрыть его несовершенство 12 ч.