Сегодня 27 июня 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Android-приложения получат доступ к ИИ-модели Gemini Nano, которая работает прямо на смартфоне

Быстрое развитие генеративного искусственного интеллекта радикально изменило продукты технологических гигантов. Большинство новых функций обрабатываются на удалённых серверах, поскольку мобильные устройства располагают весьма ограниченными вычислительными ресурсами. Однако Google готова предоставить разработчикам возможность обращаться и к локальному ИИ — то есть работающему прямо на устройстве.

Google без громких анонсов опубликовала документацию о новых расширенных возможностях ИИ, которыми могут воспользоваться разработчики: в обновлённом ML Kit SDK появилась поддержка API для функций генеративного ИИ на основе локальной языковой модели Gemini Nano. Она построена на платформе AI Core, как и экспериментальный комплект Edge AI SDK, но предполагает подключение к существующей модели с заданным набором функций, которые разработчики смогут легко реализовать.

 Здесь и далее источник изображений: Google

Здесь и далее источник изображений: Google

С ML Kit в приложениях появятся такие функции, как подготовка сводок текста, редактирование, переформулирование, а также описание изображений — всё это без отправки данных в облако. Однако по своим возможностям локальная модель Gemini Nano значительно уступает облачным, поэтому придётся мириться с некоторыми, порой существенными, ограничениями. Например, текстовые сводки могут содержать не более трёх пунктов, а описания изображений доступны только на английском языке. Качество результатов также может различаться в зависимости от версии Gemini Nano, установленной на телефоне. Стандартная Gemini Nano XS занимает около 100 Мбайт, а Gemini Nano XXS, установленная, например, на смартфоне Google Pixel 9a, в четыре раза меньше, работает только с текстом и имеет гораздо меньшее контекстное окно.

Модель Gemini Nano уже используется на устройствах Pixel, а также на смартфонах OnePlus 13, Samsung Galaxy S25 и Xiaomi 15 — их число, вероятно, будет расти, как и количество приложений с функциями локального генеративного ИИ.

Документация для разработчиков уже доступна, и, как ожидается, компания подробнее расскажет об этом проекте на конференции Google I/O. Одна из сессий носит название: «Gemini Nano на Android: разработка с использованием генеративного ИИ на устройстве». До недавнего времени работа с локальным генеративным ИИ на мобильных устройствах была непростой задачей: экспериментальный Edge AI SDK открывает доступ к аппаратному ускорению (NPU) для запуска моделей, но работает только с устройствами серии Pixel 9 и ограничен исключительно текстом. Собственные API для запуска ИИ-нагрузок предлагают также Qualcomm и MediaTek, однако их возможности варьируются от устройства к устройству, что делает их использование в долгосрочных проектах рискованным. К тому же запуск собственной модели ИИ требует серьёзной подготовки, поэтому новые API значительно упростят и ускорят реализацию локального ИИ.

Несмотря на ограниченные возможности локальных моделей на мобильных устройствах, это яркий пример практической пользы ИИ. Большинство пользователей, скорее всего, предпочтут не передавать свои персональные данные на удалённые серверы. Есть и наглядные примеры: функция Google Pixel Screenshots обрабатывает снимки экрана непосредственно на смартфоне, как и сводки по уведомлениям на Motorola Razr Ultra формируются без использования облака — хотя базовая версия Razr всё же обращается к удалённым серверам. Появление API для подключения к Gemini Nano обеспечит некоторую унификацию подходов к мобильному ИИ, но панацеей эта инициатива не станет — многие смартфоны пока не обладают достаточной вычислительной мощностью для таких задач.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
«Это ужас, а не дубляж»: русская озвучка ремейка Silent Hill 2 от GamesVoice получила дату выхода и разочаровала фанатов 2 мин.
Microsoft добавила в браузер Edge поиск по истории с ИИ и новые функции Copilot 20 мин.
«Погоня за безопасными идеями — смертный приговор»: разработчик Rematch разбил надежды фанатов на Sifu 2 2 ч.
Мир охватила эпидемия ИИ-зависимости — от нездорового общения с ботами лечатся, как от наркомании 2 ч.
Cloudflare объяснила проблемы с доступом ко многим сайтам из России и заявила, что не может их исправить 2 ч.
VK Tech представил линейку новых сервисов информационной безопасности 3 ч.
Кооперативное выживание Abiotic Factor в духе Half-Life и научной фантастики 90-х готово к выбросу из раннего доступа — дата выхода и новый трейлер 3 ч.
VK привлекла 112 млрд рублей благодаря допэмиссии 4 ч.
Инфраструктура в публичном облаке России ежегодно увеличивается почти на треть 4 ч.
Хакеры могут захватить тысячи серверов — в популярном контроллере для удалённого управления найдена критическая уязвимость 6 ч.
Геймерские OLED-мониторов станут ярче — LG Display запустила массовое производство суперярких панелей с частотой 280 Гц 2 ч.
В Android 16 появится детектор поддельных вышек сотовой связи 2 ч.
Deloitte: прожорливость ИИ ЦОД может привести к перегрузке энергетической инфраструктуры США 3 ч.
Cooler Master выпустила компактный корпус NR200P V3 с поддержкой больших и мощных видеокарт 4 ч.
Китайский «Большой фонд» сосредоточится на импортозамещении в литографии и проектировании чипов 5 ч.
«Яндекс Фабрика» выпустила первые Bluetooth-колонки под брендом Commo — от 3490 рублей 5 ч.
«Удомля-3»: в Тверской области заработала третья очередь дата-центра «РТК-ЦОД» 6 ч.
Франция создаст многоразовый космоплан, похожий на «Шаттл» — деньги на него уже нашли 6 ч.
К 2050 году в мире будет 4 млрд роботов с ИИ — и TSMC планирует на этом хорошо заработать 7 ч.
Плёночные фотографии сравнили с имитацией фотоплёнки у смартфона Honor 400 Pro 7 ч.