Сегодня 19 апреля 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Apple научит ИИ понимать интерфейсы приложений

Исследователи компании Apple опубликовали работу, в которой описали систему генеративного искусственного интеллекта Ferret-UI, предназначенную для распознавания интерфейсов мобильных приложений. С её помощью ИИ сможет без предварительного обучения понимать интерфейс разных приложений и взаимодействовать с ними.

 Источник изображения: Carl Heyerdahl / unsplash.com

Источник изображения: Carl Heyerdahl / unsplash.com

Ferret-UI представляет собой большую мультимодальную языковую модель (MLLM), характерная особенность которых — способность к обучению на самых разных материалах, включающих текст, изображения, видео- и аудиоконтент. MLLM пока плохо справляются с распознаванием интерфейсов приложений и тому есть множество причин, одна из которых — несоответствие пропорций используемых для обучения изображений соотношению сторон экрана типичного смартфона. Искусственный интеллект плохо понимает мелкие изображения, такие как значки и кнопки, а кроме того, для анализа интерфейса приложения ему необходимо с ним взаимодействовать. По словам исследователей, им уже удалось превзойти GPT-4V и другие специализирующиеся на анализе интерфейсов MLLM.

Сфера применения Ferret-UI описана довольно расплывчато. С одной стороны, Apple может делать это намеренно, дабы не подавать конкурентам идеи конкретных продуктов, с другой — исследователи разрабатывают технологии, а поиск возможностей их применения не входит в их задачи. Но есть очевидные варианты: например, с помощью Ferret-UI можно попробовать оценить эффективность пользовательского интерфейса или помочь слепым лучше понять происходящее на экране смартфона. Другим возможным применением нового ИИ может стать интеграция с Siri, благодаря чему последней можно будет отдавать команды для взаимодействия с приложениями, например, купить авиабилеты на определённое время и по указанному тарифу.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
EA показала суровую тактическую стратегию Star Wars Zero Company от ветеранов XCOM — первый трейлер и подробности 10 мин.
Новая статья: South of Midnight — соткана по лекалам. Рецензия 13 ч.
Спустя восемь лет «беты» Escape from Tarkov взяла курс на версию 1.0 — план обновлений игры на 2025 год 15 ч.
ChatGPT научился использовать воспоминания о пользователе для персонализации веб-поиска 16 ч.
Создатели следующей Battlefield рассказали о новом «языке разрушения» и показали его в деле 17 ч.
Глава Microsoft Gaming Фил Спенсер намекнул на продолжение Indiana Jones and the Great Circle 18 ч.
Разработчики Everspace 2 решили снизить цену на дополнение Wrath of the Ancients, потому что «вокруг дорожает буквально всё» 19 ч.
Google обжалует «неблагоприятное» решение суда о признании её монополистом в интернет-рекламе 19 ч.
84 % россиян выходят в интернет каждый день, подсчитал Mediascope 20 ч.
Cloud.ru представил первый в России управляемый облачный сервис для инференса ИИ-моделей — Evolution ML Inference 22 ч.
Looking Glass представила 27-дюймовый голографический 3D-монитор с разрешением 5K и ценой $10 тысяч 15 мин.
Космонавт Овчинин передал командование МКС японскому астронавту Ониси 15 мин.
Официально: Nothing Phone (3) выйдет в третьем квартале 2 ч.
Doogee представила тонкие смартфоны с проекторами и другие новинки на выставке Global Sources в Гонконге 2 ч.
Китай сделал шаг к колонизации Луны и Марса, создав соответствующую спутниковую сеть навигации и связи 3 ч.
Daimler рассчитывает вывести беспилотные грузовики на дороги США в 2027 году 6 ч.
Nvidia и AMD по итогам года потеряют из-за санкций против Китая до $18 млрд 7 ч.
HP отделалась выплатой $4 млн по иску о завышенных ценах и фиктивных скидках 19 ч.
Xiaomi представила компактный домашний проектор Redmi 3 Lite за $100 19 ч.
Nintendo Switch 2 избежала подорожания, несмотря на новые пошлины США — аксессуары тем же похвастаться не могут 19 ч.