Сегодня 18 мая 2024
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Apple научит ИИ понимать интерфейсы приложений

Исследователи компании Apple опубликовали работу, в которой описали систему генеративного искусственного интеллекта Ferret-UI, предназначенную для распознавания интерфейсов мобильных приложений. С её помощью ИИ сможет без предварительного обучения понимать интерфейс разных приложений и взаимодействовать с ними.

 Источник изображения: Carl Heyerdahl / unsplash.com

Источник изображения: Carl Heyerdahl / unsplash.com

Ferret-UI представляет собой большую мультимодальную языковую модель (MLLM), характерная особенность которых — способность к обучению на самых разных материалах, включающих текст, изображения, видео- и аудиоконтент. MLLM пока плохо справляются с распознаванием интерфейсов приложений и тому есть множество причин, одна из которых — несоответствие пропорций используемых для обучения изображений соотношению сторон экрана типичного смартфона. Искусственный интеллект плохо понимает мелкие изображения, такие как значки и кнопки, а кроме того, для анализа интерфейса приложения ему необходимо с ним взаимодействовать. По словам исследователей, им уже удалось превзойти GPT-4V и другие специализирующиеся на анализе интерфейсов MLLM.

Сфера применения Ferret-UI описана довольно расплывчато. С одной стороны, Apple может делать это намеренно, дабы не подавать конкурентам идеи конкретных продуктов, с другой — исследователи разрабатывают технологии, а поиск возможностей их применения не входит в их задачи. Но есть очевидные варианты: например, с помощью Ferret-UI можно попробовать оценить эффективность пользовательского интерфейса или помочь слепым лучше понять происходящее на экране смартфона. Другим возможным применением нового ИИ может стать интеграция с Siri, благодаря чему последней можно будет отдавать команды для взаимодействия с приложениями, например, купить авиабилеты на определённое время и по указанному тарифу.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Вечерний 3DNews
Каждый будний вечер мы рассылаем сводку новостей без белиберды и рекламы. Две минуты на чтение — и вы в курсе главных событий.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Google выпустил вторую бету Android 15 с «Личным пространством», предиктивным «Назад» и множеством других нововведений 4 ч.
Новая статья: Animal Well — колодец, из которого не хочется вылезать. Рецензия 4 ч.
В России готовы взяться за борьбу с серым импортом видеоигр 5 ч.
Microsoft начала веерные остановки подписок на свои облачные продукты для российских корпоративных клиентов 5 ч.
Лучше поздно, чем никогда: Arkane Austin всё-таки выпустит финальное обновление Redfall 6 ч.
МТС открыла магистратуру по искусственному интеллекту в Высшей школе экономики 8 ч.
Sony пригрозила 700 компаниям судом за несанкционированное использование музыки для обучения ИИ 9 ч.
Ubisoft отреагировала на слухи о требованиях Assassin's Creed Shadows к постоянному онлайн-подключению 9 ч.
Следующая Call of Duty на старте продаж станет доступна в Game Pass 10 ч.
Intel выпустила видеодрайвер с поддержкой Ghost of Tsushima, Senua’s Saga: Hellblade II, Wuthering Waves и XDefiant 11 ч.
Слухи: Apple готовит сверхтонкий iPhone 17 — он выйдет в 2025 году и будет дороже iPhone 17 Pro Max 2 ч.
Крупнейший в России оператор ЦОД и облачных услуг «РТК-ЦОД» готовится к IPO 7 ч.
Palit представит на Computex видеокарту с водоблоком и воздушной системой охлаждения 8 ч.
Роборуки от MIT помогут астронавтам NASA встать после падения на Луне 8 ч.
Xiaomi представила смартфон среднего уровня Redmi Note 13R — он почти идентичен Redmi Note 12R 8 ч.
AT&T и AST SpaceMobile обеспечат спутниковой связью обычные смартфоны сначала в США, а после — по всей Земле 8 ч.
TSMC будет выпускать основания для стеков HBM4 по 12- и 5-нм техпроцессам 11 ч.
LG свернула производство рулонных телевизоров Signature OLED R 11 ч.
Производитель микроэлектроники «Элемент» выйдет на биржу до конца мая — это позволит привлечь до 15 млрд рублей на развитие 11 ч.
Раскрыта примерная цена российского электромобиля «Атом» 12 ч.