Сегодня 19 января 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Apple научит ИИ понимать интерфейсы приложений

Исследователи компании Apple опубликовали работу, в которой описали систему генеративного искусственного интеллекта Ferret-UI, предназначенную для распознавания интерфейсов мобильных приложений. С её помощью ИИ сможет без предварительного обучения понимать интерфейс разных приложений и взаимодействовать с ними.

 Источник изображения: Carl Heyerdahl / unsplash.com

Источник изображения: Carl Heyerdahl / unsplash.com

Ferret-UI представляет собой большую мультимодальную языковую модель (MLLM), характерная особенность которых — способность к обучению на самых разных материалах, включающих текст, изображения, видео- и аудиоконтент. MLLM пока плохо справляются с распознаванием интерфейсов приложений и тому есть множество причин, одна из которых — несоответствие пропорций используемых для обучения изображений соотношению сторон экрана типичного смартфона. Искусственный интеллект плохо понимает мелкие изображения, такие как значки и кнопки, а кроме того, для анализа интерфейса приложения ему необходимо с ним взаимодействовать. По словам исследователей, им уже удалось превзойти GPT-4V и другие специализирующиеся на анализе интерфейсов MLLM.

Сфера применения Ferret-UI описана довольно расплывчато. С одной стороны, Apple может делать это намеренно, дабы не подавать конкурентам идеи конкретных продуктов, с другой — исследователи разрабатывают технологии, а поиск возможностей их применения не входит в их задачи. Но есть очевидные варианты: например, с помощью Ferret-UI можно попробовать оценить эффективность пользовательского интерфейса или помочь слепым лучше понять происходящее на экране смартфона. Другим возможным применением нового ИИ может стать интеграция с Siri, благодаря чему последней можно будет отдавать команды для взаимодействия с приложениями, например, купить авиабилеты на определённое время и по указанному тарифу.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Вечерний 3DNews
Каждый будний вечер мы рассылаем сводку новостей без белиберды и рекламы. Две минуты на чтение — и вы в курсе главных событий.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Windows 11 станет умнее: Microsoft тестирует ИИ-поиск по файлам 39 мин.
Слияние вместо продажи: Perplexity AI хочет спасти TikTok в США 42 мин.
Новая статья: Battle Shapers — боязнь амбиций. Рецензия 6 ч.
Новая статья: Gamesblender № 709: анонс Nintendo Switch 2, кризис Ubisoft и вампирская RPG от авторов «Ведьмака» 7 ч.
Стало известно, о чём Дуров говорил и что обещал на допросе во французском суде 17 ч.
TikTok предупредил, что завтра прекратит работу в США, если Байден не вмешается 17 ч.
Instagram добавил новые функции в Reels в преддверии блокировки TikTok в США 19 ч.
Новая статья: Marvel Rivals — нужна ли теперь Overwatch? Рецензия 18-01 00:03
Тактическая стратегия по «Звёздным войнам» от бывших разработчиков XCOM скоро выйдет из тени — инсайдер рассказал, когда ждать анонс 17-01 23:31
Ремастер Tomb Raider: The Angel of Darkness для сборника Tomb Raider IV-VI Remastered раскроет потенциал худшей игры серии — подробности улучшений 17-01 22:06
ASRock представила индустриальные мини-ПК и материнские платы на базе Intel Arrow Lake-H и AMD Ryzen 300 AI 7 ч.
CoreWeave поставит IBM ИИ-суперкомпьютер на базе NVIDIA GB200 NVL72 для обучения моделей Granite 8 ч.
Потенциальный министр транспорта США пообещал разобраться со штрафами SpaceX и ликвидировать космическую бюрократию 9 ч.
Телевизоры Samsung получат полезные ИИ-функции благодаря интеграции с нейросетями OpenAI 13 ч.
Qualcomm начала выпускать неполноценные Snapdragon 8 Elite 13 ч.
Астрономы получили наиболее детальное инфракрасное изображение активного ядра галактики 15 ч.
Новую тяжёлую европейскую ракету Ariane 6 улучшили — следующий пуск состоится в феврале 17 ч.
Amazon прекратила доставлять товары дронами после инцидента на испытательном полигоне 18 ч.
Во Франции создали крошечного робота-хирурга, который очень аккуратно покопается в мозгах 18 ч.
SpaceX запретили запускать Starship на время расследования взрыва при последнем полёте 19 ч.