Сегодня 01 июня 2024
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Apple научит ИИ понимать интерфейсы приложений

Исследователи компании Apple опубликовали работу, в которой описали систему генеративного искусственного интеллекта Ferret-UI, предназначенную для распознавания интерфейсов мобильных приложений. С её помощью ИИ сможет без предварительного обучения понимать интерфейс разных приложений и взаимодействовать с ними.

 Источник изображения: Carl Heyerdahl / unsplash.com

Источник изображения: Carl Heyerdahl / unsplash.com

Ferret-UI представляет собой большую мультимодальную языковую модель (MLLM), характерная особенность которых — способность к обучению на самых разных материалах, включающих текст, изображения, видео- и аудиоконтент. MLLM пока плохо справляются с распознаванием интерфейсов приложений и тому есть множество причин, одна из которых — несоответствие пропорций используемых для обучения изображений соотношению сторон экрана типичного смартфона. Искусственный интеллект плохо понимает мелкие изображения, такие как значки и кнопки, а кроме того, для анализа интерфейса приложения ему необходимо с ним взаимодействовать. По словам исследователей, им уже удалось превзойти GPT-4V и другие специализирующиеся на анализе интерфейсов MLLM.

Сфера применения Ferret-UI описана довольно расплывчато. С одной стороны, Apple может делать это намеренно, дабы не подавать конкурентам идеи конкретных продуктов, с другой — исследователи разрабатывают технологии, а поиск возможностей их применения не входит в их задачи. Но есть очевидные варианты: например, с помощью Ferret-UI можно попробовать оценить эффективность пользовательского интерфейса или помочь слепым лучше понять происходящее на экране смартфона. Другим возможным применением нового ИИ может стать интеграция с Siri, благодаря чему последней можно будет отдавать команды для взаимодействия с приложениями, например, купить авиабилеты на определённое время и по указанному тарифу.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Вечерний 3DNews
Каждый будний вечер мы рассылаем сводку новостей без белиберды и рекламы. Две минуты на чтение — и вы в курсе главных событий.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Европол отключил 2000 вредоносных доменов киберпреступников 7 мин.
Число владельцев криптовалют в мире достигло 562 млн — крипта есть у каждого тринадцатого 2 ч.
Лидеры ведущих ИИ-компаний прибыли на секретное заседание Бильдербергского клуба 3 ч.
Владелец Ticketmaster подтвердил утечку данных 560 млн пользователей спустя 11 дней 8 ч.
В Telegram добавили сообщения с анимированными эффектами, глобальные хештеги и другие нововведения 9 ч.
Anthropic позволит создавать персональных помощников на базе ИИ-чат-бота Claude 10 ч.
ElevenLabs запустила ИИ-генератор звуковых эффектов по текстовому описанию 11 ч.
Новая статья: Songs of Conquest — песнь величия. Рецензия 22 ч.
В ранний доступ Steam ворвался олдскульный шутер Selaco на движке классических Doom — с перестрелками и умными врагами в духе F.E.A.R. 24 ч.
Warhorse официально подтвердила перевод на русский язык в Kingdom Come: Deliverance 2 31-05 20:43
Apple выбрала процессоры М2 Ultra и М4 для серверов, на которых будут работать ИИ-функции iPhone 4 ч.
Выставка Computex 2024 откроется 4 июня, но презентации AMD, Intel и Nvidia пройдут раньше 5 ч.
iPhone 5s официально устарел, а iPod touch 6 стал винтажным 5 ч.
Наелся завтраками: японский миллиардер отменил круиз вокруг Луны на корабле Starship 5 ч.
Vivo оккупировала значительную часть майского рейтинга производительности AnTuTu 6 ч.
Игровой монитор Xiaomi G Pro 27i на панели Mini LED с 1152 зонами затенения выйдет на мировой рынок 6 ч.
Starlink хочет открыть для пользователей спутниковую сотовую связь уже осенью 8 ч.
Новые спутники Starlink могут уничтожить радиоастрономию на Земле, предупреждают учёные 10 ч.
Корейский профсоюз Samsung объявил забастовку, но на производство и поставки памяти это не повлияет 10 ч.
Последний «дружественный» поставщик VSAT-оборудования Gilat Satellite Networks приостановил работу в РФ 11 ч.