Сегодня 21 ноября 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Apple разработала ИИ, который понимает человека лучше GPT-4

Научные сотрудники Apple разработали систему искусственного интеллекта ReALM (Reference Resolution as Language Modeling), способную существенно улучшить понимание человека голосовыми помощниками и повысить эффективность их реакции на запросы.

В Apple описали систему как способ решить проблему разрешения ссылок большими языковыми моделями — она поможет ИИ интерпретировать описание пользователем объектов на экране и лучше понимать контекст разговора. В результате ReALM приведёт к более интуитивному и естественному взаимодействию с устройствами. Разрешение ссылок помогает системам лучше понимать естественную речь, позволяя пользователям в разговоре с ИИ пользоваться местоимениями и другими косвенными отсылками. Для голосовых помощников этот аспект взаимодействия с человеком традиционно представлял значительную проблему, и система ReALM сводит её к задаче, решаемой на уровне языковой модели. ИИ начинает адекватно воспринимать отсылки к визуальным элементам на экране и интегрирует эти понятия в поток разговора.

ReALM восстанавливает визуальный макет экрана при помощи текстовых представлений. Этот процесс включает в себя анализ экранных объектов и их местоположений с его переводом в текстовый формат, отражающий содержимое и структуру элементов на экране. Исследователи Apple обнаружили, что этот способ в сочетании с тонкой настройкой языковых моделей значительно превосходит традиционные методы, включая возможности нейросети OpenAI GPT-4. ReALM поможет пользователям предельно просто описывать элементы экрана, а ИИ-помощникам — понимать такие описания. Эти возможности окажутся полезными, например, при управлении информационно-развлекательными системами автомобилей с помощью голосовых команд и повысят эффективность голосового интерфейса для людей с ограниченными возможностями.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Создатели Vampire Survivors анонсировали безумный карточный роглайк Vampire Crawlers с «турбопошаговыми боями» и настоящими стенами 2 ч.
Google поселила Gemini в автомобили — ИИ-помощник стал доступен в Android Auto 3 ч.
OpenAI запустила групповые чаты в ChatGPT для пользователей по всему миру 6 ч.
Android научился отправлять файлы прямо на iPhone через AirDrop — но функция пока доступна не всем 6 ч.
Google Gemini научился определять изображения, созданные с помощью ИИ, но пока не все 13 ч.
Сицилийское кино, фоторежим и новый контент: для Mafia: The Old Country вышло крупное обновление «Прогулка» 14 ч.
Первая за 10 лет новая Carmageddon оказалась роглайтом — тизер-трейлер Carmageddon: Rogue Shift 15 ч.
Pornhub призвал Apple, Google и Microsoft встроить проверку возраста прямо в смартфоны и ПК 16 ч.
За несколько часов до официального анонса THQ Nordic проговорилась о дате выхода Reanimal — кооперативного хоррора от авторов Little Nightmares 16 ч.
Спустя всего месяц Battlefield 6 вырвалась в лидеры самых продаваемых игр за 2025 год в США 16 ч.
Плюшевый медведь с ИИ провалился — он начал болтать на фривольные и опасные темы, продажи остановлены 3 ч.
Foxconn и OpenAI будут совместно разрабатывать оборудование для центров обработки данных 4 ч.
В США раскрыли сеть контрабанды ИИ-чипов Nvidia в Китай — подозреваемым грозит до 20 лет тюрьмы 6 ч.
Новая статья: Уйти от CISC — пойти на RISC: начало 11 ч.
Производитель смарт-колец Oura Ring подал в суд на Samsung, Amazfit и других за кражу разработок 15 ч.
IBM и Cisco к концу 30-х годов создадут интернет для котов Шрёдингера — квантовый и запутанный 15 ч.
Leica представила камеру Q3 Monochrom исключительно для чёрно-белой съёмки — и она на $1055 дороже цветной версии 16 ч.
Redragon выпустила Impact M908 SE — игровую мышь за $33 с 18 программируемыми кнопками для поклонников MMO 17 ч.
Intel подтвердила, что представит процессоры Core Ultra 300 на выставке CES 2026 в январе 17 ч.
Nokia меняет стратегию развития, сделав ставку на ИИ, ЦОД и 6G 17 ч.