Сегодня 14 октября 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Apple разработала ИИ, который понимает человека лучше GPT-4

Научные сотрудники Apple разработали систему искусственного интеллекта ReALM (Reference Resolution as Language Modeling), способную существенно улучшить понимание человека голосовыми помощниками и повысить эффективность их реакции на запросы.

В Apple описали систему как способ решить проблему разрешения ссылок большими языковыми моделями — она поможет ИИ интерпретировать описание пользователем объектов на экране и лучше понимать контекст разговора. В результате ReALM приведёт к более интуитивному и естественному взаимодействию с устройствами. Разрешение ссылок помогает системам лучше понимать естественную речь, позволяя пользователям в разговоре с ИИ пользоваться местоимениями и другими косвенными отсылками. Для голосовых помощников этот аспект взаимодействия с человеком традиционно представлял значительную проблему, и система ReALM сводит её к задаче, решаемой на уровне языковой модели. ИИ начинает адекватно воспринимать отсылки к визуальным элементам на экране и интегрирует эти понятия в поток разговора.

ReALM восстанавливает визуальный макет экрана при помощи текстовых представлений. Этот процесс включает в себя анализ экранных объектов и их местоположений с его переводом в текстовый формат, отражающий содержимое и структуру элементов на экране. Исследователи Apple обнаружили, что этот способ в сочетании с тонкой настройкой языковых моделей значительно превосходит традиционные методы, включая возможности нейросети OpenAI GPT-4. ReALM поможет пользователям предельно просто описывать элементы экрана, а ИИ-помощникам — понимать такие описания. Эти возможности окажутся полезными, например, при управлении информационно-развлекательными системами автомобилей с помощью голосовых команд и повысят эффективность голосового интерфейса для людей с ограниченными возможностями.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Discord нашла виноватого в утечке данных пользователей — подрядчик заявил, что его не взламывали 12 мин.
Google Meet теперь умеет накладывать виртуальный макияж с помощью ИИ 45 мин.
Разработчики No, I’m not a Human похвастались продажами и посоветовали приготовиться к встрече новых гостей 2 ч.
Microsoft ответит в суде за слишком дорогую подписку ChatGPT 2 ч.
Instagram защитит подростков от ИИ и «взрослого» контента — фильтр PG-13 теперь включён по умолчанию 2 ч.
Splinter Cell: Pandora Tomorrow спустя 20 лет вернулась на ПК — культовый стелс-экшен внезапно появился в Steam, EGS и Ubisoft Connect 2 ч.
Google Gemini научился пересказывать содержимое страниц в мобильном Chrome 3 ч.
Microsoft начала сканировать лица на снимках в OneDrive — отказаться от этого можно лишь трижды в год 3 ч.
Надёжный инсайдер рассекретил дату выхода и цену Assassin’s Creed Shadows на Nintendo Switch 2 3 ч.
Создатели ремейка Demon’s Souls взялись за загадочный экшен от третьего лица — фанаты Bloodborne напряглись 4 ч.
Oracle купит 50 000 ИИ-ускорителей AMD — альтернатива Nvidia набирает обороты 29 мин.
OCP поможет в унификации чиплетов с применением открытых стандартов 2 ч.
AOC анонсировала геймерский дисплей, на котором можно играть без ПК — 41,5" OLED, 144 Гц и Android 14 2 ч.
Be quiet! представила компактный башенный кулер Pure Rock Slim 3 для процессоров до 130 Вт 3 ч.
Huawei выпустила 8-долларовую беспроводную мышь Enjoy Edition с автономностью до 12 месяцев 3 ч.
Motorola представила смартфон Moto G100 — Snapdragon 7s Gen 2 и батарея на 7000 мА·ч за $190 3 ч.
В спутниковой связи не оказалось шифрования — любой может перехватывать сообщения, звонки и трафик 3 ч.
Иностранные SIM-карты переохладили: блокировка в России не снимается через обещанные 24 часа 3 ч.
Ключевая для NASA лаборатория потеряла 10 % сотрудников — их просто уволили 3 ч.
ASML показала 20-летний рекорд выручки за сентябрь и привлекла внимание инвесторов 3 ч.