Сегодня 26 марта 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Nvidia помогла Apple повысить эффективность больших языковых моделей ИИ

Инженеры Apple рассказали о сотрудничестве с Nvidia, благодаря которому им удалось повысить производительность систем при генерации текста большими языковыми моделями искусственного интеллекта.

 Источник изображения: developer.nvidia.com

Источник изображения: developer.nvidia.com

В этом году Apple опубликовала исходный код своего решения Recurrent Drafter (ReDrafter) — это новый метод генерации текста с помощью больших языковых моделей. Он отличается высокой скоростью работы, объединяя две технологии: лучевой поиск и динамическое древо внимания. Исследовательский проект Apple показал убедительные результаты, но при развёртывании ReDrafter технология была интегрирована в систему Nvidia TensorRT-LLM — этот инструмент позволяет быстрее запускать большие языковые модели на ускорителях Nvidia.

Как показали замеры производительности, при запуске больших языковых моделей с десятками миллиардов параметров с использованием фреймворка Nvidia TensorRT-LLM и ReDrafter скорость генерации токенов увеличилась в 2,7 раза. Таким образом, технология позволяет сократить задержку между вводом запроса пользователем и получением ответа от модели — при этом используется меньшее число ускорителей и снижается потребление энергии, сделали вывод инженеры Apple.

«Большие языковые модели всё чаще используются в работе приложений, и повышение эффективности вывода может повлиять на вычислительные издержки и сократить задержку для пользователей. Благодаря новому подходу ReDrafter к интегрированному во фреймворк Nvidia TensorRT-LLM спекулятивному выполнению разработчики теперь могут быстрее генерировать токены на ускорителях Nvidia для своих приложений», — добавили в Apple.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
«Википедия» целиком и полностью запретила статьи, написанные нейросетями 58 мин.
Бюджеты вышли из-под контроля: журналист объяснил, почему «штормит» игровую индустрию 2 ч.
HP встроила в ноутбуки локальную ИИ-модель GPT, чтобы «помочь людям добиться большего успеха на работе» 2 ч.
«Чертовски крутой» шутер новой студии ветерана Call of Duty не был игрой-сервисом, но от закрытия Dark Outlaw Games это не спасло 3 ч.
OpenAI передумала развращать ChatGPT — проект ИИ-бота для взрослых отправили «в долгий ящик» 3 ч.
Верховный суд США не дал Sony привлечь провайдера за пособничество пиратам 4 ч.
Yandex B2B Tech запустила Cloud Stackland — платформу контейнеризации с интегрированными PaaS‑сервисами Yandex Cloud 5 ч.
Google разрешила Apple дистиллировать ИИ-модели Gemini, чтобы запускать их прямо на iPhone или Mac 5 ч.
ИИ от Microsoft и NVIDIA ускорит создание новых атомных реакторов 6 ч.
Gartner: к 2030 году себестоимость инференса снизится на 90 %, но качественный ИИ дешевле не станет 6 ч.
«Ростелеком» сообщил о взрывном росте популярности стационарных телефонов 59 мин.
К MacBook Neo приделали жидкостный кулер — производительность в No Man’s Sky удвоилась 2 ч.
Panasonic уже распродала аккумуляторы, которые выпустит в следующем году — ИИ-бум добрался и сюда 2 ч.
Энтузиаст совершил виртуальную посадку на Луну с помощью 40-летнего компьютера ZX Spectrum 2 ч.
Глобальные поставки OLED-мониторов подскочили на 92 % в 2025 году — лидирует Asus 2 ч.
Акционеры подали на Supermicro в суд с требованием компенсировать потери из-за падения акций на фоне скандала с контрабандой в Китай 2 ч.
Caviar представила роскошные iPhone 17 в честь 50-летия Apple — есть даже с кусочком водолазки Стива Джобса 3 ч.
Пока без китайцев: Sony представила телевизоры Bravia 3 II и саундбары Bravia Theater Bar 3 ч.
Смартфон Tecno Camon 50 поступил в продажу в России по цене от 19 999 рублей 3 ч.
DJI подала в суд на Insta360 за кражу патентов 4 ч.