Сегодня 01 июня 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Nvidia помогла Apple повысить эффективность больших языковых моделей ИИ

Инженеры Apple рассказали о сотрудничестве с Nvidia, благодаря которому им удалось повысить производительность систем при генерации текста большими языковыми моделями искусственного интеллекта.

 Источник изображения: developer.nvidia.com

Источник изображения: developer.nvidia.com

В этом году Apple опубликовала исходный код своего решения Recurrent Drafter (ReDrafter) — это новый метод генерации текста с помощью больших языковых моделей. Он отличается высокой скоростью работы, объединяя две технологии: лучевой поиск и динамическое древо внимания. Исследовательский проект Apple показал убедительные результаты, но при развёртывании ReDrafter технология была интегрирована в систему Nvidia TensorRT-LLM — этот инструмент позволяет быстрее запускать большие языковые модели на ускорителях Nvidia.

Как показали замеры производительности, при запуске больших языковых моделей с десятками миллиардов параметров с использованием фреймворка Nvidia TensorRT-LLM и ReDrafter скорость генерации токенов увеличилась в 2,7 раза. Таким образом, технология позволяет сократить задержку между вводом запроса пользователем и получением ответа от модели — при этом используется меньшее число ускорителей и снижается потребление энергии, сделали вывод инженеры Apple.

«Большие языковые модели всё чаще используются в работе приложений, и повышение эффективности вывода может повлиять на вычислительные издержки и сократить задержку для пользователей. Благодаря новому подходу ReDrafter к интегрированному во фреймворк Nvidia TensorRT-LLM спекулятивному выполнению разработчики теперь могут быстрее генерировать токены на ускорителях Nvidia для своих приложений», — добавили в Apple.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Самурайский экшен Onimusha: Way of the Sword выйдет до GTA VI — инсайдер раскрыл дату релиза первой за 20 лет новой игры серии 36 мин.
К взлёту готов: амбициозный авиасимулятор «Корея. Серия Ил-2» получил дату выхода в раннем доступе Steam 2 ч.
Княжна, волки и настоящие эмоции: российский боевик «Война Миров: Сибирь» получил атмосферный сюжетный трейлер 3 ч.
«У людей должна быть свобода выбора»: GamesVoice не откажется от русской озвучки Cyberpunk 2077: Phantom Liberty, несмотря на претензии CD Projekt Red 3 ч.
Наш SQL: фанаты MySQL основали фонд OurSQL Foundation, чтобы давить на Oracle 4 ч.
Анонсирована «Смерш: Охотник на волков» — идейная наследница стелс-игр «Смерть шпионам» 14 ч.
Иранские хакеры превратили ChatGPT и Gemini в оружие для кибервойны 18 ч.
GamesVoice анонсировала сбор средств на русскую озвучку Cyberpunk 2077: Phantom Liberty, но CDPR это не понравилось 20 ч.
Трафик поисковика DuckDuckGo утроился после последнего обновления ИИ-поиска Google 24 ч.
ИИ стал реже галлюцинировать, но всё ещё уверенно выдаёт ложь за правду 24 ч.
Nvidia расписала будущее процессоров RTX Spark для мобильных и настольных ПК до 2030 года 30 мин.
Представлен Surface Laptop Ultra — это самый мощный ноутбук Microsoft, и он получил процессор Nvidia RTX Spark 37 мин.
Apple собралась захватить рынок умных очков по проверенному сценарию Apple Watch 42 мин.
Intel раскрыла детали серверного ИИ-ускорителя Crescent Island — до 350 Вт и 480 Гбайт LPDDR5X 50 мин.
Ampere Computing: экстремальная жара в мире потребует больше энергии, повышения эффективности вычислений и сокращения количества ЦОД 2 ч.
РТК-ЦОД разворачивает в своих дата-центрах высокоскоростной защищенный Wi-Fi от «Ростелеком» 2 ч.
AMD получит фору: ангстремные Xeon Diamond Rapids задержатся до 2027 года 3 ч.
Венчурные капиталисты всё активнее вкладываются в стартапы, связанные с физическим воплощением ИИ 4 ч.
Власти США запретят китайским компаниям закупать передовые ускорители для своих зарубежных ЦОД 6 ч.
AMD выпустит Radeon RX 9070 GRE по всему миру — 12-Гбайт видеокарту для комфортной игры в 1440p оценили в $549 9 ч.