Сегодня 19 августа 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Nvidia помогла Apple повысить эффективность больших языковых моделей ИИ

Инженеры Apple рассказали о сотрудничестве с Nvidia, благодаря которому им удалось повысить производительность систем при генерации текста большими языковыми моделями искусственного интеллекта.

 Источник изображения: developer.nvidia.com

Источник изображения: developer.nvidia.com

В этом году Apple опубликовала исходный код своего решения Recurrent Drafter (ReDrafter) — это новый метод генерации текста с помощью больших языковых моделей. Он отличается высокой скоростью работы, объединяя две технологии: лучевой поиск и динамическое древо внимания. Исследовательский проект Apple показал убедительные результаты, но при развёртывании ReDrafter технология была интегрирована в систему Nvidia TensorRT-LLM — этот инструмент позволяет быстрее запускать большие языковые модели на ускорителях Nvidia.

Как показали замеры производительности, при запуске больших языковых моделей с десятками миллиардов параметров с использованием фреймворка Nvidia TensorRT-LLM и ReDrafter скорость генерации токенов увеличилась в 2,7 раза. Таким образом, технология позволяет сократить задержку между вводом запроса пользователем и получением ответа от модели — при этом используется меньшее число ускорителей и снижается потребление энергии, сделали вывод инженеры Apple.

«Большие языковые модели всё чаще используются в работе приложений, и повышение эффективности вывода может повлиять на вычислительные издержки и сократить задержку для пользователей. Благодаря новому подходу ReDrafter к интегрированному во фреймворк Nvidia TensorRT-LLM спекулятивному выполнению разработчики теперь могут быстрее генерировать токены на ускорителях Nvidia для своих приложений», — добавили в Apple.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
«Ждите провал на ПК»: первый трейлер мрачного экшена Lords of the Fallen 2 разочаровал тех, кто ждал игру в Steam 4 мин.
Возвращение к корням, эпический сюжет и новый разработчик: анонсирована Warhammer 40,000: Dawn of War IV 57 мин.
Авторы Ghostrunner анонсировали Valor Mortis — экшен от первого лица в стиле Dark Souls про восставшего из мёртвых солдата армии Наполеона 2 ч.
Первый геймплейный трейлер Call of Duty: Black Ops 7 подтвердил утечку даты выхода и «бесконечный» эндгейм сюжетной кампании 2 ч.
Спасать BioShock 4 из производственного ада доверили экс-руководителю Diablo 3 ч.
Phison пообещала разобраться с ломающим SSD обновлением Windows 11 24H2 3 ч.
Adobe представила Acrobat Studio — платформу на базе ИИ для работы со множеством разношёрстных файлов 3 ч.
Nvidia выпустила драйвер с поддержкой Smooth Motion и глобальными настройками DLSS Override для карт RTX 40-й серии 3 ч.
Dragon Age: The Veilguard, возвращение Persona 4 Golden и новые релизы: Microsoft раскрыла, какие игры пополнят Game Pass в конце августа 4 ч.
«Достойно того, чтобы стать легендой»: PlayStation анонсировала кроссовер Helldivers 2 с Halo 6 ч.
Foxconn будет производить ИИ-оборудование для проекта Stargate на заводе, который она продала SoftBank 10 мин.
LG представила 49-дюймовый монитор UltraWide 49U950A-W — DWQHD, 144 Гц и зарядка на 90 Вт 48 мин.
Google почти бесплатно обогреет жителей целого города в Финляндии «мусорным» теплом дата-центра 2 ч.
Xbox Ally получит всего четыре ядра Zen 2 — не ровня Xbox Ally X с восьмёркой Zen 5 2 ч.
Каждый россиянин теперь тратит на мобильную связь в среднем более 1100 рублей в месяц 3 ч.
SoftBank рассматривала поглощение Intel Foundry, но в итоге ограничилась инвестициями в $2 млрд 4 ч.
Asus представила ROG Matrix GeForce RTX 5090 30th Anniversary Limited Edition с четырьмя вентиляторами и TDP до 800 Вт 4 ч.
«Комета Дьявола» укрепила теорию о внеземном происхождении воды на Земле 6 ч.
Qualcomm представила Snapdragon 7s Gen 4 для доступных смартфонов среднего уровня 6 ч.
«Мы готовим различные продукты»: Nvidia ответила на слухи об урезанном Blackwell для Китая 6 ч.