Сегодня 19 ноября 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Nvidia помогла Apple повысить эффективность больших языковых моделей ИИ

Инженеры Apple рассказали о сотрудничестве с Nvidia, благодаря которому им удалось повысить производительность систем при генерации текста большими языковыми моделями искусственного интеллекта.

 Источник изображения: developer.nvidia.com

Источник изображения: developer.nvidia.com

В этом году Apple опубликовала исходный код своего решения Recurrent Drafter (ReDrafter) — это новый метод генерации текста с помощью больших языковых моделей. Он отличается высокой скоростью работы, объединяя две технологии: лучевой поиск и динамическое древо внимания. Исследовательский проект Apple показал убедительные результаты, но при развёртывании ReDrafter технология была интегрирована в систему Nvidia TensorRT-LLM — этот инструмент позволяет быстрее запускать большие языковые модели на ускорителях Nvidia.

Как показали замеры производительности, при запуске больших языковых моделей с десятками миллиардов параметров с использованием фреймворка Nvidia TensorRT-LLM и ReDrafter скорость генерации токенов увеличилась в 2,7 раза. Таким образом, технология позволяет сократить задержку между вводом запроса пользователем и получением ответа от модели — при этом используется меньшее число ускорителей и снижается потребление энергии, сделали вывод инженеры Apple.

«Большие языковые модели всё чаще используются в работе приложений, и повышение эффективности вывода может повлиять на вычислительные издержки и сократить задержку для пользователей. Благодаря новому подходу ReDrafter к интегрированному во фреймворк Nvidia TensorRT-LLM спекулятивному выполнению разработчики теперь могут быстрее генерировать токены на ускорителях Nvidia для своих приложений», — добавили в Apple.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Выросшие в интернете зумеры использует пароли слабее, чем их дедушки и бабушки 9 мин.
Первое крупное обновление принесёт в Ghost of Yotei режим «Новая игра +» и не только — геймплейный трейлер и дата выхода 55 мин.
В ЕС готовят конец эпохе раздражающих cookie-окон — всё решится на уровне браузера 2 ч.
The Temple of Elemental Evil не заставит себя долго ждать — объявлена дата выхода в Steam переиздания культовой RPG от соавторов Fallout 2 ч.
В Центробанке не ждут, что россияне массово перейдут на цифровой рубль 3 ч.
Исследователи собрали базу из 3,5 млрд номеров WhatsApp — мессенджер сам их выдавал 3 ч.
TikTok защитит пользователей от ИИ-контента и вознаградит ответственных 3 ч.
Австралиец погиб, не сумев вызвать скорую с Samsung Galaxy — на смартфоне не было обновлено ПО 6 ч.
Люди начали массово заводить романы с ИИ — доходит до виртуальных браков и детей 6 ч.
Игры на движке Unity скоро появятся в Fortnite — Epic Games и Unity заключили «уникальное партнёрство» 6 ч.
По одному GPU на каждого американца: ИИ-облако Lambda привлекло ещё $1,5 млрд инвестиций на амбициозное развитие инфраструктуры 2 ч.
Уровень брака у ангстремного техпроцесса Intel 18A падает на 7 % в месяц — процессоры Panther Lake не за горами 2 ч.
TP-Link подала в суд на Netgear за клевету о связях с Китаем — под угрозой продажи на $1 млрд 3 ч.
Honor живьём показала Robot Phone с камерой на роборуке — официальный анонс намечен на март 3 ч.
Noctua выпустила чёрный флагманский кулер NH-D15 G2 chromax.black по цене от $160 3 ч.
Кризис в Красном море повлиял на проекты интернет-кабелей Google и Meta 3 ч.
132 «динамических» Arm-ядра и 12 каналов памяти: Microsoft представила процессоры Cobalt 200 для облака Azure 4 ч.
ЦЕРН разогнал производство антивещества в восемь раз: «10 лет назад это сочли бы научной фантастикой» 5 ч.
Новым ИТ-директором с Intel поделилась Adobe 6 ч.
Xpeng собралась выпустить миллион человекоподобных роботов по цене электромобиля — как Tesla 6 ч.