Сегодня 20 мая 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Nvidia помогла Apple повысить эффективность больших языковых моделей ИИ

Инженеры Apple рассказали о сотрудничестве с Nvidia, благодаря которому им удалось повысить производительность систем при генерации текста большими языковыми моделями искусственного интеллекта.

 Источник изображения: developer.nvidia.com

Источник изображения: developer.nvidia.com

В этом году Apple опубликовала исходный код своего решения Recurrent Drafter (ReDrafter) — это новый метод генерации текста с помощью больших языковых моделей. Он отличается высокой скоростью работы, объединяя две технологии: лучевой поиск и динамическое древо внимания. Исследовательский проект Apple показал убедительные результаты, но при развёртывании ReDrafter технология была интегрирована в систему Nvidia TensorRT-LLM — этот инструмент позволяет быстрее запускать большие языковые модели на ускорителях Nvidia.

Как показали замеры производительности, при запуске больших языковых моделей с десятками миллиардов параметров с использованием фреймворка Nvidia TensorRT-LLM и ReDrafter скорость генерации токенов увеличилась в 2,7 раза. Таким образом, технология позволяет сократить задержку между вводом запроса пользователем и получением ответа от модели — при этом используется меньшее число ускорителей и снижается потребление энергии, сделали вывод инженеры Apple.

«Большие языковые модели всё чаще используются в работе приложений, и повышение эффективности вывода может повлиять на вычислительные издержки и сократить задержку для пользователей. Благодаря новому подходу ReDrafter к интегрированному во фреймворк Nvidia TensorRT-LLM спекулятивному выполнению разработчики теперь могут быстрее генерировать токены на ускорителях Nvidia для своих приложений», — добавили в Apple.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
В YouTube появился ИИ-поиск по роликам и генератор Shorts на базе Gemini Omni 4 ч.
Google выпустила Gemini Omni — ИИ для генерации видео из текста, фото, аудио и любых других данных 5 ч.
Microsoft отказывается от двухфакторной аутентификации по SMS в пользу ключей доступа 7 ч.
Google представила Gemini 3.5 Flash — сверхбыстрая ИИ-модель уже доступна бесплатно 8 ч.
Forza Horizon 6 только вышла, а уже обогнала по пиковому онлайну в Steam все другие игры Xbox 9 ч.
Anthropic переманила сооснователя OpenAI — Андрей Карпатый будет обучать Claude 9 ч.
Запустится даже на картошке: хардкорный ролевой боевик Outward 2 получил дату выхода в раннем доступе Steam и системные требования 9 ч.
Apple представила ИИ-функции для инвалидов — включая управление коляской взглядом 10 ч.
Московский суд по инициативе Роскомнадзора оштрафовал разработчиков Fortnite на два миллиона рублей 11 ч.
VMware представила превью гипервизора ESXi-Arm Fling для Arm-серверов 11 ч.
NASA испытает первые космические «заправки» для полётов к Луне и Марсу 4 ч.
Sony выпустила юбилейные наушники WH-1000X The ColleXion за $650 с шумоподавлением и урезанной автономностью 4 ч.
Новая статья: Обзор игрового ноутбука MSI Stealth 16 AI+ B3W: не размениваться на мелочи 5 ч.
До 84 ядер и 384 Мбайт L3-кеша: AMD опубликовала подробности о телеком-процессорах EPYC 8005 (Sorano) 6 ч.
Samsung объявила о старте продаж новых мониторов Odyssey и ViewFinity — вплоть до 6K 7 ч.
«Обезгугленные» TPU: Blackstone и Google развернут 500-МВт облако с фирменными ИИ-ускорителями Google без участия Google Cloud 7 ч.
Учёные решили головоломную задачу полётов ко множеству астероидов с минимальным расходом топлива 7 ч.
Microsoft представила очень дорогие планшеты Surface Pro 12 и ноутбуки Surface Laptop 8 на процессорах Intel Panther Lake 7 ч.
YADRO представила российский 2U-сервер Vegman R215 G4 на базе AMD EPYC Turin 8 ч.
AWS скупила дефицитные Mac Studio и теперь сдаёт их в аренду через облако 9 ч.