Сегодня 26 ноября 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Nvidia помогла Apple повысить эффективность больших языковых моделей ИИ

Инженеры Apple рассказали о сотрудничестве с Nvidia, благодаря которому им удалось повысить производительность систем при генерации текста большими языковыми моделями искусственного интеллекта.

 Источник изображения: developer.nvidia.com

Источник изображения: developer.nvidia.com

В этом году Apple опубликовала исходный код своего решения Recurrent Drafter (ReDrafter) — это новый метод генерации текста с помощью больших языковых моделей. Он отличается высокой скоростью работы, объединяя две технологии: лучевой поиск и динамическое древо внимания. Исследовательский проект Apple показал убедительные результаты, но при развёртывании ReDrafter технология была интегрирована в систему Nvidia TensorRT-LLM — этот инструмент позволяет быстрее запускать большие языковые модели на ускорителях Nvidia.

Как показали замеры производительности, при запуске больших языковых моделей с десятками миллиардов параметров с использованием фреймворка Nvidia TensorRT-LLM и ReDrafter скорость генерации токенов увеличилась в 2,7 раза. Таким образом, технология позволяет сократить задержку между вводом запроса пользователем и получением ответа от модели — при этом используется меньшее число ускорителей и снижается потребление энергии, сделали вывод инженеры Apple.

«Большие языковые модели всё чаще используются в работе приложений, и повышение эффективности вывода может повлиять на вычислительные издержки и сократить задержку для пользователей. Благодаря новому подходу ReDrafter к интегрированному во фреймворк Nvidia TensorRT-LLM спекулятивному выполнению разработчики теперь могут быстрее генерировать токены на ускорителях Nvidia для своих приложений», — добавили в Apple.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Американский регулятор рассекретил планы Sony на версию Death Stranding 2: On the Beach для ПК 20 мин.
Учёные обнаружили, что у ИИ пока имеются проблемы с пониманием каламбуров и юмора 5 ч.
Инженеры проиграли ИИ: модель Claude Opus 4.5 справилась с заданием Anthropic лучше любого из людей 9 ч.
Голосовой режим ChatGPT встроили в чат — он стал естественнее и его можно перебивать 10 ч.
Black Forest Labs представила ИИ-генератор изображений FLUX.2 с оптимизацией для видеокарт GeForce RTX 10 ч.
«Блокнот» в Windows 11 получил поддержку таблиц и больше ИИ-возможностей 12 ч.
Мультиплеерный экшен Spellcasters Chronicles от создателей Heavy Rain и Detroit: Become Human готовится к «бете», но только для избранных 12 ч.
Тиранид-прайм, новая операция и Кровавые Ангелы: для Warhammer 40,000: Space Marine 2 вышло крупное обновление «Утилизация» 14 ч.
Хакеры научились проникать на ПК через поддельный экран «Центра обновления Windows» 14 ч.
Появились первые намёки, во что превратятся Android и ChromeOS после слияния 15 ч.
Google плетёт сети в Индийском океане: подводный интернет-кабель TalayLink свяжет Австралию и Таиланд 15 мин.
Дженсен Хуанг заявил, что чипы Nvidia на поколение опережают всю отрасль, включая ускорители Google 2 ч.
HP Inc не оправдала ожиданий по прогнозу на прибыль и вынуждена объявить о сокращении персонала 3 ч.
Планы Meta использовать ИИ-ускорители Google TPU ударили по акциям NVIDIA 9 ч.
Новая статья: Обзор маршрутизатора Netcraze Ultra (NC-1812): новое имя, новый Wi-Fi 10 ч.
Samsung начала массовое производство 3-Гбайт чипов GDDR7 со скоростью 28 Гбит/с, и готовит более быстрые варианты 13 ч.
Huawei представила гибридный планшет MatePad Edge — 14,2" OLED, ПК-процессор и батарея на 12 900 мА·ч от $845 14 ч.
Финляндия создаст крупнейший в мире тепловой аккумулятор из целой горы песка 15 ч.
Японский конкурент TSMC начнёт строительство 1,4-нм фабрики чипов в 2027 году 15 ч.
Framework перестала продавать модули памяти из-за перекупщиков и предупредила о повышении цен 16 ч.