Сегодня 18 мая 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Nvidia помогла Apple повысить эффективность больших языковых моделей ИИ

Инженеры Apple рассказали о сотрудничестве с Nvidia, благодаря которому им удалось повысить производительность систем при генерации текста большими языковыми моделями искусственного интеллекта.

 Источник изображения: developer.nvidia.com

Источник изображения: developer.nvidia.com

В этом году Apple опубликовала исходный код своего решения Recurrent Drafter (ReDrafter) — это новый метод генерации текста с помощью больших языковых моделей. Он отличается высокой скоростью работы, объединяя две технологии: лучевой поиск и динамическое древо внимания. Исследовательский проект Apple показал убедительные результаты, но при развёртывании ReDrafter технология была интегрирована в систему Nvidia TensorRT-LLM — этот инструмент позволяет быстрее запускать большие языковые модели на ускорителях Nvidia.

Как показали замеры производительности, при запуске больших языковых моделей с десятками миллиардов параметров с использованием фреймворка Nvidia TensorRT-LLM и ReDrafter скорость генерации токенов увеличилась в 2,7 раза. Таким образом, технология позволяет сократить задержку между вводом запроса пользователем и получением ответа от модели — при этом используется меньшее число ускорителей и снижается потребление энергии, сделали вывод инженеры Apple.

«Большие языковые модели всё чаще используются в работе приложений, и повышение эффективности вывода может повлиять на вычислительные издержки и сократить задержку для пользователей. Благодаря новому подходу ReDrafter к интегрированному во фреймворк Nvidia TensorRT-LLM спекулятивному выполнению разработчики теперь могут быстрее генерировать токены на ускорителях Nvidia для своих приложений», — добавили в Apple.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Китайские компании превзошли американских конкурентов в сфере генерации видео при помощи ИИ 28 мин.
Мейнфреймы тоже «поржавеют»: для IBM z готовится поддержка Rust в ядре Linux 15 ч.
Microsoft расширила поддержку технологии Advanced Shader Delivery на видеокарты AMD 17 ч.
Konami ограничит доступ к своим игровым серверам для пользователей из России и Белоруссии 19 ч.
Тесты подтвердили: Claude Mythos превосходит конкурентов в поиске уязвимостей, но имеет другие слабые места 24 ч.
Новая статья: Subnautica 2 — хорошо на дне морском. Предварительный обзор 17-05 00:04
Acronis представила платформу Cyber Frame — альтернативу продуктам VMware 16-05 23:23
Microsoft разрешит менять положение панели задач и размер меню «Пуск» в Windows 11 16-05 15:38
Бороться со своими дипфейками на YouTube теперь может любой желающий 16-05 15:33
ZA/UM показала 12 минут геймплея Zero Parades: For Dead Spies — психоделической шпионской RPG в духе Disco Elysium 16-05 12:17
Новая статья: Обзор Intel Core Ultra 7 270K Plus — лучший Arrow Lake за полцены 7 ч.
NEC завершила прокладку подводной кабельной системы EMCS, связывающей Федеративные Штаты Микронезии, Кирибати и Науру 9 ч.
Asus сертифицировала 17 модулей DDR5 — они точно совместимы с платами ROG 14 ч.
Xiaomi подтвердила, что в этом году выпустит новый фирменный процессор серии Xring 15 ч.
Медные водоблоки на основе 3D-печати помогут повысить энергоэффективность ЦОД 16 ч.
Тесты прояснили, почему Intel не выпустила Core Ultra 9 290K Plus — в нём нет практического смысла 17 ч.
Глава Samsung извинился перед клиентами за последствия забастовки, которая пока не началась 19 ч.
Xiaomi официально объяснила отказ от выпуска смартфона Xiaomi 17 Air с 5,5-мм толщиной корпуса 19 ч.
Intel стала вычислительным партнёром McLaren и бросила вызов AMD на трассах «Формулы-1» 19 ч.
Суд Маска против OpenAI превратился в публичную перебранку миллиардеров 20 ч.