Сегодня 15 ноября 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Nvidia помогла Apple повысить эффективность больших языковых моделей ИИ

Инженеры Apple рассказали о сотрудничестве с Nvidia, благодаря которому им удалось повысить производительность систем при генерации текста большими языковыми моделями искусственного интеллекта.

 Источник изображения: developer.nvidia.com

Источник изображения: developer.nvidia.com

В этом году Apple опубликовала исходный код своего решения Recurrent Drafter (ReDrafter) — это новый метод генерации текста с помощью больших языковых моделей. Он отличается высокой скоростью работы, объединяя две технологии: лучевой поиск и динамическое древо внимания. Исследовательский проект Apple показал убедительные результаты, но при развёртывании ReDrafter технология была интегрирована в систему Nvidia TensorRT-LLM — этот инструмент позволяет быстрее запускать большие языковые модели на ускорителях Nvidia.

Как показали замеры производительности, при запуске больших языковых моделей с десятками миллиардов параметров с использованием фреймворка Nvidia TensorRT-LLM и ReDrafter скорость генерации токенов увеличилась в 2,7 раза. Таким образом, технология позволяет сократить задержку между вводом запроса пользователем и получением ответа от модели — при этом используется меньшее число ускорителей и снижается потребление энергии, сделали вывод инженеры Apple.

«Большие языковые модели всё чаще используются в работе приложений, и повышение эффективности вывода может повлиять на вычислительные издержки и сократить задержку для пользователей. Благодаря новому подходу ReDrafter к интегрированному во фреймворк Nvidia TensorRT-LLM спекулятивному выполнению разработчики теперь могут быстрее генерировать токены на ускорителях Nvidia для своих приложений», — добавили в Apple.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Новая статья: ARC Raiders — выживает общительнейший. Рецензия 7 ч.
Почитать и покататься: Минцифры расширило список веб-ресурсов, доступных при отключении мобильного интернета 8 ч.
Google обязали заплатить €572 млн немецким сайтам сравнения цен Idealo и Producto за то, что поисковик мешал их работе 8 ч.
Microsoft прикрыла лазейку для бесплатной активации Windows посредством KMS38 8 ч.
Вдохновлённый S.T.A.L.K.E.R. кооперативный шутер Misery вернулся в Steam — разработчики уладили конфликт с GSC Game World 9 ч.
Амбициозный симулятор жизни Paralives не выйдет 8 декабря в раннем доступе Steam — объявлена новая дата релиза 10 ч.
Биткоин упал ниже $95 000 на фоне снижения акций криптобирж и технологических компаний 12 ч.
Google предложила Еврокомиссии поменять подход к рекламе вместо продажи активов 12 ч.
Глава Microsoft раскритиковал идею единой доминирующей ИИ-модели на замену человека 12 ч.
WhatsApp интегрируется со сторонними мессенджерами в Европе — все чаты в одном месте 12 ч.
Авоська для Apple iPhone за $230 была распродана за считанные часы 58 мин.
Доля трафика ChatGPT начинает сокращаться на фоне роста популярности Gemini 6 ч.
Retro Games выпустила THEA1200 — полноразмерную реплику культового Amiga 1200 за €190 6 ч.
Европейский Очень большой телескоп в Чили увеличил чувствительность в десять раз — удивительные находки не заставят себя ждать 8 ч.
Распахните небо! У вас накурено: выбросы CO₂ от сжигания ископаемого топилва установили новый рекорд 8 ч.
Asus представила GeForce RTX 5060 и RTX 5060 Ti Dual Evo с короткими печатными платами и сдвинутым разъёмом питания 10 ч.
MSI представила плату PRO B840M-P EVO WIFI6E PZ начального уровня с разъёмами питания на обратной стороне 10 ч.
Adata и MSI рассказали о первой потребительской четырёхранговой памяти — 128 Гбайт в одной планке CUDIMM DDR5-5600 11 ч.
Samsung повысила цены на память на 60 % с сентября — строительство ЦОД для ИИ душит поставки для обычных потребителей 12 ч.
Пузырь не страшен: JPMorgan прогнозирует, что затраты на ЦОД и ИИ-инфраструктуру составят $5 трлн, а спрос будет «астрономический» 14 ч.