Сегодня 27 ноября 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Nvidia помогла Apple повысить эффективность больших языковых моделей ИИ

Инженеры Apple рассказали о сотрудничестве с Nvidia, благодаря которому им удалось повысить производительность систем при генерации текста большими языковыми моделями искусственного интеллекта.

 Источник изображения: developer.nvidia.com

Источник изображения: developer.nvidia.com

В этом году Apple опубликовала исходный код своего решения Recurrent Drafter (ReDrafter) — это новый метод генерации текста с помощью больших языковых моделей. Он отличается высокой скоростью работы, объединяя две технологии: лучевой поиск и динамическое древо внимания. Исследовательский проект Apple показал убедительные результаты, но при развёртывании ReDrafter технология была интегрирована в систему Nvidia TensorRT-LLM — этот инструмент позволяет быстрее запускать большие языковые модели на ускорителях Nvidia.

Как показали замеры производительности, при запуске больших языковых моделей с десятками миллиардов параметров с использованием фреймворка Nvidia TensorRT-LLM и ReDrafter скорость генерации токенов увеличилась в 2,7 раза. Таким образом, технология позволяет сократить задержку между вводом запроса пользователем и получением ответа от модели — при этом используется меньшее число ускорителей и снижается потребление энергии, сделали вывод инженеры Apple.

«Большие языковые модели всё чаще используются в работе приложений, и повышение эффективности вывода может повлиять на вычислительные издержки и сократить задержку для пользователей. Благодаря новому подходу ReDrafter к интегрированному во фреймворк Nvidia TensorRT-LLM спекулятивному выполнению разработчики теперь могут быстрее генерировать токены на ускорителях Nvidia для своих приложений», — добавили в Apple.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Необходимое зло: Ubisoft объяснила, зачем добавила в Assassin's Creed Shadows микротранзакции 4 мин.
Paradox взяла на себя вину за провал Vampire: The Masquerade — Bloodlines 2 и списала больше половины бюджета игры 8 мин.
Создатели The Alters объявили дату выхода крупного обновления — в нём переработают сохранения, добавят фоторежим и многое другое 2 ч.
Opera добавила в ИИ-браузер Neon минутные глубокие исследования и интеграцию с «Google Документами» 5 ч.
CD Projekt подтвердила, что не покажет The Witcher 4 на The Game Awards 2025 5 ч.
Google начала внедрять Gemini в «Google Карты» для всех режимов навигации 10 ч.
Cyberpunk 2077 стала главным источником дохода CD Projekt — компания отчиталась об ударных результатах за третий квартал 16 ч.
«Новый год пришёл раньше времени»: Sony включила в декабрьскую линейку PS Plus сразу пять игр, в том числе Lego Horizon Adventures и Killing Floor 3 18 ч.
Продажи Cyberpunk 2077 превысили 35 миллионов копий, а команда Cyberpunk 2 растёт не по дням, а по часам 18 ч.
ЕС откажется от сканирования переписок — ИТ-гиганты выиграли битву за конфиденциальность пользователей 19 ч.
HSBC: OpenAI придётся где-то найти ещё $207 млрд к 2030 году для достижения поставленных целей 2 ч.
Нетоксичное и дармовое: учёные создали пьезоэлектрический материал для выработки электричества в движении 2 ч.
Китайские разработчики отправляют ИИ учиться за границу — там есть санкционные ускорители Nvidia 2 ч.
Celestica выпустила JBOD-массив SD6300 на 108 накопителей для ИИ-платформ 2 ч.
Человекоподобные роботы UBTech начнут служить на границе Китая и Вьетнама 3 ч.
Почти 5 Гбайт на квадратный миллиметр: Kioxia и SanDisk готовят флеш-память рекордной плотности 4 ч.
Атмосфера Марса вовсю искрит, выяснил марсоход NASA Perseverance 4 ч.
Дизайнер превратил кроссовки Nike в полноценную ретро-консоль с играми SNES 4 ч.
Intel охотится за инженерами TSMC в Аризоне — зарплаты обещают на 20–30 % выше 5 ч.
Basis Dynamix стала основой инфраструктуры первого отечественного ядра 4G-сети оператора Т2 5 ч.