Сегодня 19 июня 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Nvidia помогла Apple повысить эффективность больших языковых моделей ИИ

Инженеры Apple рассказали о сотрудничестве с Nvidia, благодаря которому им удалось повысить производительность систем при генерации текста большими языковыми моделями искусственного интеллекта.

 Источник изображения: developer.nvidia.com

Источник изображения: developer.nvidia.com

В этом году Apple опубликовала исходный код своего решения Recurrent Drafter (ReDrafter) — это новый метод генерации текста с помощью больших языковых моделей. Он отличается высокой скоростью работы, объединяя две технологии: лучевой поиск и динамическое древо внимания. Исследовательский проект Apple показал убедительные результаты, но при развёртывании ReDrafter технология была интегрирована в систему Nvidia TensorRT-LLM — этот инструмент позволяет быстрее запускать большие языковые модели на ускорителях Nvidia.

Как показали замеры производительности, при запуске больших языковых моделей с десятками миллиардов параметров с использованием фреймворка Nvidia TensorRT-LLM и ReDrafter скорость генерации токенов увеличилась в 2,7 раза. Таким образом, технология позволяет сократить задержку между вводом запроса пользователем и получением ответа от модели — при этом используется меньшее число ускорителей и снижается потребление энергии, сделали вывод инженеры Apple.

«Большие языковые модели всё чаще используются в работе приложений, и повышение эффективности вывода может повлиять на вычислительные издержки и сократить задержку для пользователей. Благодаря новому подходу ReDrafter к интегрированному во фреймворк Nvidia TensorRT-LLM спекулятивному выполнению разработчики теперь могут быстрее генерировать токены на ускорителях Nvidia для своих приложений», — добавили в Apple.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Получившие ранний доступ к Mythos клиенты Anthropic сохранили его даже после недавней блокировки 19 мин.
Белый дом работает с Anthropic над созданием правил безопасного применения ИИ-моделей 3 ч.
В российском Epic Games Store стартовала раздача Citizen Sleeper — текстовой RPG на обломках межпланетного капитализма 10 ч.
Duke Nukem 3D, Blood, Shadow Warrior и не только: российский разработчик портировал в браузер классические шутеры на движке Build Engine 13 ч.
Epic Games пообещала, что ИИ в Unreal Engine 6 «изменит создание игр» и «сократит рутину» у разработчиков 14 ч.
Adobe добавила в Photoshop и Premiere ИИ-помощников 14 ч.
Журналисты нашли подтверждения, что новой студии создателя Yakuza больше не существует 15 ч.
В ОАЭ запретили соцсети для детей до 15 лет и ввели проверку возраста 16 ч.
«Крёстный отец ИИ» назвал xAI провалом и пригрозил взрывом «пузыря ИИ» 16 ч.
Новый вариант CAPTCHA от Google требует от пользователей махать руками перед компьютером 17 ч.
Учёные создали настолько чёрную автомобильную краску, что она воспринимается как дыра в реальности 14 мин.
Valve представила три сценария сроков доставки Steam Controller — вплоть до 2027 года 16 мин.
Власти США подозревают, что передовое EUV-оборудование ASML для производства чипов могло попасть в Китай 40 мин.
Исполнительным вице-президентом Intel Foundry назначен бывший глава SK hynix 4 ч.
Акции SanDisk и Micron резко выросли после того, как Apple пообещала поднять цены 8 ч.
Новая статья: Обзор игрового ноутбука MAIBENBEN Typhoon X16C: рабочий класс, версия 2026 9 ч.
Lenovo выпустила доступный игровой QHD-монитор с частотой обновления 275 Гц за $130 9 ч.
Муравейник Шрёдингера: физики нашли квантовую запутанность в сантиметровом кристалле странного металла 9 ч.
Акции Intel выросли на 10 % на фоне публикации Трампа о сделке по производству чипов для Apple 9 ч.
ViewSonic выпустила 23,8-дюймовый 4K-монитор IPS с частотой 160 Гц для геймеров 12 ч.