Сегодня 29 января 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Nvidia помогла Apple повысить эффективность больших языковых моделей ИИ

Инженеры Apple рассказали о сотрудничестве с Nvidia, благодаря которому им удалось повысить производительность систем при генерации текста большими языковыми моделями искусственного интеллекта.

 Источник изображения: developer.nvidia.com

Источник изображения: developer.nvidia.com

В этом году Apple опубликовала исходный код своего решения Recurrent Drafter (ReDrafter) — это новый метод генерации текста с помощью больших языковых моделей. Он отличается высокой скоростью работы, объединяя две технологии: лучевой поиск и динамическое древо внимания. Исследовательский проект Apple показал убедительные результаты, но при развёртывании ReDrafter технология была интегрирована в систему Nvidia TensorRT-LLM — этот инструмент позволяет быстрее запускать большие языковые модели на ускорителях Nvidia.

Как показали замеры производительности, при запуске больших языковых моделей с десятками миллиардов параметров с использованием фреймворка Nvidia TensorRT-LLM и ReDrafter скорость генерации токенов увеличилась в 2,7 раза. Таким образом, технология позволяет сократить задержку между вводом запроса пользователем и получением ответа от модели — при этом используется меньшее число ускорителей и снижается потребление энергии, сделали вывод инженеры Apple.

«Большие языковые модели всё чаще используются в работе приложений, и повышение эффективности вывода может повлиять на вычислительные издержки и сократить задержку для пользователей. Благодаря новому подходу ReDrafter к интегрированному во фреймворк Nvidia TensorRT-LLM спекулятивному выполнению разработчики теперь могут быстрее генерировать токены на ускорителях Nvidia для своих приложений», — добавили в Apple.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Ветераны разработки Diablo анонсировали Darkhaven — мрачную экшен-RPG с динамичным миром и полной свободой передвижения 28 мин.
Исследователи предупредили об опасности ИИ-моделей с открытым исходным кодом 35 мин.
Microsoft превысила прогнозы Уолл-стрит, но её акции упали из-за замедления роста облачных сервисов 2 ч.
На пути к суперинтеллекту: Цукерберг анонсировал ИИ-шопинг, новые модели и другие функции 2 ч.
МТС Exolve представил новое поколение голосовых ИИ-роботов для бизнеса 3 ч.
Олдскульный боевик Scott Pilgrim EX от создателей Teenage Mutant Ninja Turtles: Shredder’s Revenge не заставит долго ждать — дата выхода и новый трейлер 5 ч.
Закрыть ворота, открыть ворота: бесплатный шутер Highguard от бывших разработчиков Titanfall 2 стал недоступен в российском Steam, но ненадолго 5 ч.
Meta стала больше зарабатывать на рекламе и нарастила аудиторию — акции подскочили на 10 % 6 ч.
Сюжетные дополнения к Vampire: The Masquerade — Bloodlines 2 могут выйти раньше обещанного — Paradox представила план развития игры на 2026 год 7 ч.
Spotify выплатила музыкантам $11 млрд в 2025 года — это новый рекорд 8 ч.
ИИ и облака вместо телефонов: Telefónica превратит десятки «медных» АТС в периферийные ЦОД 5 мин.
AMD запустила продажи Ryzen 7 9850X3D по цене $499 — Ryzen 7 7800X3D и 9800X3D подешевели 18 мин.
Астрономы разгадали тайну светящихся «маленьких красных точек» на заре Вселенной 25 мин.
Xiaomi представила смартфон Redmi Turbo 5 Max с батареей на 9000 мА·ч и чипом Dimensity 9500s 29 мин.
Samsung представила PM9E1 — самый компактный 4-Тбайт SSD с PCIe 5.0 39 мин.
Флагман Nothing Phone (4) в этом году не выйдет — Карл Пей объяснил причины и рассказал, что будет вместо него 47 мин.
DJI представила лёгкий стабилизатор RS 5 для камер весом до трёх килограмм 54 мин.
Китайский конкурент NVIDIA H20 — Alibaba представила ИИ-ускоритель Zhenwu 810E с 96 Гбайт HBM2e 2 ч.
Представлен Anbernic RG G01 — геймпад со встроенным датчиком пульса и дисплеем 3 ч.
Беспилотное такси Waymo сбило ребёнка возле школы, несмотря на экстренное торможение 3 ч.