Сегодня 20 ноября 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Nvidia помогла Apple повысить эффективность больших языковых моделей ИИ

Инженеры Apple рассказали о сотрудничестве с Nvidia, благодаря которому им удалось повысить производительность систем при генерации текста большими языковыми моделями искусственного интеллекта.

 Источник изображения: developer.nvidia.com

Источник изображения: developer.nvidia.com

В этом году Apple опубликовала исходный код своего решения Recurrent Drafter (ReDrafter) — это новый метод генерации текста с помощью больших языковых моделей. Он отличается высокой скоростью работы, объединяя две технологии: лучевой поиск и динамическое древо внимания. Исследовательский проект Apple показал убедительные результаты, но при развёртывании ReDrafter технология была интегрирована в систему Nvidia TensorRT-LLM — этот инструмент позволяет быстрее запускать большие языковые модели на ускорителях Nvidia.

Как показали замеры производительности, при запуске больших языковых моделей с десятками миллиардов параметров с использованием фреймворка Nvidia TensorRT-LLM и ReDrafter скорость генерации токенов увеличилась в 2,7 раза. Таким образом, технология позволяет сократить задержку между вводом запроса пользователем и получением ответа от модели — при этом используется меньшее число ускорителей и снижается потребление энергии, сделали вывод инженеры Apple.

«Большие языковые модели всё чаще используются в работе приложений, и повышение эффективности вывода может повлиять на вычислительные издержки и сократить задержку для пользователей. Благодаря новому подходу ReDrafter к интегрированному во фреймворк Nvidia TensorRT-LLM спекулятивному выполнению разработчики теперь могут быстрее генерировать токены на ускорителях Nvidia для своих приложений», — добавили в Apple.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Windows 1.0 вышла ровно 40 лет назад — ей хватало 256 Кбайт ОЗУ и одной дискеты 2 мин.
Spotify анонсировала функцию SongDNA — она расскажет о сэмплах в треке и каверах на него 9 мин.
«Открыть ворота»: грандиозная кампания «Империи бессмертных» скоро станет доступна владельцам Total War: Warhammer и Total War: Warhammer II 25 мин.
Капитализация криптовалютного рынка рухнула на триллион долларов из-за падения биткоина 49 мин.
Nvidia латает последствия октябрьского апдейта Windows 11 — драйвер GeForce Hotfix 581.94 уберёт просадки FPS 2 ч.
VK похвалилась ростом выручки на 10 % — наибольший рост показали «VK Видео» и «VK Клипы» 2 ч.
ИИ стал чаще ходить на российские сайты — поисковый трафик от нейросетей вырос в девять раз 3 ч.
Амбициозный боевик Peter Jackson's King Kong: The Official Game of the Movie в честь 20-летия получил масштабный фанатский патч 5 ч.
Cloud.ru запустил Evolution AI Factory в коммерческую эксплуатацию по доступным ценам 5 ч.
Telegram получил большое обновление: прямые эфиры, регулярные сообщения и аукционы подарков 5 ч.
Intel подтвердила, что представит процессоры Core Ultra 300 на выставке CES 2026 в январе 4 мин.
Nokia меняет стратегию развития, сделав ставку на ИИ, ЦОД и 6G 11 мин.
После 10 месяцев работы на конвейере BMW у человекоподобных роботов Figure 02 начали отваливаться руки 17 мин.
Nvidia зарабатывает $4,4 млн на сотрудника — Netflix и Apple тоже в топе 48 мин.
Brookfield, NVIDIA и партнёры направят $100 млрд на развитие ИИ-инфраструктуры и энергетики 2 ч.
Sunday представила похожего на лего-человечка робота Memo — он умеет загружать посудомойку и не только 2 ч.
PCIe 5.0, 14,5 Гбайт/с, до 30,72 Тбайт: Phison представила TLC SSD серий Pascari X201 и D201 3 ч.
UBTech удесятерит выпуск гуманоидных роботов в 2026-м — и хочет снизить их себестоимость до $20 000 3 ч.
Lenovo убеждена, что справится с взлетевшими ценами на память лучше конкурентов 4 ч.
Люди полетят как птицы: навигацию без GPS по магнитному полю Земли поможет освоить квантовый компас 4 ч.