Сегодня 23 июня 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Nvidia выпустила Nemotron 3 Super 120B — открытую LLM для ИИ-агентов с пятикратным приростом скорости

Компания Nvidia выпустила Nemotron 3 Super — открытую ИИ-модель Mixture-of-Experts (MoE) с поддержкой 120 млрд общих параметров и 12 млрд активных параметров, предназначенную для задач агентного ИИ. Модель использует гибридную архитектуру Mamba-Transformer.

 Источник изображений: Nvidia

Источник изображений: Nvidia

По словам Nvidia, Nemotron 3 Super — это первая модель в серии Nemotron 3, которая объединяет парадигму LatentMoE, слои Multi-Token Prediction и предварительное обучение NVFP4. Компания заявляет, что этот стек повышает точность и ускоряет инференс, а гибридная архитектура Nemotron 3 Super обеспечивает до пяти раз более высокую пропускную способность и до двух раз более высокую точность по сравнению с предыдущей моделью Nemotron Super. Компания также отмечает поддержку контекстного окна в 1 млн токенов, что позволяет агентным ИИ сохранять в памяти полное состояние рабочего процесса и предотвращает отклонение от цели.

Nemotron 3 Super подходит для решения сложных задач внутри многоагентной системы. Например, для генерации и отладки кода без сегментации документов, для финансового анализа, где можно загружать в память тысячи страниц отчётов.

Модель была обучена на синтетических данных, сгенерированных с использованием моделей логического мышления. Nvidia публикует полную методологию, включая более 10 триллионов токенов наборов данных до и после обучения, 15 сред обучения для обучения с подкреплением и рецепты оценки. Исследователи могут дополнительно использовать платформу Nvidia NeMo для тонкой настройки модели или создания собственной.

Nemotron 3 Super поддерживает работу на платформе Nvidia Blackwell в формате NVFP4. Это снижает требования к памяти и ускоряет вывод в четыре раза по сравнению с FP8 на Nvidia Hopper без потери точности.

Модель уже доступна для использования. Доступ к Nemotron 3 Super можно получить через build.nvidia.com, Hugging Face, OpenRouter и Perplexity, а среди партнёров по облачным сервисам и инференсу указаны Google Cloud Vertex AI, Oracle Cloud Infrastructure, CoreWeave, Together AI, Baseten, Cloudflare, DeepInfra, Fireworks AI и Modal. Модель также представлена в виде микросервиса Nvidia NIM для развёртывания в локальной среде и облаке.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Cloudflare и крупнейшие разработчики браузеров научат сайты отличать людей от ботов 26 мин.
Анонсирован Give Us A Sign — кооперативный хоррор про поиск призраков на чересчур «живых» локациях 58 мин.
OpenAI запустила инициативу Patch the Planet, чтобы помочь разработчикам открытого ПО в поиске ошибок 2 ч.
Блогер показал 25 минут геймплея мультиплеерного мода для The Last of Us Part II — игроки в восторге 3 ч.
«Такого никто никогда не видел»: загадочный хоррор OD будет «максимально страшным», но Кодзима придумал особую систему для пугливых игроков 3 ч.
Китайские ИИ-модели скоро станут закрытыми, предупредили эксперты 4 ч.
«Фора измеряется месяцами»: разведка Five Eyes предупредила о стремительном росте ИИ-угроз для Запада 7 ч.
AMD выпустила драйвер с поддержкой масштабирования FSR 4.1 на видеокартах Radeon RX 7000 15 ч.
Эксперт Digital Foundry прояснил тайну «вампирского» колеса обозрения из GTA VI 15 ч.
Календарь релизов 22–28 июня: Star Fox, Empulse, Dark Scrolls и Dead or Alive 6 Last Round 16 ч.
Micron и Anthropic анонсировали стратегическое партнёрство для масштабирования ИИ-инфраструктуры нового поколения 8 мин.
В Японии появился гибридный квантово-классический суперкомпьютер Roquo производительностью 19,8 Пфлопс 16 мин.
Oracle уволила каждого седьмого сотрудника за прошлый финансовый год — больше, чем ожидалось 20 мин.
Nvidia пообещала сделать человекоподобных роботов безопаснее для людей 58 мин.
Anthropic договорилась с Micron об инвестициях и гарантированных поставках памяти 2 ч.
Valve: производители памяти больше не торгуются — они просто выставляют условия 2 ч.
Возвращение злополучного Boeing Starliner к полётам задерживается — на год или даже больше 2 ч.
TerraMaster представила NAS-сервер F4-425 Pro на TOS 7 — первой AI-native операционной системой для сетевых хранилищ 3 ч.
Капитализация SpaceX рухнула на $400 млрд, а компания хочет привлечь $20 млрд через облигации 4 ч.
Reflection AI заплатит SpaceX до $6,3 млрд за аренду ЦОД Colossus 2 до 2029 года 5 ч.