Сегодня 05 июня 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Nvidia выпустила ИИ-модель Nemotron 3 Nano 30B с открытыми весами и большущим контекстным окном

Компания Nvidia сообщила подробности о новом семействе моделей Nemotron 3 с открытыми весами, разработанном, в том числе, для создания специализированного агентного ИИ нового поколения.

 Источник изображения: Nvidia

Источник изображения: Nvidia

Первый представитель семейства — модель Nemotron 3 Nano 30B с открытыми весами, общим количеством параметров в 30 млрд и 3 млрд активных параметров. Модель основана на гибридной архитектуре Mamba-Transformer, сочетающей «смесь экспертов» (MoE), обучение с подкреплением (RL) в интерактивных средах и собственное контекстное окно в 1 млн токенов, обеспечивающее высокопроизводительное и долгосрочное рассуждение для многоагентных приложений.

Как сообщает VideoCardz со ссылкой на публикацию на Hugging Face, маршрутизатор активирует 6 из 128 экспертов за один проход. Nvidia сообщила, что для запуска модели может использоваться система DGX Spark, а также ускорители H100 и B200.

В числе новшеств Nemotron 3, напрямую отвечающих потребностям агентных систем, указаны:

  • гибридная архитектура Mamba-Transformer MoE для повышения эффективности тестирования и долгосрочного рассуждения.
  • многосредовое обучение с подкреплением, разработанное на основе реальных агентных задач.
  • контекстное окно на 1 млн токенов с поддержкой глубокого рассуждения по нескольким документам и долговременной памяти агентов. Благодаря этому обеспечивается устойчивое логическое мышление в больших кодовых базах, длинных документах, продолжительных диалогах и агрегированном извлеченном контенте. Вместо использования фрагментированных эвристических алгоритмов сегментации, агенты могут хранить целые наборы доказательств, буферы истории и многоэтапные планы в одном контекстном окне.
  • открытый, прозрачный конвейер обучения, включающий данные, веса и рецепты.

Семейство MoE Nemotron 3 включает три модели:

  • Nemotron 3 Nano — компактная модель с 30 млрд параметров, активирующая до 3 млрд параметров одновременно для целевых высокоэффективных задач;
  • Nemotron 3 Super — высокоточная модель рассуждений с приблизительно 100 млрд параметров и до 10 млрд активных параметров на токен, предназначенная для многоагентных приложений;
  • Nemotron 3 Ultra — крупная модель рассуждений.

Nemotron 3 Nano с готовыми к использованию руководствами доступна уже сейчас. Nemotron 3Super и Ultra выйдут немного позже.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Полёты на вивернах, пинбол и переработка блокад: для Crimson Desert вышло крупное обновление 1.10.00 53 мин.
Интернет не для людей — автоматизированный трафик ботов в сети впервые в истории превысил человеческий 57 мин.
Reddit захлестнул спам с сомнительными медицинскими процедурами, который транслируется в ИИ-поиск Google 2 ч.
У биткоина выдалась худшая неделя с февраля — средства инвесторов перетекают в другие активы 3 ч.
В 2026 году на ПК выйдет научно-фантастический хоррор-шутер Derelikt, который выглядит как потерянная игра с PS1 3 ч.
Google завершила обновление значков приложений Workspace в рамках концепции «Эра Gemini» 5 ч.
Новая статья: ОСновной расклад: гид по российским Linux-дистрибутивам 11 ч.
OpenAI прокачала память ChatGPT — вскоре бот сможет помнить разное и для бесплатных пользователей 12 ч.
Отправление задерживается: безумный платформер про неподвластный гравитации поезд Denshattack! не выйдет 17 июня 16 ч.
AMD не планирует наделять поддержкой FSR 4.1 встроенную графику RDNA 3.5 17 ч.
Репортаж со стенда G.Skill на Computex 2026: модули DDR5 будущего с очень низкими задержками, высокой скоростью и объёмом до 512 Гбайт 18 мин.
Репортаж со стенда 1stPlayer на Computex 2026: панорамные корпуса, СЖО и кулеры с экранами и компактные, но мощные блоки питания 42 мин.
В российских поездах дальнего следования появится спутниковый интернет — но не уточняется, когда 43 мин.
Китайцы научили квантовый компьютер работать с большими данными — он мгновенно впитает всё 55 мин.
На площадке Саяно-Шушенской ГЭС в Хакасии появится ЦОД от «РусГидро» 2 ч.
Valve заявила о готовности выпустить Steam Machine и Steam Frame до конца лета 2 ч.
США заподозрили существование лазеек для выпуска китайских чипов на передовых техпроцессах TSMC и Samsung 2 ч.
Geometric Future представила на Computex 2026 огромные корпуса, яркие блоки питания и новые СЖО 2 ч.
«Билайн» присоединится к проекту трансъевразийской оптоволоконной магистрали TEA NEXT 2 ч.
«Сбер» переведёт обучение ИИ на фотонику — представлен первый в России оптический чип 2 ч.