Сегодня 20 марта 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Hardware

Nvidia вступит в битву за инференс: готовится чип на технологиях Groq для OpenAI и ИИ-агентов

Nvidia намерена представить новый процессор, специально разработанный для того, чтобы помочь OpenAI и другим клиентам создавать более быстрые и эффективные приложения на основе обученных моделей искусственного интеллекта, сообщает The Wall Street Journal. Ранее продукты компании были ориентированы в первую очередь на обучение ИИ.

 Источник изображений: nvidia.com

Источник изображений: nvidia.com

Nvidia ведёт разработку новой системы для инференса — запуска моделей ИИ, когда они отвечают на запросы пользователей. Новая платформа, которую компания представит на конференции для разработчиков Nvidia GTC в марте, будет включать чип, разработанный стартапом Groq. Конкуренция в этой области сейчас ожесточается — Google и Amazon уже создали собственные ускорители, способные сравниться с продукцией Nvidia; ситуацию усугубляет взрывной рост популярности технологий вайб-кодинга — написания программных продуктов системами ИИ по текстовым запросам пользователей.

Одним из крупнейших клиентов на новый процессор уже согласилась стать OpenAI, сообщают источники издания, и это крупная победа для Nvidia. Накануне разработчик ChatGPT намекнул на этот проект, объявив о заключении крупной сделки по приобретению «выделенных мощностей для инференса» у Nvidia, а также об инвестициях в размере $30 млрд от «зелёного» производителя. Компания также заключила соглашение на предмет использования ИИ-ускорителей Amazon Trainium.

Nvidia доминирует на рынке графических процессоров (GPU) — чипов, способных одновременно выполнять миллиарды простых задач. GPU семейств Hopper, Blackwell и Rubin считаются лучшими для обучения ИИ, и здесь доля компании на мировом рынке, по оценкам аналитиков, составляет не менее 90 %. Глава компании Дженсен Хуанг (Jensen Huang) утверждает, что продукция Nvidia одинаково хорошо подходит и для обучения, и для инференса. Однако разработчики ИИ-агентов и других приложений на основе ИИ начинают понимать, что по сравнению с разработками конкурентов чипы Nvidia слишком дороги, слишком энергозатратны и не так хорошо подходят для запуска уже обученных моделей.

В январе OpenAI заключила со стартапом Cerebras соглашение о партнёрстве — компания предложила ориентированный на инференс чип, который, по её утверждению, работает быстрее ускорителей Nvidia. OpenAI начала переговоры с Cerebras ещё минувшей осенью, когда инженеры компании запросили более быстрое оборудование для приложений агентного написания кода. Nvidia же в минувшем году заключила со стартапом Groq сделку на $20 млрд, лицензировав её технологии и приняв на работу топ-менеджеров компании, включая её основателя. Groq разработала чипы на принципиально иной архитектуре — они включают «блоки языковой обработки», отличающиеся высокой эффективностью в задачах инференса. О своих намерениях использовать эти активы Nvidia пока умалчивает.

Одним из наиболее востребованных направлений в сфере ИИ являются задачи, связанные с генерацией программного кода. Лидером здесь считается сервис Anthropic Claude Code, который работает в облачных инфраструктурах Amazon и Google, но активно развивается и служба OpenAI Codex, которая будет работать на новой инфраструктуре Nvidia. Nvidia также заключила соглашение с компанией Meta об инференсе ИИ-систем для таргетирования рекламы — и эта задача эффективнее всего решается на центральных процессорах.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Саудовский фонд купит разработчика Mobile Legends: Bang Bang за $6 миллиардов — владелец TikTok устал от игр и хочет сосредоточиться на ИИ 23 мин.
Crimson Desert не запускается на видеокартах Intel Arc — издатель призвал оформить возврат средств 2 ч.
Alibaba избавилась от трети сотрудников за прошлый год и сосредоточилась на ИИ 2 ч.
В «Google Сообщения» добавили долгожданную возможность транслировать свою геопозицию 3 ч.
AMD выпустила FSR 4.1 с улучшенной детализацией и плавностью изображения — но только для Radeon RX 9000 4 ч.
AMD выпустила драйвер с поддержкой Crimson Desert и Death Stranding 2: On the Beach 4 ч.
Nvidia раскрыла, как DLSS 5 «додумывает» картинку — только 2D-кадр и векторы движения 5 ч.
Энтузиасты выпустили бесплатную браузерную версию Counter-Strike 1.6 — «та самая олдскульная контра» без рекламы и смс 5 ч.
В новом финансовом отчёте CD Projekt углядели указание на секретный аддон для The Witcher 3: Wild Hunt 6 ч.
В «Яндекс Погоде» теперь можно поговорить с ИИ 6 ч.
Российский энтузиаст создал Telegram-пейджер — он работает даже с отключённым мобильным интернетом 2 ч.
Intel со дня на день поднимет цены на потребительские процессоры Core и Core Ultra на 10 % 2 ч.
Alibaba похвалилась выпуском 500 000 ИИ-ускорителей и признала, что они медленнее аналогов Nvidia 2 ч.
Официальные изображения Samsung Galaxy A57 и A37 утекли в Сеть — анонс ожидается на следующей неделе 3 ч.
Intel объявила, когда представит видеокарты на «большом Battlemage» — но геймерам радоваться рано 3 ч.
1 ГВт в подарок: Google посадит на «диету» свои ИИ ЦОД во время пиковых нагрузок на энергосети 4 ч.
Blue Origin подала заявку на запуск более 51 тыс. спутников-ЦОД 4 ч.
В Испании разработали «двумерные» солнечные панели — идеальные для фасадов зданий 4 ч.
Китай выбрал астероид, по которому вмажет космическим зондом — строго в научных целях 5 ч.
Fujikura утроит выпуск оптоволокна в Японии на фоне спроса со стороны ИИ ЦОД 5 ч.