Сегодня 20 марта 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Hardware

Nvidia вступит в битву за инференс: готовится чип на технологиях Groq для OpenAI и ИИ-агентов

Nvidia намерена представить новый процессор, специально разработанный для того, чтобы помочь OpenAI и другим клиентам создавать более быстрые и эффективные приложения на основе обученных моделей искусственного интеллекта, сообщает The Wall Street Journal. Ранее продукты компании были ориентированы в первую очередь на обучение ИИ.

 Источник изображений: nvidia.com

Источник изображений: nvidia.com

Nvidia ведёт разработку новой системы для инференса — запуска моделей ИИ, когда они отвечают на запросы пользователей. Новая платформа, которую компания представит на конференции для разработчиков Nvidia GTC в марте, будет включать чип, разработанный стартапом Groq. Конкуренция в этой области сейчас ожесточается — Google и Amazon уже создали собственные ускорители, способные сравниться с продукцией Nvidia; ситуацию усугубляет взрывной рост популярности технологий вайб-кодинга — написания программных продуктов системами ИИ по текстовым запросам пользователей.

Одним из крупнейших клиентов на новый процессор уже согласилась стать OpenAI, сообщают источники издания, и это крупная победа для Nvidia. Накануне разработчик ChatGPT намекнул на этот проект, объявив о заключении крупной сделки по приобретению «выделенных мощностей для инференса» у Nvidia, а также об инвестициях в размере $30 млрд от «зелёного» производителя. Компания также заключила соглашение на предмет использования ИИ-ускорителей Amazon Trainium.

Nvidia доминирует на рынке графических процессоров (GPU) — чипов, способных одновременно выполнять миллиарды простых задач. GPU семейств Hopper, Blackwell и Rubin считаются лучшими для обучения ИИ, и здесь доля компании на мировом рынке, по оценкам аналитиков, составляет не менее 90 %. Глава компании Дженсен Хуанг (Jensen Huang) утверждает, что продукция Nvidia одинаково хорошо подходит и для обучения, и для инференса. Однако разработчики ИИ-агентов и других приложений на основе ИИ начинают понимать, что по сравнению с разработками конкурентов чипы Nvidia слишком дороги, слишком энергозатратны и не так хорошо подходят для запуска уже обученных моделей.

В январе OpenAI заключила со стартапом Cerebras соглашение о партнёрстве — компания предложила ориентированный на инференс чип, который, по её утверждению, работает быстрее ускорителей Nvidia. OpenAI начала переговоры с Cerebras ещё минувшей осенью, когда инженеры компании запросили более быстрое оборудование для приложений агентного написания кода. Nvidia же в минувшем году заключила со стартапом Groq сделку на $20 млрд, лицензировав её технологии и приняв на работу топ-менеджеров компании, включая её основателя. Groq разработала чипы на принципиально иной архитектуре — они включают «блоки языковой обработки», отличающиеся высокой эффективностью в задачах инференса. О своих намерениях использовать эти активы Nvidia пока умалчивает.

Одним из наиболее востребованных направлений в сфере ИИ являются задачи, связанные с генерацией программного кода. Лидером здесь считается сервис Anthropic Claude Code, который работает в облачных инфраструктурах Amazon и Google, но активно развивается и служба OpenAI Codex, которая будет работать на новой инфраструктуре Nvidia. Nvidia также заключила соглашение с компанией Meta об инференсе ИИ-систем для таргетирования рекламы — и эта задача эффективнее всего решается на центральных процессорах.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Продажи Crimson Desert в день релиза превысили два миллиона копий — Pearl Abyss пообещала оперативно улучшать игру 57 мин.
Мартовское обновление Windows 11 сломало вход в Teams и OneDrive, призналась Microsoft 2 ч.
Саудовский фонд купит разработчика Mobile Legends: Bang Bang за $6 миллиардов — владелец TikTok устал от игр и хочет сосредоточиться на ИИ 3 ч.
Crimson Desert не запускается на видеокартах Intel Arc — издатель призвал оформить возврат средств 3 ч.
Alibaba избавилась от трети сотрудников за прошлый год и сосредоточилась на ИИ 4 ч.
В «Google Сообщения» добавили долгожданную возможность транслировать свою геопозицию 5 ч.
AMD выпустила FSR 4.1 с улучшенной детализацией и плавностью изображения — но только для Radeon RX 9000 6 ч.
AMD выпустила драйвер с поддержкой Crimson Desert и Death Stranding 2: On the Beach 6 ч.
Энтузиасты выпустили бесплатную браузерную версию Counter-Strike 1.6 — «та самая олдскульная контра» без рекламы и смс 7 ч.
В новом финансовом отчёте CD Projekt углядели указание на секретный аддон для The Witcher 3: Wild Hunt 8 ч.
Huawei представила смартфон Mate 80 Pro Max Wind Edition с сильно выступающими камерами и вентилятором 2 мин.
Доступный MacBook Neo стал хитом: Тим Кук похвастался лучшим запуском новых Mac в истории 6 мин.
Ракету SLS с кораблём Orion вернули на стартовую площадку в преддверии исторического облёта Луны людьми 15 мин.
Gigabyte выпустила аскетичную матплату Z890 D Plus на флагманском чипсете Intel Z890 33 мин.
Этот будильник сложно возненавидеть — Balmuda The Clock вовсю старается сделать засыпание и пробуждение приятными 37 мин.
Сооснователь Supermicro арестован за контрабанду в Китай ИИ-серверов на $2,5 млрд 40 мин.
«Мы все ещё ищем его»: NASA потеряло марсианский зонд MAVEN, но не теряет надежду его вернуть 2 ч.
Amazon задумала вернуться к выпуску смартфонов спустя дюжину лет после провала Fire Phone 2 ч.
Российский энтузиаст создал Telegram-пейджер — он работает даже с отключённым мобильным интернетом 3 ч.
Intel со дня на день поднимет цены на потребительские процессоры Core и Core Ultra на 10 % 4 ч.