Сегодня 04 июня 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Hardware

OpenAI усомнилась в эффективности ускорителей Nvidia для инференса и всё активнее ищет им альтернативу

Принято считать, что OpenAI и Nvidia являются главными выгодоприобретателями бума искусственного интеллекта, и они поддерживают прочные партнёрские отношения, которые должны быть подкреплены сделкой на сумму $100 млрд. Источники при этом отмечают, что эффективность ускорителей Nvidia в инференсе может не устраивать OpenAI, поэтому она стремится найти им подходящую альтернативу.

 Источник изображения: Nvidia

Источник изображения: Nvidia

Об этом по своим каналам удалось выяснить Reuters, хотя публично OpenAI и Nvidia продолжают выражать крайнюю степень взаимной лояльности. Если верить данным источника, OpenAI хотела бы до 10 % ускорителей в своей вычислительной инфраструктуре заменить на решения сторонних поставщиков, которые лучше проявляли бы себя в задачах инференса — то есть, эффективнее бы работали с уже обученными большими языковыми моделями.

OpenAI даже хотела договориться с Cerebras и Groq о поставках разрабатываемых этими стартапами чипов, но Nvidia решила сработать на опережение, купив в прошлом году последний за $20 млрд. До этого Groq вела переговоры с другими инвесторами о вложении в свой капитал до $14 млрд, но Nvidia предложила больше, обеспечив при этом весьма специфическую структуру сделки. По её условиям, Groq сохранила возможность лицензирования своих разработок другим компаниям, но фактически Nvidia перевела в свой штат основных разработчиков ускорителей из Groq. Фактически, остальным компаниям Groq теперь может предложить только программное обеспечение для облачных систем. Одновременно возникают вопросы по целесообразности сделки, в рамках которой Nvidia предложила направить в капитал OpenAI до $100 млрд. Пока стороны отрицают наличие проблем в этой сфере, хотя Nvidia и подчёркивает, что её обязательства не носят строгого характера.

Сделку с Cerebras компании OpenAI заключить удалось, теперь вторая будет покупать у первой так называемые «царь-ускорители», которые неплохо проявляют себя в задачах инференса. Проблема OpenAI до сих пор заключалась в том, что она сильно зависит от ускорителей Nvidia и AMD, которые используют внешнюю, пусть и очень быструю память HBM, а в инференсе себя лучше проявляют чипы с большим объёмом интегрированной памяти. Таковые как раз предлагают Groq и Cerebras, а также конкурирующая Google. С последней, кстати, смогла договориться Anthropic, поэтому OpenAI пришлось искать альтернативы.

По некоторым данным, OpenAI столкнулась с неэффективностью ускорителей Nvidia при создании ИИ-агента Codex, который помогает разработчикам создавать программный код. Обычные пользователи того же ChatGPT подобных проблем не испытывают, но для программистов OpenAI постарается предложить другие аппаратные решения типа изделий Cerebras, чтобы повысить производительность соответствующих программных инструментов.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Google начала скупать исходный код приложений из «Play Маркета» для обучения ИИ 48 мин.
Вакансии CD Projekt Red раскрыли новые подробности Hadar — загадочной RPG с «безграничным потенциалом» 58 мин.
На Android Go появится облегчённый ИИ-помощник Gemini Go 2 ч.
Запущен экспериментальный сервис Google Dreambeans — он рисует комиксы по жизни пользователя 2 ч.
Ролевой экшен No Rest for the Wicked покинет ранний доступ в октябре и также выйдет на PS5 4 ч.
Налоговая служба потребовала признать разработчика Pioner банкротом 5 ч.
ИИ разрушил рынок труда: пострадали и соискатели, и работодатели 5 ч.
Приоткрыть ворота: Remedy позволила запускать Control Resonant в российском Steam, но купить игру всё равно нельзя 5 ч.
Китайцы сделали чат-бот для квантовых вычислений — он воплощает простые слова в квантовых схемах 5 ч.
Amazon встроила в поиск ИИ-картинки несуществующих товаров, чтобы помочь найти настоящие 15 ч.
Репортаж со стенда GIGABYTE на Computex 2026: игровые ноутбуки и OLED-мониторы нового поколения 2 мин.
Galax показала концепт GeForce RTX 6090 Hall of Fame — четыре вентилятора и кристаллы Swarovski 2 мин.
AirTrunk инвестирует $21 млрд в строительство 3-ГВт ЦОД в индийском штате Махараштра 5 мин.
Только не списывай точь в точь: китайская BYD намерена выпускать человекоподобных роботов — прямо как Tesla 17 мин.
Foxconn теперь будет собирать ИИ-серверы не только для Nvidia, но и для Intel 19 мин.
MSI показала GeForce RTX 5080 Suprim в юбилейной версии Draco Epic с большим драконом на задней пластине 51 мин.
Intel признала, что при освоении ангстремного техпроцесса 18A переоценила свои возможности 54 мин.
Сегодня вечером над Землёй забушуют полярные сияния, но россияне их вряд ли увидят 59 мин.
«МегаФон»: всего 10 % телефонов в России готовы к работе в отечественных сетях 5G 2 ч.
«Это только начало»: Intel опровергла слухи о прекращении выпуска видеокарт Arc 2 ч.