Сегодня 05 апреля 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Hardware

OpenAI усомнилась в эффективности ускорителей Nvidia для инференса и всё активнее ищет им альтернативу

Принято считать, что OpenAI и Nvidia являются главными выгодоприобретателями бума искусственного интеллекта, и они поддерживают прочные партнёрские отношения, которые должны быть подкреплены сделкой на сумму $100 млрд. Источники при этом отмечают, что эффективность ускорителей Nvidia в инференсе может не устраивать OpenAI, поэтому она стремится найти им подходящую альтернативу.

 Источник изображения: Nvidia

Источник изображения: Nvidia

Об этом по своим каналам удалось выяснить Reuters, хотя публично OpenAI и Nvidia продолжают выражать крайнюю степень взаимной лояльности. Если верить данным источника, OpenAI хотела бы до 10 % ускорителей в своей вычислительной инфраструктуре заменить на решения сторонних поставщиков, которые лучше проявляли бы себя в задачах инференса — то есть, эффективнее бы работали с уже обученными большими языковыми моделями.

OpenAI даже хотела договориться с Cerebras и Groq о поставках разрабатываемых этими стартапами чипов, но Nvidia решила сработать на опережение, купив в прошлом году последний за $20 млрд. До этого Groq вела переговоры с другими инвесторами о вложении в свой капитал до $14 млрд, но Nvidia предложила больше, обеспечив при этом весьма специфическую структуру сделки. По её условиям, Groq сохранила возможность лицензирования своих разработок другим компаниям, но фактически Nvidia перевела в свой штат основных разработчиков ускорителей из Groq. Фактически, остальным компаниям Groq теперь может предложить только программное обеспечение для облачных систем. Одновременно возникают вопросы по целесообразности сделки, в рамках которой Nvidia предложила направить в капитал OpenAI до $100 млрд. Пока стороны отрицают наличие проблем в этой сфере, хотя Nvidia и подчёркивает, что её обязательства не носят строгого характера.

Сделку с Cerebras компании OpenAI заключить удалось, теперь вторая будет покупать у первой так называемые «царь-ускорители», которые неплохо проявляют себя в задачах инференса. Проблема OpenAI до сих пор заключалась в том, что она сильно зависит от ускорителей Nvidia и AMD, которые используют внешнюю, пусть и очень быструю память HBM, а в инференсе себя лучше проявляют чипы с большим объёмом интегрированной памяти. Таковые как раз предлагают Groq и Cerebras, а также конкурирующая Google. С последней, кстати, смогла договориться Anthropic, поэтому OpenAI пришлось искать альтернативы.

По некоторым данным, OpenAI столкнулась с неэффективностью ускорителей Nvidia при создании ИИ-агента Codex, который помогает разработчикам создавать программный код. Обычные пользователи того же ChatGPT подобных проблем не испытывают, но для программистов OpenAI постарается предложить другие аппаратные решения типа изделий Cerebras, чтобы повысить производительность соответствующих программных инструментов.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Новая статья: Grime 2 — истязание на любителя. Рецензия 6 ч.
Новая статья: Gamesblender № 770: релиз DLSS 4.5, Синдзи Миками и авторы Stellar Blade, почти конец Eidos Montreal 7 ч.
Энтузиаст установил Windows 3.1x на компьютер 2025 года — и она заработала c Ryzen 9 9900X и RTX 5060 Ti 11 ч.
В руководстве OpenAI провели очередные кадровые перестановки — частично вынужденные 16 ч.
Nvidia показала нейронное сжатие текстур: потребление видеопамяти упало почти в 7 раз 16 ч.
Суд обязал Netflix вернуть деньги за необоснованное повышение стоимости подписок, но только в одной стране 18 ч.
Anthropic ввела дополнительную плату за подключение OpenClaw к Claude 18 ч.
На Perplexity подали в суд за тайную передачу личных данных и переписок пользователей рекламщикам 18 ч.
Техподдержка NASA удалённо починила Microsoft Outlook на планшете командира лунной миссии Artemis II 19 ч.
Anthropic связала склонность Claude к шантажу и жульничеству с давлением и невыполнимыми задачами 24 ч.
Обновлённый RedMagic 11 Pro показал достойный FPS в играх для ПК класса AAA 13 ч.
ИИ на селе: NetApp и NTT протестировали геораспределённое обучение LLM 15 ч.
Стартап CavilinQ получил $8,8 млн на разработку квантового интерконнекта для объединения квантовых компьютеров 16 ч.
Специалисты iFixit разобрали наушники Apple AirPods Max 2 — внутренняя компоновка не изменилась 16 ч.
Apple распродала все Mac Studio с 256 Гбайт оперативки — сроки доставки растянулись до 4–5 месяцев 20 ч.
Удачно прилунившийся модуль Firefly Aerospace Blue Ghost рассказал о Луне нечто неожиданное 21 ч.
Китайские производители чипов завершили прошлый год рекордными объёмами выручки 22 ч.
Тестовый полёт космического корабля SpaceX Starship V3 в очередной раз перенесён на месяц 04-04 05:03
Восстание стиральных машин: программное обновление не позволило клиентам Samsung выстирать одежду 04-04 04:38
Соучредитель Supermicro с соучастником отрицают участие в контрабанде ИИ-чипов NVIDIA в Китай 04-04 00:24