Сегодня 27 апреля 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Hardware

Облачные провайдеры оставили ИИ-стартапы без доступа к GPU — все мощности съели Anthropic и OpenAI

Облачные провайдеры — Microsoft, Amazon и CoreWeave — зарезервировали мощности графических процессоров (GPU) за Anthropic, OpenAI и собственными командами, оставив ИИ-стартапы с многомесячными очередями. Нехватка вычислительных ресурсов затронула стартапы, проинвестированные венчурными фондами — Sequoia Capital, Founders Fund, General Catalyst и Andreessen Horowitz. Арендные ставки за шесть месяцев выросли более чем на 25 %, а по данным Azure дефицит продлится как минимум до конца 2026 года.

 Источник изображения: Alex Shuper / unsplash.com

Источник изображения: Alex Shuper / unsplash.com

Дефицит охватил широкий круг ИИ-компаний: малые и средние игроки вынуждены бороться за остатки мощностей по всё более высоким ценам. Партнёр General Catalyst Хемант Танеджа (Hemant Taneja) разослал анкеты основателям стартапов, в которые вложился фонд, чтобы оценить реальный доступ к GPU. В анкете Танеджа написал: «Мы получаем многочисленные сигналы о том, что доступ к вычислительным ресурсам, прежде всего к GPU, стал одним из главных ограничений для вашего развития в этом году». В ответ General Catalyst создаёт общие вычислительные пулы и намерен напрямую договариваться с провайдерами от имени стартапов из своих инвестиционных портфелей.

Ситуация напоминает начало 2023 года, когда крупные провайдеры свернули публичный доступ к ресурсам в пользу внутренних операций и ключевых клиентов вроде OpenAI — тогда Andreessen Ventures и Index Ventures начали формировать собственные GPU-пулы для стартапов из своих портфелей. Однако нынешняя нехватка острее: скачок спроса на ИИ-инструменты для разработки ПО заставил платформы резко сократить квоты для небольших клиентов, а значительная часть двух- и трёхлетних контрактов, заключённых стартапами в прошлые годы, истекает именно сейчас — облачные провайдеры пользуются этим, чтобы перераспределить мощности в пользу более платёжеспособных клиентов. Многомиллиардные долгосрочные сделки, которые Microsoft, Amazon и CoreWeave заключили с Anthropic и OpenAI, обеспечили этим компаниям приоритетный доступ к GPU. Тем не менее Anthropic всё ещё испытывает острую нехватку мощностей на фоне стремительного роста бизнеса. По сведениям сотрудников компании, Azure сообщила им, что дефицит сохранится как минимум до конца 2026 года.

Microsoft выстроил трёхуровневую систему распределения GPU: около 1000 крупных годовых плательщиков пользуются приоритетным доступом, средние компании получают поддержку выделенных менеджеров, малый и микробизнес работает через партнёрских агентов. Чтобы арендовать чипы Blackwell, клиент обязан взять не менее 1000 единиц и подписать контракт на срок от одного года с бюджетом от десятков миллионов долларов. Старые чипы NVIDIA рядовые клиенты ждут от нескольких недель до нескольких месяцев. Azure отслеживает загрузку и отзывает доступ при простое даже в несколько часов; параллельно компания сворачивает вычислительные льготы в программе поддержки стартапов: компании, не использующие выделенные чипы в полном объёме, навсегда лишаются доступа к GPU.

Генеральный директор Lightning AI Уилл Фалкон (Will Falcon) сообщил, что платформа управляет примерно 40 000 GPU, тогда как в очереди стоят около 40 предприятий с суммарной потребностью до 400 000 чипов. За шесть месяцев ставки выросли более чем на 25 %: часовая цена за чип поднялась с $1,6 до более чем $2, а на популярные конфигурации наценки ещё выше. Основу парка составляют чипы NVIDIA на архитектуре Hopper предыдущего поколения.

Четырёхлетний разработчик ИИ-моделей генерации изображений Krea привлёк $83 млн при участии Andreessen Ventures и Bain Capital Ventures. Сооснователь и генеральный директор компании Виктор Перес (Victor Perez) рассказал, что ещё шесть месяцев назад несколько провайдеров сами добивались партнёрства: компания заключила шестимесячный контракт на аренду нескольких сотен чипов NVIDIA Blackwell по $2,8 в час. Когда Krea попыталась расширить мощности для обучения ИИ-моделей с нуля, торговые представители провайдеров перестали выходить на связь или ссылались на отсутствие ресурсов; когда контакт удавалось установить — требовали трёхлетних контрактов и существенного повышения цены. За несколько дней нужные кластеры выкупили другие клиенты.

В итоге Krea подписала однолетний контракт на те же чипы по $3,7 в час, то есть на 32 % дороже, хотя по рыночным меркам это относительно немного. «Нехватка вычислительных мощностей в критический момент может уничтожить компанию», — предупредил Перес, добавив, что рост цен пережить можно, а перебои в поставках стали бы катастрофой. Другой основатель рассказал, что планировал арендовать около 1000 GPU с высокой пропускной способностью: представитель NVIDIA предупредил об огромных очередях, суточная аренда такого кластера превышает $70 000 — а свободных ресурсов всё равно нет.

Часть стартапов строит собственную инфраструктуру. Основатель Collide — разработчика ИИ-агентов для нефтегазовой отрасли, привлёкшего $14 млн в посевном раунде, — Колин Макклеллан (Colin McLellan) заявил, что компания намерена вложить около $500 000 в GPU NVIDIA, чтобы развернуть частный вычислительный кластер, при необходимости арендовав площадь в ЦОД напрямую. По расчётам Макклеллана, несмотря на высокие первоначальные затраты, собственная инфраструктура исключает риск перебоев и в перспективе нескольких лет выходит дешевле многолетней аренды.

Источники:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
ИИ теперь обходится дороже живых сотрудников — техдиректор Uber уже слил на нейросети весь годовой бюджет 9 мин.
Из-за блокировки трафик Telegram в России рухнул в марте на 18 % — но это не помогло «Максу» стать самым популярным мессенджером 24 мин.
Глава разработки Assassin’s Creed Codename Hexe покинул проект вслед за творческим руководителем 45 мин.
Илон Маск должен предложить фирменный финансовый сервис X Money в этом месяце 7 ч.
Акции IBM упали из-за нежелания компании увеличить прогноз выручки 21 ч.
OpenAI и Anthropic начали активно привлекать маркетинговые кадры из других компаний 26-04 07:10
Новая статья: REPLACED — любовь и ненависть в Феникс-Сити. Рецензия 26-04 00:07
Новая статья: Gamesblender № 773: ремейк ACIV: Black Flag, битва за игры в Брюсселе и экранизация Elden Ring 25-04 23:34
Люди стали говорить на 28 % меньше — виноваты смартфоны и интернет, а пандемия лишь усилили спад 25-04 21:07
AMD выпустила систему разгона памяти EXPO 1.2 — потенциал она раскроет на Zen 6 25-04 16:19
Три M.2-слота, два COM-порта и один VGA-выход: встраиваемая система AAEON Boxer-6407-TWL на базе Intel Twin Lake поможет модернизировать промышленные платформы 2 ч.
Забастовка рабочих Samsung сократит мировой выпуск памяти — в условиях дефицита цены тут же подскочат 2 ч.
HighPoint представила HBA- и RAID-адаптеры PCIe 5.0 2 ч.
Из-за войны на Ближнем Востоке в дефиците оказалось сырьё для производства печатных плат 3 ч.
Главный обвиняемый по делу о хищении 2-нм технологии у TSMC приговорён к 10 годам лишения свободы 3 ч.
Samsung получила первый работоспособный кристалл памяти, выпущенный по технологии тоньше 10 нм 4 ч.
Новая статья: Обзор смартфона TECNO CAMON 50 Ultra: самый умный в своем классе 11 ч.
Oklo, NVIDIA и LANL задействуют ИИ для разработки плутониевого топлива и создания передовой атомной инфраструктуры 20 ч.
MediaTek представила процессоры Dimensity 7450 и Dimensity 7450X для игровых и складных смартфонов 20 ч.
Цены на память местами пошли вниз, но нормализации рынка не произойдёт раньше 2030 года 20 ч.