Сегодня 22 мая 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Теги → вычислительная мощность

Google захлебнулась в спросе на ИИ: даже исследователи DeepMind стоят в очереди за TPU

Исследователям ИИ Google приходится конкурировать за вычислительные мощности, которые распределяются в зависимости от потенциальной прибыльности проектов, к тому же приоритет порой отдаётся платным клиентам. Лидерство компании в разработке ИИ сделало вычислительные мощности настолько ценным ресурсом, что некоторые исследователи запускают собственные стартапы, где у них больше свободы и нет необходимости преодолевать бюрократические препоны Google.

 Источник изображения: TechSpot

Источник изображения: TechSpot

В гонке за создание инфраструктуры, которая обеспечивает работу искусственного интеллекта, Google занимает завидное положение: компания имеет процветающий бизнес облачных вычислений, производит собственные чипы и заключила соглашения о совместном использовании с такими компаниями, как Anthropic и Meta✴. Однако успех компании сделал её вычислительные ресурсы настолько ценными, что собственным исследователям ИИ приходится вставать в очередь.

В лаборатории искусственного интеллекта Google DeepMind доступ к вычислительным мощностям влияет на проекты, которые реализуют исследователи, на лидеров, с которыми они сотрудничают, и на темп работы. «Внутри Google на каждый TPU есть [как минимум] три претендента, — говорит опытный исследователь в области ИИ, почётный профессор Вашингтонского университета Орен Этциони (Oren Etzioni). — Если вы оказались в неудобном положении, когда у вас есть несбыточный проект, и вы конкурируете с прибыльным клиентом, это очень сложная ситуация».

Google заявляет, что использует «строгий, непрерывный процесс, который гарантирует, что наши вычислительные ресурсы распределяются по наиболее важным приоритетам, балансируя сегодняшние потребности клиентов и пользователей с долгосрочными инвестициями в развитие исследований и инноваций». Генеральный директор Alphabet Сундар Пичаи (Sundar Pichai) утверждает, что при принятии решения о том, куда направить вычислительные мощности, руководители компании сосредоточены на обеспечении Google DeepMind необходимыми ресурсами для создания передовых моделей ИИ, «потому что это основа всего, что мы делаем».

 Источник изображений: Google

Источник изображений: Google

Исследователи ИИ когда-то считали Google местом, где они могли свободно заниматься своими интеллектуальными увлечениями, почти как в академической среде, но с лучшей оплатой и большими ресурсами. Однако в 2022 году запуск ChatGPT побудил Google инвестировать в большие языковые модели, которые создают компьютерный код, что, как показали конкуренты, может стать успешным продуктом и приносить существенный доход.

Это снизило инвестиции в экспериментальные проекты, которые не могут принести сиюминутного дохода, и заставило многих ИИ-специалистов задуматься об основании собственных стартапов. Портфель заказов Google Cloud почти удвоился по сравнению с предыдущим кварталом и превысил $460 млрд. «В краткосрочной перспективе мы испытываем нехватку вычислительных мощностей, — признал Пичаи. — Мы преодолеваем этот момент и инвестируем».

Чтобы наверстать упущенное в гонке ИИ, Google в 2023 году объединила лондонскую лабораторию DeepMind, имевшую более иерархическую структуру, и Google Brain, где исследователи занимались персональными проектами с минимальным контролем. Исследователи в Brain получали кредиты на покупку чипов во внутренней системе, где цена колебалась в зависимости от спроса, подобно фондовому рынку. По словам Голди, «это был мощный способ сплотиться и добиться результата».

В ведущих лабораториях ИИ некоторые исследователи вынуждены работать над приоритетными языковыми моделями, даже если их истинные интересы лежат в другой области. «Есть приманка в виде вычислительных мощностей, продвижения и, в целом, участия в триумфальном процессе обучения, — говорит бывший исследователь Google Том Макграт (Tom McGrath). — Есть и кнут: если вы этого не сделаете, у вас не будет никаких ускорителей».

Доступ к вычислительным мощностям для многих учёных стал главным аргументом. По словам бывшей сотрудницы DeepMind Анны Голди (Anna Goldie), компания предлагала ей больше вычислительных мощностей, чтобы отговорить от ухода, но она всё равно ушла, основав компанию Ricursive Intelligence, которая уже привлекла $335 млн инвестиций. Голди «была приятно удивлена» ​​тем, сколько вычислительных мощностей ей удалось найти за пределами компании. «Мне не нужно спрашивать разрешения у десяти вышестоящих руководителей, — заявила она. — Я могу просто принять решение […], чтобы сделать то, что лучше для компании. Я могу прислушиваться к своим сотрудникам и их идеям».

«Игра в искусственный интеллект всегда имела два аспекта, — считает бывший исследователь Google DeepMind Иоаннис Антоноглу (Ioannis Antonoglou). — Первый — у кого больше вычислительных мощностей. А второй — кто сможет использовать их лучше».

Биржи начнут торговать фьючерсами на вычислительные мощности

Американская биржа деривативов CME Group и поставщик индексов Silicon Data объединились для совместного проекта — создания фьючерсного рынка вычислительных мощностей, того самого ключевого источника, что стимулирует бум искусственного интеллекта.

 Источник изображения: nvidia.com

Источник изображения: nvidia.com

Сейчас проект находится на стадии рассмотрения регулирующими органами. Фьючерсы помогут трейдерам, финансовым компаниям, разработчикам ИИ и поставщикам облачных услуг управлять волатильностью и колебаниями цен. Поддержку этих продуктов обеспечат индексы Silicon Data. Вычислительные мощности пользуются высоким спросом — их используют в разработке специализирующиеся на ИИ компании.

Традиционно фьючерсные контракты дают инвесторам возможность делать ставки на стоимость товаров, таких как нефть или металлы, с указанием определённой даты. Они торгуются на биржах и требуют наличия брокерского счета с одобрением для торговли фьючерсами. «Вычислительные ресурсы, выступающие основой цифровой экономики, — это новая нефть XXI века. Каждая обученная модель ИИ, каждая проведённая транзакция и каждый обработанный байт данных основаны на вычислительных ресурсах, которые быстро превращаются в самостоятельный класс активов», — приводит Bloomberg слова гендиректора CME Терри Даффи (Terry Duffy).

При нехватке вычислительных мощностей разработчики ИИ лишаются возможности совершенствовать свои системы и оказываются вынуждены вводить ограничения на использование продуктов. В условиях стремительного роста спроса на вычислительные ресурсы в новые центры обработки данных вкладывают сотни миллиардов долларов, а некоторые исследователи прочат и триллионные расходы на них. Хеджировать ресурсы от колебаний цен и других издержек до настоящего момента было непросто — и появление фьючерсов на вычислительные ресурсы на бирже свидетельствует о шаге в сторону того, чтобы сделать этот актив торгуемым наравне с другими сырьевыми товарами. Фьючерсный рынок сделает издержки более прозрачными. Ориентиром для трейдеров станет индекс Silicon Data — игроки, которые разрабатывают ИИ или нуждаются в вычислительных ресурсах графических процессоров смогут получать актуальную информацию о них.

Уже разработаны ежедневные показатели для оценки стоимости аренды графических процессоров по запросу. Индекс Silicon Data H100 отслеживает почасовую стоимость аренды графического процессора — основного инструмента для обучения моделей ИИ. В ЦОД таких единиц оборудования может быть сотни и тысячи. Индекс основан на исторических данных и корректируется в зависимости от множества факторов в каждый момент времени.

Облачные провайдеры оставили ИИ-стартапы без доступа к GPU — все мощности съели Anthropic и OpenAI

Облачные провайдеры — Microsoft, Amazon и CoreWeave — зарезервировали мощности графических процессоров (GPU) за Anthropic, OpenAI и собственными командами, оставив ИИ-стартапы с многомесячными очередями. Нехватка вычислительных ресурсов затронула стартапы, проинвестированные венчурными фондами — Sequoia Capital, Founders Fund, General Catalyst и Andreessen Horowitz. Арендные ставки за шесть месяцев выросли более чем на 25 %, а по данным Azure дефицит продлится как минимум до конца 2026 года.

 Источник изображения: Alex Shuper / unsplash.com

Источник изображения: Alex Shuper / unsplash.com

Дефицит охватил широкий круг ИИ-компаний: малые и средние игроки вынуждены бороться за остатки мощностей по всё более высоким ценам. Партнёр General Catalyst Хемант Танеджа (Hemant Taneja) разослал анкеты основателям стартапов, в которые вложился фонд, чтобы оценить реальный доступ к GPU. В анкете Танеджа написал: «Мы получаем многочисленные сигналы о том, что доступ к вычислительным ресурсам, прежде всего к GPU, стал одним из главных ограничений для вашего развития в этом году». В ответ General Catalyst создаёт общие вычислительные пулы и намерен напрямую договариваться с провайдерами от имени стартапов из своих инвестиционных портфелей.

Ситуация напоминает начало 2023 года, когда крупные провайдеры свернули публичный доступ к ресурсам в пользу внутренних операций и ключевых клиентов вроде OpenAI — тогда Andreessen Ventures и Index Ventures начали формировать собственные GPU-пулы для стартапов из своих портфелей. Однако нынешняя нехватка острее: скачок спроса на ИИ-инструменты для разработки ПО заставил платформы резко сократить квоты для небольших клиентов, а значительная часть двух- и трёхлетних контрактов, заключённых стартапами в прошлые годы, истекает именно сейчас — облачные провайдеры пользуются этим, чтобы перераспределить мощности в пользу более платёжеспособных клиентов. Многомиллиардные долгосрочные сделки, которые Microsoft, Amazon и CoreWeave заключили с Anthropic и OpenAI, обеспечили этим компаниям приоритетный доступ к GPU. Тем не менее Anthropic всё ещё испытывает острую нехватку мощностей на фоне стремительного роста бизнеса. По сведениям сотрудников компании, Azure сообщила им, что дефицит сохранится как минимум до конца 2026 года.

Microsoft выстроил трёхуровневую систему распределения GPU: около 1000 крупных годовых плательщиков пользуются приоритетным доступом, средние компании получают поддержку выделенных менеджеров, малый и микробизнес работает через партнёрских агентов. Чтобы арендовать чипы Blackwell, клиент обязан взять не менее 1000 единиц и подписать контракт на срок от одного года с бюджетом от десятков миллионов долларов. Старые чипы NVIDIA рядовые клиенты ждут от нескольких недель до нескольких месяцев. Azure отслеживает загрузку и отзывает доступ при простое даже в несколько часов; параллельно компания сворачивает вычислительные льготы в программе поддержки стартапов: компании, не использующие выделенные чипы в полном объёме, навсегда лишаются доступа к GPU.

Генеральный директор Lightning AI Уилл Фалкон (Will Falcon) сообщил, что платформа управляет примерно 40 000 GPU, тогда как в очереди стоят около 40 предприятий с суммарной потребностью до 400 000 чипов. За шесть месяцев ставки выросли более чем на 25 %: часовая цена за чип поднялась с $1,6 до более чем $2, а на популярные конфигурации наценки ещё выше. Основу парка составляют чипы NVIDIA на архитектуре Hopper предыдущего поколения.

Четырёхлетний разработчик ИИ-моделей генерации изображений Krea привлёк $83 млн при участии Andreessen Ventures и Bain Capital Ventures. Сооснователь и генеральный директор компании Виктор Перес (Victor Perez) рассказал, что ещё шесть месяцев назад несколько провайдеров сами добивались партнёрства: компания заключила шестимесячный контракт на аренду нескольких сотен чипов NVIDIA Blackwell по $2,8 в час. Когда Krea попыталась расширить мощности для обучения ИИ-моделей с нуля, торговые представители провайдеров перестали выходить на связь или ссылались на отсутствие ресурсов; когда контакт удавалось установить — требовали трёхлетних контрактов и существенного повышения цены. За несколько дней нужные кластеры выкупили другие клиенты.

В итоге Krea подписала однолетний контракт на те же чипы по $3,7 в час, то есть на 32 % дороже, хотя по рыночным меркам это относительно немного. «Нехватка вычислительных мощностей в критический момент может уничтожить компанию», — предупредил Перес, добавив, что рост цен пережить можно, а перебои в поставках стали бы катастрофой. Другой основатель рассказал, что планировал арендовать около 1000 GPU с высокой пропускной способностью: представитель NVIDIA предупредил об огромных очередях, суточная аренда такого кластера превышает $70 000 — а свободных ресурсов всё равно нет.

Часть стартапов строит собственную инфраструктуру. Основатель Collide — разработчика ИИ-агентов для нефтегазовой отрасли, привлёкшего $14 млн в посевном раунде, — Колин Макклеллан (Colin McLellan) заявил, что компания намерена вложить около $500 000 в GPU NVIDIA, чтобы развернуть частный вычислительный кластер, при необходимости арендовав площадь в ЦОД напрямую. По расчётам Макклеллана, несмотря на высокие первоначальные затраты, собственная инфраструктура исключает риск перебоев и в перспективе нескольких лет выходит дешевле многолетней аренды.

Google инвестирует в Anthropic $40 млрд и предоставит 5 ГВт вычислительных мощностей на фоне обострившейся ИИ-гонки

Google инвестирует в Anthropic $40 млрд — $10 млрд сразу и ещё $30 млрд после достижения ИИ-стартапом целевых показателей. Кроме того, Google предоставит Anthropic дополнительные 5 ГВт вычислительных мощностей Google Cloud на ближайшие пять лет. Соглашение расширяет ранее объявленное партнёрство Anthropic с Google и производителем чипов Broadcom.

 Источник изображения: BoliviaInteligente / unsplash.com

Источник изображения: BoliviaInteligente / unsplash.com

Обещание инвестиций последовало за выпуском Mythos — новейшей и самой мощной ИИ-модели Anthropic, которую компания в этом месяце предоставила ограниченному кругу партнёров. В Anthropic заявляют, что модель имеет серьёзный потенциал в сфере кибербезопасности, однако из-за угрозы злоупотреблений широкий доступ к ней ограничен: компания совместно с избранными организациями оценивает и устраняет эти риски. При этом Mythos уже попала в руки тех, кому она не предназначалась.

Отношения Anthropic с Google возникли задолго до событий этой недели. В начале месяца Anthropic объявила о партнёрстве с Google и производителем чипов Broadcom, который разрабатывает для Google ИИ-процессоры, для получения нескольких гигаватт вычислительных мощностей на базе тензорных процессоров (TPU), начиная с 2027 года. Broadcom затем отчиталась перед регулятором о предоставлении 3,5 ГВт. Новые инвестиции Google расширяют эту договорённость: Google Cloud предоставит дополнительные 5 ГВт мощностей в течение пяти лет с возможностью дальнейшего увеличения.

Google — прямой конкурент Anthropic на рынке ИИ-моделей, но одновременно и ключевой поставщик инфраструктуры. Anthropic во многом зависит от Google Cloud в части процессоров, в том числе TPU — специализированных чипов для ИИ-задач, которые считаются одной из лучших альтернатив востребованным процессорам Nvidia. Гонку в области ИИ всё сильнее определяет доступ к вычислительным мощностям для обучения и развёртывания ИИ-моделей. OpenAI активно наращивает ресурсы через сеть сделок на сотни миллиардов долларов с облачными провайдерами, производителями процессоров и энергетическими компаниями, в том числе расширив в этом месяце соглашение с производителем чипов Cerebras.

Anthropic ведёт жёсткую борьбу за мощности. В последние недели компания столкнулась с массовыми жалобами на ограничения при работе с Claude и ответила серией инфраструктурных сделок. Ранее в этом месяце Anthropic заключила соглашение с облачным провайдером CoreWeave на мощности ЦОД. На этой неделе компания привлекла дополнительные $5 млрд от Amazon — часть масштабного соглашения, по которому Anthropic, как ожидается, потратит до $100 млрд на вычислительные мощности объёмом около 5 ГВт.

Ещё в феврале оценка Anthropic составляла $350 млрд, теперь же инвесторы готовы вкладываться в компанию исходя из оценки в $800 млрд и даже выше. По имеющимся данным, компания рассматривает возможность выхода на биржу уже в октябре этого года.

Акции AMD взлетели на 30 % после объявления о многомиллиардной сделке с OpenAI

OpenAI и Advanced Micro Devices подписали соглашение, по которому компания Сэма Альтмана (Sam Altman) может приобрести 10 % акций производителя чипов. После опубликования этой новости акции AMD мгновенно подорожали более чем на 30 %. В настоящее время развитие OpenAI тормозится из-за недостатка вычислительных мощностей.

 Источник изображений: AMD

Источник изображений: AMD

В рамках этого сотрудничества AMD выдала OpenAI право на покупку до 160 миллионов обыкновенных акций AMD с контрольными сроками, привязанными как к объёму развёртывания, так и к цене акций AMD. OpenAI сможет приобрести около 10 % акций AMD, исходя из текущего количества выпущенных акций. Представитель OpenAI сообщил, что сумма сделки исчисляется «миллиардами долларов», но конкретную сумму раскрывать отказался.

В совместном пресс-релизе компании сообщили, что OpenAI в течение ближайших нескольких лет произведёт массированное развёртывание графических процессоров AMD Instinct нескольких поколений в дата-центрах OpenAI общей мощностью 6 ГВт. На первом этапе во второй половине 2026 года должны быть развёрнуты специализированные чипы AMD общей мощностью 1 ГВт, после чего OpenAI сможет купить часть выделенных акций. Последующие транши будут разблокированы по мере масштабирования систем OpenAI и достижения ключевых технических и коммерческих целей.

«Мы должны это сделать, — заявил президент OpenAI Грег Брокман (Greg Brockman). — Это ключевая часть нашей миссии, если мы действительно хотим масштабироваться и охватить всё человечество, именно это нам и нужно сделать». Он добавил, что компания уже испытывает затруднения с запуском многих функций ChatGPT и других продуктов, которые могли бы приносить доход, из-за нехватки вычислительных мощностей.

Huawei пообещала создать «самый мощный в мире» ИИ-кластер, который в разы превзойдёт решения Nvidia

Huawei наращивает мощности своих вычислительных систем для ИИ на фоне трудностей Nvidia в Китае. Компания заявила, что её новые кластеры из ИИ-ускорителей Ascend 950 на базе чипов собственной разработки станут самыми мощными в мире. Эксперты полагают, что Huawei может преувеличивать свои технические возможности, но признают, что её амбиции стать мировым лидером в области искусственного интеллекта «нельзя недооценивать».

Китайский телекоммуникационный гигант Huawei сегодня анонсировал новые вычислительные системы для искусственного интеллекта на базе собственных чипов Ascend, усиливая давление на американского конкурента Nvidia. Компания заявила, что планирует запустить свой новый суперкластер на базе Atlas 950 уже в следующем году.

До конца 2028 года Huawei намерена выпустить три новых поколения чипов Ascend, удваивая их мощность с каждым годом. Эти чипы составляют основу вычислительной инфраструктуры Huawei для искусственного интеллекта, в которой суперкластер объединяет несколько супермодулей, которые, в свою очередь, построены из суперузлов. В основе каждого суперузла лежат чипы Ascend.

Huawei утверждает, что её новый суперузел будет поддерживать 8192 чипа Ascend 950, а суперкластер будет использовать более 500 000 таких чипов. Когда у Huawei появится более продвинутая версия ускорителя, Atlas 960, запуск которой запланирован на 2027 год, в один узел можно будет объединить 15 488 чипов, а полный суперкластер благодаря этому будет содержать более одного миллиона чипов Ascend.

Пока неясно, как эти кластеры будут соотноситься с системами на базе чипов Nvidia. В пресс-релизе Huawei заявлено, что новые суперузлы станут самыми мощными в мире по вычислительной мощности в течение нескольких лет. Председатель совета директоров Huawei Эрик Сюй (Eric Xu), заявил, что суперузел на базе Atlas 950 обеспечит в 6,7 раза большую вычислительную мощность, чем система Nvidia NVL144, запуск которой также запланирован на следующий год. Сюй также пообещал, что суперкластер Atlas 950 будет обладать в 1,3 раза большей вычислительной мощностью, чем суперкомпьютер xAI Colossus Илона Маска (Elon Musk).

 Источник изображения: Huawei

Источник изображения: Huawei

В апреле 2025 года исследовательская компания SemiAnalysis сообщила, что разработанная Huawei система CloudMatrix оказалась производительнее, чем Nvidia GB200 NVL72, несмотря на то, что каждый чип Ascend обеспечивал лишь около трети производительности процессора Nvidia. Huawei добилась преимущества благодаря пятикратному увеличению числа чипов. Два года назад Huawei анонсировала свой суперкластер Atlas 900. Компания развернула более 300 таких суперузлов для более чем двадцати крупных клиентов в телекоммуникационной, производственной и других отраслях.

США стремятся отрезать Китай от самых передовых технологий для обучения моделей искусственного интеллекта. Чтобы справиться с этой проблемой, китайские компании стали чаще объединять большое количество менее эффективных, часто отечественных, чипов для достижения схожих вычислительных возможностей.

Объявление Huawei было сделано на фоне продвижения Китаем собственных альтернатив чипам Nvidia. На днях китайский регулятор объявил о продлении расследования в отношении Nvidia в связи с предполагаемой монополистической практикой. Ранее правительство Китая настоятельно рекомендовало местным технологическим гигантам прекратить испытания и заказы на чип Nvidia RTX Pro 6000D, разработанный специально для Китая. Генеральный директор Nvidia Дженсен Хуанг (Jensen Huang) заявил, что он «разочарован» новостью об этом запрете. Ранее он называл Huawei «грозным» конкурентом.


window-new
Soft
Hard
Тренды 🔥
AMD внезапно обновила драйверы для древних видеокарт Polaris и Vega 5 ч.
Microsoft теряет GitHub: сервис захлестнули сбои, хаос и массовый уход разработчиков 5 ч.
Без техподдержки, апдейтов и прав: почти треть крупного российского бизнеса использует зарубежное ПО 6 ч.
Терпение Sony подошло к концу: Bungie анонсировала финальное обновление для Destiny 2 7 ч.
Новый геймплейный трейлер амбициозной стратегии Warhammer 40,000: Dawn of War 4 раскрыл дату выхода и планы на DLC 9 ч.
В Steam стартовала закрытая «бета» Warhammer 40,000: Dark Heresy, а третье дополнение к Rogue Trader уже совсем рядом 10 ч.
Психогеографическая ролевая игра Hopetown получила геймплейный тизер и заручилась поддержкой ещё одного ветерана Disco Elysium 10 ч.
Предзаказы Assassin’s Creed Black Flag Resynced оказались среди «самых сильных в истории франшизы» — Ubisoft рассчитывает на большой успех 11 ч.
Ролевой боевик Fatekeeper в духе Dark Messiah of Might and Magic не заставит себя долго ждать — объявлена дата выхода в раннем доступе Steam 12 ч.
Функция Android 17 Continue On позволит переносить задачи между устройствами — у Apple такая есть уже 12 лет 12 ч.