Илон Маск (Elon Musk) опубликовал в соцсети X видео, снятое на своём новом объекте — суперкластере для обучения искусственного интеллекта Cortex, который расположился близ завода Giga Texas компании Tesla. На объекте будут работать 70 000 ИИ-серверов, которые в общей сложности будут потреблять 130 МВт. А к 2026 году суперкомпьютер будет расширен до 500 МВт.
На видео продемонстрирован процесс сборки серверных стоек — ряды по 16 единиц перемежаются примерно четырьмя стойками без ИИ-ускорителей. Каждая стойка включает восемь серверов. На 20-секундный ролик попали где-то 16–20 рядов серверных стоек, что при грубой оценке даёт около 2000 серверов с ускорителями или 3 % от общей предполагаемой мощности объекта.
Video of the inside of Cortex today, the giant new AI training supercluster being built at Tesla HQ in Austin to solve real-world AI pic.twitter.com/DwJVUWUrb5
— Elon Musk (@elonmusk) August 26, 2024
Cortex должен стать крупнейшим у Tesla суперкластером для обучения систем ИИ — здесь будут работать 50 тыс. ускорителей Nvidia H100 и 20 тыс. ускорителей собственной разработки компании, хотя ранее предполагалось, что их тоже будет 50 тыс. Ускорители Tesla установят несколько позже, а при запуске объекта здесь будет работать только оборудование Nvidia. Система создаётся для «решения задач ИИ в реальном мире». Речь идёт об обучении системы автопилота Tesla Full Self Driving (FSD) для потребительских автомобилей и Cybertaxi, а также обучении ИИ для робота Optimus, чьё мелкосерийное производство, как ожидается, будет запущено в 2025 году.
Ранее Маск опубликовал снимок гигантских вентиляторов объекта Cortex, подключённых к системе жидкостного охлаждения Supermicro, которая справится со всем 500-МВт объектом. Первым центром обработки данных Маска, который будет введён в эксплуатацию, станет принадлежащий его стартапу xAI Memphis Supercluster со 100 тыс. Nvidia H100 в единой структуре RDMA и с охлаждением Supermicro — в перспективе к ним будут подключены ещё 300 тыс. B200, но из-за недостатков конструкции их ввод в эксплуатацию задерживается на несколько месяцев. Кроме того, в городе Буффало (шт. Нью-Йорк) готовится к запуску принадлежащий Tesla суперкомпьютер Dojo стоимостью $500 млн.
Источник: