Сегодня 25 июня 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Hardware

Google Cloud представила пятое поколение тензорных процессоров для обучения ИИ

На очередной ежегодной конференции Cloud Next компания Google Cloud объявила о выпуске пятого поколения своих тензорных процессоров (TPU) для обучения нейросетей — TPU v5e. Google анонсировала предыдущую, четвертую версию этих процессоров в 2021 году, но разработчикам они стали доступны только в 2022 году.

 Источник изображения: Frederic Lardinois / TechCrunch

Источник изображения: Frederic Lardinois / TechCrunch

Компания отмечает, что при создании новой версии чипа особое внимание уделялось его эффективности. По сравнению с предыдущим поколением, новый процессор обещает двукратное улучшение производительности в пересчёте на доллар для обучения больших языковых моделей (LLM) и генеративных нейросетей, а также 2,5-кратное улучшение производительности по тому же критерию для инференс-систем.

«Это самый экономичный и доступный облачный TPU на сегодняшний день», — заявил на пресс-конференции перед сегодняшним анонсом Марк Ломейер (Mark Lohmeyer), вице-президент и генеральный директор по вычислительной и ML-инфраструктуре Google Cloud.

 Источник изображения: Google

Источник изображения: Google

В то же время он подчеркнул, что компания не экономила на технических характеристиках TPU v5e в угоду рентабельности. Кластеры могут включать до 256 чипов TPU v5e, объединённых высокоскоростным интерконнектом с совокупной пропускной способностью более 400 Тбит/с. Производительность такой платформы составляет 100 Попс (Петаопс) в INT8-вычислениях.

«Мы предоставляем нашим клиентам возможность легко масштабировать свои модели искусственного интеллекта за пределы физических границ одного модуля TPU или одного кластера TPU. Другими словами, одна большая рабочая нагрузка искусственного интеллекта теперь может распределяться на несколько физических кластеров TPU, масштабируясь буквально до десятков тысяч чипов. При этом работа будет выполняться экономически эффективно. В результате, используя облачные графические процессоры и облачные TPU, мы действительно предоставляем нашим клиентам большой выбор, гибкость и дополнительные возможности для удовлетворения потребностей широкого набора рабочих задач, связанных с ИИ, которые, как мы видим, продолжают множиться», — добавил он.

В дополнение к анонсу нового поколения TPU компания Google также объявила, что в следующем месяце сделает общедоступными для разработчиков виртуальные кластеры A3, оснащённые специализированными графическими процессорами Nvidia H100.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Ещё один игрок War Thunder опубликовал конфиденциальные военные документы, чтобы доказать свою правоту 53 мин.
Бизнес раскритиковал идею введения платного доступа к госсервисам для юрлиц 11 ч.
Объявлена дата выхода Little Nightmares 3 — новый трейлер, 11 минут геймплея и предзаказ с приятным сюрпризом 11 ч.
Российская гиперконвергентная платформа vStack HCP получила крупное обновление 14 ч.
Продажи Rematch от создателей Sifu превысили миллион копий — раскрыта статистика игроков 14 ч.
Для Warhammer 40,000: Rogue Trader вышло сюжетное дополнение Lex Imperialis и большой патч 1.4, а в работе ещё более крупное обновление 15 ч.
Anthropic выиграла суд у издателей: обучать ИИ на купленных книгах законно, на пиратских — нет 15 ч.
Xbox скоро настигнет новая волна массовых увольнений — Microsoft проводит реорганизацию 16 ч.
Путин подписал закон о создании национального мессенджера 17 ч.
Новый геймплейный трейлер раскрыл дату выхода перезапуска Painkiller — в российском Steam открыт предзаказ 17 ч.
«ОНИКС БУКС» выпустила компактный ридер «Васко Да Гама 5» с дисплеем E Ink и ценой 17 990 рублей 24 мин.
Недоступность ИИ-инфраструктуры усилит цифровое, экономическое и политическое неравенство 2 ч.
Бывший маркетолог Google создал «пустышку» для тех, кто не может оторваться от телефона 2 ч.
Оборот российского рынка микроэлектроники может к 2030 году превысить триллион рублей 6 ч.
Суд приговорил криптоблогера Битмаму к семи годам колонии за мошенничество 6 ч.
Apple приняла официальное участие в китайской программе субсидирования продаж потребительской электроники 7 ч.
Fujitsu считает важным появление в Японии контрактного производителя передовых чипов Rapidus 7 ч.
Intel запустила обещанную волну увольнений — первыми под сокращение попали инженеры в Калифорнии 10 ч.
Gigabyte представила три версии GeForce RTX 5050, включая низкопрофильную — все с разгоном 10 ч.
Стараниями Китая мировые поставки носимых устройств подскочили на 10,5 % в первом квартале 10 ч.