Сегодня 29 сентября 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Hardware

ИИ обойдётся без Nvidia: Amazon выпустила системы на чипах Trainium2, а через год выйдут Trainium3

Подразделение Amazon Web Services (AWS) компании Amazon объявило на проводимой им конференции re:Invent, что клиенты её облачной платформы теперь могут пользоваться системами с ускорителями Trainium2, предназначенными для обучения и запуска больших языковых моделей искусственного интеллекта.

 Источник изображения: aws.amazon.com

Источник изображения: aws.amazon.com

Представленные в прошлом году чипы работают в четыре раза быстрее предшественников: один инстанс EC2 с 16 ускорителями Trainium2 предлагает производительность до 20,8 Пфлопс. Это значит, что при развёртывании масштабной модели Meta Llama 405B на платформе Amazon Bedrock клиент получит «трёхкратный прирост скорости генерации токенов по сравнению с другими доступными предложениями крупных облачных провайдеров». Можно будет также выбрать систему EC2 Trn2 UltraServer с 64 ускорителями Trainium2 и производительностью 83,2 Пфлопс. Отмечается, что показатель 20,8 Пфлопс относится к плотным моделям и точности FP8, а 83,2 Пфлопс — к разреженным моделям и FP8. Для связи между ускорителями в системах UltraServer используется интерконнект NeuronLink.

Совместно со своим партнёром в лице Anthropic, основным конкурентов OpenAI в области больших языковых моделей, AWS намеревается построить крупный кластер систем UltraServer с «сотнями тысяч чипов Trainium2», где стартап сможет обучать свои модели. Он будет в пять раз мощнее кластера, на котором Anthropic обучала модели текущего поколения — по оценке AWS, он «станет крупнейшим в мире вычислительным кластером для ИИ, о котором сообщалось до настоящего времени». Проект поможет компании превзойти показатели, которые обеспечиваются актуальными ускорителями Nvidia, которые по-прежнему пользуются высоким спросом и остаются в дефиците. Хотя в начале следующего года Nvidia готовится запустить ускорители нового поколения Blackwell, которые при 72 чипах на стойку предложат до 720 Пфлопс для FP8.

Возможно, поэтому AWS уже сейчас анонсировала ускорители нового поколения Trainium3, которые предлагают ещё один четырёхкратный прирост производительности для систем UltraServer — ускорители будут производиться с использованием техпроцесса 3 нм, а их развёртывание начнётся в конце 2025 года. Потребность в системах нового поколения в компании обосновали тем, что современные модели ИИ по масштабам подходят к триллионам параметров. Инстансы Trn2 пока доступны только в регионе US East инфраструктуры AWS, но скоро появятся и в других; системы UltraServer в настоящее время работают в режиме предварительного доступа.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Число криптомиллионеров выросло на 40 % за год — теперь их 241 700 16 ч.
Nival выложила в открытый доступ исходный код военной стратегии «Блицкриг 2» 17 ч.
Google работает над функцией бесшовного переноса приложений между Android и Windows 19 ч.
Подписка xAI Grok обойдётся госслужбам США всего в $0,42 за полтора года 19 ч.
Новая статья: Gamesblender № 745: геймплей Marvel’s Wolverine, ремастер Deus Ex, ремейк Yakuza 3 и хоррор Кодзимы 20 ч.
ИИ-аватар позволяет пообщаться с покойным создателем комиксов о человеке-пауке и героях Marvel 28-09 06:55
Spotify начнёт маркировать музыку с ИИ и запретит клонированные голоса 28-09 05:30
Новая статья: Dying Light: The Beast — свобода или клетка? Рецензия 28-09 00:06
Asus признала подтормаживания геймерских ноутбуков ROG и пообещала скоро всё исправить 27-09 17:55
Российская платформа для разработки GitFlic дополнилась интеграцией с системами управления проектами 27-09 15:34
SpaceX осуществила 124-й пуск ракеты Falcon 9 в этом году — на орбиту выведена партия спутников Starlink 4 мин.
Apple предлагает устранять царапины на новых iPhone 17 Pro при помощи солевого раствора 14 мин.
Китай отстал от США в сфере ИИ-чипов буквально на наносекунды, как считает основатель Nvidia 3 ч.
Новая статья: Обзор PCIe 5.0-накопителя Crucial T710: неудавшийся триумфатор 8 ч.
TSMC категорически отрицает переговоры с Intel о партнёрстве 8 ч.
Huawei доминирует на рынке складных смартфонов — Samsung сильно отстаёт 16 ч.
«Зелёная» энергия для «зелёных» ускорителей: Lambda и ECL впервые запитали NVIDIA GB300 NVL72 от водорода 20 ч.
Meta хотела бы стать крупным поставщиком ПО для человекоподобных роботов 28-09 06:06
Oracle взяла на себя ещё $18 млрд долга для расширения бизнеса и строительства ИИ-инфраструктуры 27-09 23:51
Учёные нашли у Земли седьмую «ложную Луну» — квазиспутник 2025 PN7 27-09 21:23