Сегодня 14 июня 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Hardware

ИИ обойдётся без Nvidia: Amazon выпустила системы на чипах Trainium2, а через год выйдут Trainium3

Подразделение Amazon Web Services (AWS) компании Amazon объявило на проводимой им конференции re:Invent, что клиенты её облачной платформы теперь могут пользоваться системами с ускорителями Trainium2, предназначенными для обучения и запуска больших языковых моделей искусственного интеллекта.

 Источник изображения: aws.amazon.com

Источник изображения: aws.amazon.com

Представленные в прошлом году чипы работают в четыре раза быстрее предшественников: один инстанс EC2 с 16 ускорителями Trainium2 предлагает производительность до 20,8 Пфлопс. Это значит, что при развёртывании масштабной модели Meta Llama 405B на платформе Amazon Bedrock клиент получит «трёхкратный прирост скорости генерации токенов по сравнению с другими доступными предложениями крупных облачных провайдеров». Можно будет также выбрать систему EC2 Trn2 UltraServer с 64 ускорителями Trainium2 и производительностью 83,2 Пфлопс. Отмечается, что показатель 20,8 Пфлопс относится к плотным моделям и точности FP8, а 83,2 Пфлопс — к разреженным моделям и FP8. Для связи между ускорителями в системах UltraServer используется интерконнект NeuronLink.

Совместно со своим партнёром в лице Anthropic, основным конкурентов OpenAI в области больших языковых моделей, AWS намеревается построить крупный кластер систем UltraServer с «сотнями тысяч чипов Trainium2», где стартап сможет обучать свои модели. Он будет в пять раз мощнее кластера, на котором Anthropic обучала модели текущего поколения — по оценке AWS, он «станет крупнейшим в мире вычислительным кластером для ИИ, о котором сообщалось до настоящего времени». Проект поможет компании превзойти показатели, которые обеспечиваются актуальными ускорителями Nvidia, которые по-прежнему пользуются высоким спросом и остаются в дефиците. Хотя в начале следующего года Nvidia готовится запустить ускорители нового поколения Blackwell, которые при 72 чипах на стойку предложат до 720 Пфлопс для FP8.

Возможно, поэтому AWS уже сейчас анонсировала ускорители нового поколения Trainium3, которые предлагают ещё один четырёхкратный прирост производительности для систем UltraServer — ускорители будут производиться с использованием техпроцесса 3 нм, а их развёртывание начнётся в конце 2025 года. Потребность в системах нового поколения в компании обосновали тем, что современные модели ИИ по масштабам подходят к триллионам параметров. Инстансы Trn2 пока доступны только в регионе US East инфраструктуры AWS, но скоро появятся и в других; системы UltraServer в настоящее время работают в режиме предварительного доступа.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Новая статья: Pipistrello and the Cursed Yoyo — замечательное приключение с ноткой ностальгии. Рецензия 6 ч.
Epic Games продолжает борьбу против читеров в Fortnite — студия подала в суд на разработчика и продавцов программ Sincey Cheats и Vanta Cheats 6 ч.
Чемоданный ИИ: в Китае придумали, как обучать модели на чипах Nvidia, которые нельзя ввезти в страну 7 ч.
«Хотим создать нечто действительно особенное»: Heroes of Might & Magic: Olden Era не выйдет в раннем доступе летом 8 ч.
Techland пообещала не бросать Dying Light 2 Stay Human из-за Dying Light: The Beast — у студии ещё «много очень и очень крутых идей» для игры 8 ч.
Несмотря на громкие провалы, Sony всё ещё нацелена на создание «разнообразных и устойчивых» игр-сервисов 11 ч.
Гейминг на Mac вышел на новый уровень: Steam наконец получил нативную поддержку процессоров Apple 11 ч.
Агрессивный план отменяется: Sony продолжит «очень вдумчиво» переносить эксклюзивы PlayStation на ПК 11 ч.
Meta AI показывает всем чужие переписки с интимными подробностями — формально с согласия самих пользователей 16 ч.
Симулятор RoadCraft от авторов MudRunner и SnowRunner показал один из лучших запусков в истории Focus Entertainment 17 ч.
Oracle пообещала построить больше облачных ЦОД, чем все конкуренты вместе взятые 5 ч.
Робопсы Boston Dynamics станцевали в шоу «Америка ищет таланты» — один из них не справился с страхом сцены 5 ч.
И нашим, и вашим: Talen всё-таки поставит 1,92 ГВт энергии с АЭС дата-центрам AWS, но опосредованно 6 ч.
Закат эпохи DDR4: Micron объявила о прекращении выпуска устаревшей памяти 6 ч.
Новозеландцы продали США первый космоплан для суборбитальных полётов 8 ч.
Раскол Intel — вопрос времени: аналитики не верят, что компания справится с кризисом без разделения 8 ч.
Intel отправила на пенсию свои первые настольные и мобильные видеокарты Arc 9 ч.
Сделка Synopsys и Ansys на $35 млрд под угрозой — Китай отложил её одобрение 11 ч.
Intel анонсировала новую волну увольнений — в июне работы лишатся сотрудники Intel Foundry 11 ч.
Скидки сработали: iPhone стал самым продаваемым смартфоном в Китае 12 ч.