Сегодня 28 января 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Hardware

ИИ обойдётся без Nvidia: Amazon выпустила системы на чипах Trainium2, а через год выйдут Trainium3

Подразделение Amazon Web Services (AWS) компании Amazon объявило на проводимой им конференции re:Invent, что клиенты её облачной платформы теперь могут пользоваться системами с ускорителями Trainium2, предназначенными для обучения и запуска больших языковых моделей искусственного интеллекта.

 Источник изображения: aws.amazon.com

Источник изображения: aws.amazon.com

Представленные в прошлом году чипы работают в четыре раза быстрее предшественников: один инстанс EC2 с 16 ускорителями Trainium2 предлагает производительность до 20,8 Пфлопс. Это значит, что при развёртывании масштабной модели Meta Llama 405B на платформе Amazon Bedrock клиент получит «трёхкратный прирост скорости генерации токенов по сравнению с другими доступными предложениями крупных облачных провайдеров». Можно будет также выбрать систему EC2 Trn2 UltraServer с 64 ускорителями Trainium2 и производительностью 83,2 Пфлопс. Отмечается, что показатель 20,8 Пфлопс относится к плотным моделям и точности FP8, а 83,2 Пфлопс — к разреженным моделям и FP8. Для связи между ускорителями в системах UltraServer используется интерконнект NeuronLink.

Совместно со своим партнёром в лице Anthropic, основным конкурентов OpenAI в области больших языковых моделей, AWS намеревается построить крупный кластер систем UltraServer с «сотнями тысяч чипов Trainium2», где стартап сможет обучать свои модели. Он будет в пять раз мощнее кластера, на котором Anthropic обучала модели текущего поколения — по оценке AWS, он «станет крупнейшим в мире вычислительным кластером для ИИ, о котором сообщалось до настоящего времени». Проект поможет компании превзойти показатели, которые обеспечиваются актуальными ускорителями Nvidia, которые по-прежнему пользуются высоким спросом и остаются в дефиците. Хотя в начале следующего года Nvidia готовится запустить ускорители нового поколения Blackwell, которые при 72 чипах на стойку предложат до 720 Пфлопс для FP8.

Возможно, поэтому AWS уже сейчас анонсировала ускорители нового поколения Trainium3, которые предлагают ещё один четырёхкратный прирост производительности для систем UltraServer — ускорители будут производиться с использованием техпроцесса 3 нм, а их развёртывание начнётся в конце 2025 года. Потребность в системах нового поколения в компании обосновали тем, что современные модели ИИ по масштабам подходят к триллионам параметров. Инстансы Trn2 пока доступны только в регионе US East инфраструктуры AWS, но скоро появятся и в других; системы UltraServer в настоящее время работают в режиме предварительного доступа.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
«Средневековая Богемия ещё никогда не была такой красивой»: PS Store «засветил» подробности ремастера Kingdom Come: Deliverance для PS5 35 мин.
Sony добавила в февральскую подборку PS Plus четыре игры вместо трёх, но фанаты всё равно не рады 2 ч.
Google заплатит $135 млн за тайный сбор данных пользователей Android и больше не будет «шпионить» без спроса 3 ч.
Литовский маркетплейс рассекретил статуэтку по ремейку Assassin’s Creed IV: Black Flag — Ubisoft отреагировала мемом из GTA: San Andreas 3 ч.
Открытая игра без открытого мира: новые подробности амбициозного ролевого боевика Control Resonant от создателей Alan Wake 2 4 ч.
Microsoft улучшила бесшовный перенос приложений между Android и Windows 11 5 ч.
План «Б» для стареющего Linux: у сообщества появился план на случай ухода Линуса Торвальдса 5 ч.
Спустя почти год CD Projekt Red вернула карточную ролевую игру «Кровная вражда: Ведьмак. Истории» на iOS и Android 6 ч.
Google: хакеры до сих пор активно используют уже закрытую уязвимость WinRAR для взлома Windows 6 ч.
Настольный Microsoft Excel получил режим ИИ-агента — он сам заполняет таблицы, исправляет формулы и не только 6 ч.
Японская ракета потеряла спутник по пути на орбиту — он просто свалился с неё 2 ч.
Cooler Master показала огромную СЖО для 2000-Вт чипов — у неё четыре 180-мм вентилятора 2 ч.
В 2025 году электромобили впервые обогнали по продажам автомобили с ДВС в Европе 3 ч.
Недорогая разработка японских учёных превратила смартфон в точный детектор радиации 3 ч.
В России начались продажи смартфонов Redmi Note 15 5 ч.
Идея полувековой давности вдохновила на реалистичный проект дата-центра на орбите 5 ч.
Обзоры AMD Ryzen 7 9850X3D — действительно самый быстрый игровой CPU, но разница с Ryzen 7 9800X3D минимальная 5 ч.
Подглядеть не получится: Samsung сделает уведомления на экране смартфона невидимыми для посторонних 5 ч.
TD Cowen: американские банки расхотели давать в долг Oracle из-за её сделок с OpenAI 5 ч.
Магазины в США начали убирать модули DDR5 и видеокарты из витринных ПК, потому что их теперь часто воруют 6 ч.