Сегодня 22 апреля 2024
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Hardware

Amazon представила мощные ускорители Trainium2 для обучения больших ИИ-моделей, а также Arm-процессоры Graviton4

Рост спроса на генеративный искусственный интеллект, который зачастую обучается и запускается на специализированных ускорителях на графических процессорах (GPU), во всём мире наблюдается дефицит таких ускорителей. На этом фоне облачные гиганты создают свои чипы. И Amazon сегодня на ежегодной конференции re:Invent продемонстрировала новейшие собственные ускорители для обучения нейросетей — Trainium2. А ещё были представлены серверные процессоры Graviton4.

 Источник изображения: Unsplash

Источник изображения: Unsplash

Первый из двух представленных чипов, AWS Trainium2, способен обеспечить в четыре раза более высокую производительность и в два раза более высокую энергоэффективность по сравнению с первым поколением Trainium, представленным в декабре 2020 года. Trainium2 будет доступен клиентам Amazon Web Services в инстансах EC Trn2 в кластерах из 16-ти чипов. В решении AWS EC2 UltraCluster клиенты смогут получить в своё распоряжении до 100 000 чипов Trainium2 для обучения больших языковых моделей. К сожалению, Amazon не уточнила, когда Trainium2 станут доступны клиентам AWS, предположив лишь, что это произойдёт «где-то в следующем году».

По заявлению Amazon, 100 000 чипов Trainium2 обеспечат теоретическую вычислительную мощность в 65 Эфлопс (квинтиллионов операций в секунду), что в пересчёте на одно ядро составляет 650 Тфлопс (триллионов операций). Конечно, это лишь теоретические показатели, и стоит брать во внимание факторы, усложняющие расчёты. Однако, если предположить, что одно ядро Trainium2 сможет обеспечивать реальную производительность около 200 Тфлопс, то это значительно превысит возможности чипов того же Google для обучения моделей ИИ.

В Amazon также подчеркнули, что кластер из 100 000 чипов Trainium2 способен обучить большую языковую модель ИИ (LLM – large language model) с 300 миллиардами параметров всего за несколько недель. Раньше на такие задачи уходили месяцы обучения. Отметим, что параметры в парадигме LLM — это элементы модели, полученные на обучающих датасетах и, по сути, определяющие мастерство модели в решении той или иной задачи, к примеру, генерации текста или кода. 300 миллиардов параметров — это примерно в 1,75 раза больше, чем у GPT-3 от OpenAI.

«Чипы лежат в основе всех рабочих нагрузок клиентов, что делает их критически важной областью инноваций для AWS, — отметил в пресс-релизе вице-президент AWS по вычислениям и сетям Дэвид Браун (David Brown). — Учитывая всплеск интереса к генеративному ИИ, Trainium2 поможет клиентам обучать их ML-модели быстрее, по более приемлемой цене и с большей энергоэффективностью».

 Источник изображения: Amazon

Слева — процессор Graviton4, справа — ускоритель Trainium2. Источник изображения: Amazon

Второй чип, анонсированный Amazon сегодня — Arm-процессор Graviton4. Amazon утверждает, что он обеспечивает на 30 % более высокую производительность, на 50 % больше ядер и на 75 % более высокую пропускную способность памяти, чем процессор предыдущего поколения Graviton3 (но не более современный Graviton3E), применяемый в облаке Amazon EC2. Таким образом Graviton4 предложат до 96 ядер (но будут и другие конфигурации) и поддержку до 12 каналов оперативной памяти DDR5-5600.

Ещё один апгрейд по сравнению с Graviton3 состоит в том, что все физические аппаратные интерфейсы Graviton4 зашифрованы. По заявлению Amazon, это должно надёжнее защищать рабочие нагрузки клиентов по обучению ИИ и клиентские данные с повышенными требованиями к конфиденциальности.

«Graviton4 — это четвёртое поколение процессоров, которое мы выпустили всего за пять лет, и это самый мощный и энергоэффективный чип, когда-либо созданный нами для широкого спектра рабочих нагрузок, — говорится в заявлении Дэвида Брауна. — Затачивая наши чипы на реальные рабочие нагрузки, которые очень важны для клиентов, мы можем предоставить им самую передовую облачную инфраструктуру».

Graviton4 будет доступен в массивах Amazon EC2 R8g, которые уже сегодня открыты для пользователей в предварительной версии.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Вечерний 3DNews
Каждый будний вечер мы рассылаем сводку новостей без белиберды и рекламы. Две минуты на чтение — и вы в курсе главных событий.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Евросоюз занялся изучением политики Broadcom в отношении лицензирования продуктов VMware 10 ч.
Палата представителей Конгресса США приняла новый законопроект о блокировке TikTok, и в этот раз его одобрят в Сенате 21 ч.
Новая статья: Ender Magnolia: Bloom in the Mist — девочки опять грустят. Предварительный обзор 21-04 00:03
Биткоин пережил четвёртый в истории халвинг — вознаграждение майнерам снизилось вдвое 20-04 11:13
Schneider Electric ведёт переговоры о покупке Bentley Systems 20-04 01:10
Не думай о секундах свысока: спустя 26 лет спидраннер побил «невозможный» рекорд прохождения первого уровня Doom II — ушло 100 тысяч попыток 20-04 00:37
Новая статья: Atom Bomb Baby: рассказываем, почему Fallout — идеальная экранизация видеоигрового материала, и почему этот сериал не стоит пропускать 20-04 00:05
Bethesda готовит «несколько очень хороших обновлений» для Starfield, а Fallout 5 не в приоритете 19-04 23:00
Apple откроет сторонним приложениям доступ к NFC 19-04 22:34
В Dota 2 стартовало сюжетное событие «Павшая корона» с уникальными наградами, новыми «арканами» и комиксом 19-04 22:19
Новая статья: Обзор ASUS Zenbook Duo UX8406MA (2024): OLED’никовый период — эра ноутбуков 6 ч.
Власти Японии потратят $470 млн на создание ИИ-суперкомпьютера нового поколения 10 ч.
Tesla надеется предложить FSD китайским клиентам в ближайшее время 22 ч.
Илон Маск снизил цены на электромобили Tesla и опцию FSD, отложил свой визит в Индию 23 ч.
Спрос на электроэнергию в районе Чикаго взлетит на 900 % из-за ИИ ЦОД 20-04 21:35
ИИ-облако TensorWave получит 20 тыс. ускорителей AMD Instinct MI300X 20-04 20:50
«Микрон» представил российский ПЛК на базе RISC-V для автоматизации критических инфраструктур 20-04 20:37
«Группа Астра» создала компанию «Иксдата» по выпуску ПАК для высоконагруженных СУБД и анализа данных 20-04 20:33
Новый BIOS для плат Asus Z790 повышает стабильность работы чипов Intel, но снижает их производительность 20-04 18:54
Meta готовит смарт-браслет с возможностью считывания сигналов мозга 20-04 17:56