Сегодня 23 сентября 2023
18+
MWC 2018 2018 Computex IFA 2018
Новости Hardware

Cerebras ― процессор для ИИ невероятных размеров и возможностей

Анонс процессора Cerebras ― Cerebras Wafer Scale Engine (WSE) или движка Cerebras масштаба кремниевой пластины ― состоялся в рамках ежегодной конференции Hot Chips 31. Глядя на этого кремниевого монстра удивляет даже не то, что его смогли выпустить во плоти. Удивляет смелость замысла и труд разработчиков, рискнувших разработать кристалл площадью 46 225 квадратных миллиметров со сторонами 21,5 см. На изготовление одного процессора уходит целая 300-мм пластина. При малейшей ошибке уровень брака составляет 100 %, а цену вопроса даже трудно представить.

 Кристалл Cerebras в 56,7 раза больше самого крупного в мире графического процессора NVIDIA

Кристалл Cerebras в 56,7 раза больше самого крупного в мире графического процессора NVIDIA

Выпуском Cerebras WSE занимается компания TSMC. Техпроцесс ― 16 нм FinFET. Этот тайваньский производитель тоже заслужил памятник за выпуск Cerebras. Производство подобного чипа потребовало высшего мастерства и решения массы проблем, но оно того стоило, уверяют разработчики. Чип Cerebras ― это фактически суперкомпьютер на чипе с невероятной пропускной способностью, минимальным потреблением и фантастическим параллелизмом. В настоящий момент это идеальное решение для машинного обучения, которое позволит исследователям начать решать задачи чрезвычайной сложности.

 AnandTech

Источник изображения ― AnandTech

Каждый кристалл Cerebras WSE содержит 1,2 трлн транзисторов, организованных в 400 000 ИИ-оптимизированных вычислительных ядер и 18 Гбайт локальной распределённой памяти SRAM. Всё это связано ячеистой сетью с общей производительностью 100 петабит в секунду. Пропускная способность памяти достигает 9 Пбайт/с. Иерархия памяти одноуровневая. Кеш-памяти нет, перекрытия нет, задержки обращения минимальные. Это идеальная архитектура для ускорения задач, связанных с ИИ. Голые цифры: в сравнении с самыми современными графическими ядрами чип Cerebras обеспечивает в 3000 раз больший объём памяти на кристалле и в 10 000 большую скорость обмена с памятью.

 Источник изображения ― AnandTech

Источник изображения ― AnandTech

Вычислительные ядра Cerebras ― SLAC (Sparse Linear Algebra Cores) ― полностью программируемые и могут быть оптимизированы для работы с любыми нейронными сетями. Более того, архитектура ядер изначально фильтрует данные, представленные нулями. Это освобождает вычислительные ресурсы от необходимости проводить холостые операции умножения на ноль, что для нагрузки разрежёнными данными означает ускорение расчётов и предельную энергоэффективность. Тем самым процессор Cerebras оказывается в сотни или даже тысячи раз эффективнее для машинного обучения в терминах задействованной площади кристалла и его потребления, чем актуальные решения для ИИ и машинного обучения.

 Индивидуальная сборка процессора (Источник изображения ― AnandTech)

Индивидуальная сборка процессора (Источник изображения ― AnandTech)

Изготовление чипа подобного размера потребовало массу уникальных решений. Его даже упаковывать в корпус пришлось едва ли не вручную. Возникли проблемы с подводом питания к кристаллу и его охлаждением. Отвод тепла стал возможен только жидкостью и лишь с организацией зональной подачи с вертикальной циркуляцией. Тем не менее, все проблемы были решены и чип вышел рабочим. Будет интересно узнать о его практическом применении.

 Решение проблем охлаждения и подвода питания (Источник изображения ― AnandTech)

Решение проблем охлаждения и подвода питания (Источник изображения ― AnandTech)

Источники:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Вечерний 3DNews
Каждый будний вечер мы рассылаем сводку новостей без белиберды и рекламы. Две минуты на чтение — и вы в курсе главных событий.
Материалы по теме
window-new
Soft
Hard
Тренды 🔥
Resident Evil Village для iPhone и iPad выйдет 30 октября 52 мин.
Microsoft обогатила мобильную клавиатуру SwiftKey ИИ-функциями — умные подсказки, проверка текста и генерация картинок и стикеров 3 ч.
Клиентов российских хостингов будут идентифицировать через «Госуслуги» или по паспорту 4 ч.
ИИ-генераторы текстов и изображений оказались экологичнее живых писателей и художников 6 ч.
В приложениях Threads появилось переключение учётных записей — на подходе редактирование публикаций 7 ч.
Apple устранила три уязвимости нулевого дня, которые эксплуатировали злоумышленники 8 ч.
У каналов в Telegram появились Stories, но просто так их публиковать нельзя 13 ч.
«Уже совсем другая игра»: секреты выживания от Идриса Эльбы в новом трейлере Cyberpunk 2077: Phantom Liberty 19 ч.
Система резервного копирования «Кибер Бэкап» получила улучшенную интеграцию с Yandex Cloud 19 ч.
Новая статья: The Crew Motorfest — путёвка в рай. Рецензия 19 ч.
Найден путь к массовому производству атомарно тонких нитей из фосфора с мышьяком — это обещает улучшить аккумуляторы, фотопанели и датчики 3 ч.
GeForce RTX 4090 не смогла выдать 240 Гц на мониторе Samsung Odyssey Neo G9, а Radeon RX 7900 XTX — смогла 3 ч.
Производитель аппаратных ключей безопасности Yubico вышел на биржу 4 ч.
В ранней Вселенной оказалось намного больше галактик, похожих на нашу — это заставит переписать теории эволюции космоса 4 ч.
В России создали биопринтер для печати мягких тканей прямо на ранах пациентов 7 ч.
Созданы наушники с датчиком ЭЭГ, которые проследят за здоровьем мозга и порекомендуют музыку для настроения 7 ч.
К 2025 году Toyota рассчитывает увеличить объёмы выпуска электромобилей до 600 000 штук 12 ч.
Cooler Master представила полностью модульный корпус Qube 500 Flatpack и необслуживаемые СЖО MasterLiquid Atmos 13 ч.
Портативная игровая приставка-слайдер AyeNeo Slide получит процессор Ryzen 7 7840U и клавиатуру с RGB-подсветкой 18 ч.
Смартфоны Pixel 8 и Pixel 8 Pro засветились на официальных рендерах 22 ч.