Опрос
|
реклама
Быстрый переход
Phison придумала, как с помощью SSD в шесть раз удешевить обучение больших языковых моделей
26.03.2024 [18:04],
Павел Котов
Phison продемонстрировала на мероприятии Nvidia GTC 2024 рабочую станцию с четырьмя графическими процессорами, производительности которой хватило для обучения модели искусственного интеллекта с 70 млрд параметров. Это стало возможным за счёт задействования ресурсов SSD и системной DRAM, передаёт Tom’s Hardware. В обычных условиях эта задача требует шести серверов с 24 ускорителями Nvidia H100 и 1,4 Тбайт видеопамяти. ![]() Источник изображения: phison.com Платформа Phison aiDaptiv+ помогает снижать барьеры для обучения больших языковых моделей ИИ за счёт использования системной памяти и твердотельных накопителей для увеличения объёма доступной графическим процессорам памяти. Это решение позволит компаниям снизить затраты на обучение ИИ и избежать дефицита графических процессоров, который угрожает отрасли. Производительность такой системы, конечно, уступает дорогим серверным решениям, но открывает возможности представителям малого и среднего бизнеса запускать передовые модели локально, обеспечивая конфиденциальность данных, если затраты времени на обучение не являются критичными. ![]() Источник изображения: phison.com Для демонстрации использовалась рабочая станция Maingear Pro AI с процессором Intel Xeon W7-3445X, 512 Гбайт памяти DDR5-5600 и двумя специализированными твердотельными накопителями Phison aiDaptiveCache ai100E формата M.2 по 2 Тбайт, специально предназначенными для кеширования рабочих нагрузок. Эти диски на основе чипов SLC рассчитаны на 100 циклов перезаписи в день в течение пяти лет. Программное решение Phison aiDaptiv+ «отрезает» слои ИИ-модели от видеопамяти, которые активно не обрабатываются, и отправляет их в системную память машины; если это необходимая информация, она остаётся здесь, а данные с низким приоритетом сбрасываются на твердотельные накопители. По мере необходимости они перемещаются в видеопамять графического процессора для дополнительной обработки, а обработанные данные направляются в DRAM и SSD. ![]() Источник изображения: tomshardware.com Рабочая станция Maingear Pro AI выпускается в нескольких вариантах от $28 тыс. за версию с одним графическим ускорителем Nvidia RTX 6000 Ada A100 до $60 тыс. за комплектацию с четырьмя GPU. Ведущим партнёром Phison по поставке оборудования для новой платформы является Maingear, но разработчик сотрудничает также с MSI, Gigabyte, ASUS и Deep Mentor, которые готовы предложить свои решения. Промежуточная библиотека Phison aiDaptiv+ работает с Pytorch/Tensor Flow и не требует модификации приложений ИИ. Затраты на обучение модели на такой установке в шесть раз ниже, чем её запуск на восьми кластерах с 30 ИИ-ускорителями, но процедура занимает примерно в четыре раза больше времени. Есть также вариант горизонтального масштабирования с запуском четырёх рабочих станций при чуть более чем половине стоимости — в этом случае обучение модели на 70 млрд параметров займёт около 1,2 часа, тогда как система с 30 ИИ-ускорителями проведёт его за 0,8 часа. NVIDIA представила профессиональные видеокарты RTX 500 и RTX 1000 Ada для ноутбуков
26.02.2024 [15:29],
Павел Котов
NVIDIA представила видеокарты RTX 500 и RTX 1000 Ada Generation для мобильных рабочих станций — они дополнят вышедшие ранее графические процессоры RTX 2000, 3000, 3500, 4000 и 5000. ![]() Источник изображений: nvidia.com Профессиональные видеокарты NVIDIA RTX 500 и RTX 1000 включают в себя нейропроцессоры (NPU) и графику NVIDIA RTX, в том числе тензорные ядра для обработки алгоритмов искусственного интеллекта. NPU поможет в разгрузке центрального процессора при обработке лёгких задач ИИ, а графическая подсистема предназначена для более ресурсоёмких нагрузок: видеоконференции с функциями ИИ, потоковое видео с ИИ-масштабированием, а также платформы генеративного ИИ. NVIDIA RTX 500 предлагает производительность 154 TOPS (INT8), RTX 1000 — 193 TOPS. По сравнению с работой на одном только центральном процессоре NVIDIA RTX 500 обещает 14-кратный прирост производительности при локальном запуске моделей масштаба Stable Diffusion, до трёхкратного прироста при редактировании изображений с ИИ, а также до 10-кратного роста скорости при прорисовке трёхмерной графики. ![]() NVIDIA привела ряд примеров, когда профессиональные видеокарты RTX 500 и RTX 1000 окажутся оптимальным решением: удаление фонового шума с помощью ИИ в видеоредакторе; повышение чёткости статических изображений при масштабировании; работа с технологией DLSS; корпоративные клиенты смогут локально запускать большие языковые модели, а исследователи — задачи, связанные с обработкой данных и настройкой ИИ-моделей. Производитель отметил, что видеокарты NVIDIA RTX 500 и RTX 1000 на архитектуре Ada Lovelace предлагают новейшие решения на тонких и лёгких ноутбуках. Здесь присутствуют RT-ядра третьего поколения, которые предлагают двухкратный прирост производительности при просчёте трассировки лучей в сравнении со вторым поколением; тензорные ядра четвёртого поколения с увеличенной относительно предыдущего пропускной способностью для оптимизации ИИ-задач; ядра NVIDIA CUDA Ada Generation с 30-процентным приростом производительности (FP32) в графических и вычислительных нагрузках; 4 (RTX 500) или 6 (RTX 1000) Гбайт видеопамяти; поддержка DLSS 3 с генерацией дополнительных кадров; аппаратная поддержка кодека AV1. Профессиональные видеокарты NVIDIA RTX 500 и RTX 1000 Ada Generation дебютируют весной с выходом новых ноутбуков от Dell, HP, Lenovo и MSI. Гибридный ускоритель NVIDIA GH200 можно купить в составе рабочей станции за $41 500
11.02.2024 [07:53],
Алексей Разин
Формально объединяющий на одной плате ускоритель NVIDIA GH200 предназначается для серверного применения, но в интернет-магазине GPTshop можно приобрести рабочую станцию на его основе, которая использует операционную систему Ubuntu. Экзотическая рабочая станция оценивается минимум в $41 500, поскольку подобные ускорители сами по себе являются дорогостоящими компонентами. ![]() Источник изображений: GPTshop Напомним, что ускоритель GH200 сочетает центральный процессор Grace с архитектурой Arm с 72 ядрами, он поддерживает до 480 Гбайт памяти типа LPDDR5X. По соседству на плате расположился графический процессор H200, который имеет площадь кристалла 814 мм2 и содержит 16 896 ядер CUDA, используемых для ускорения вычислений. Указанный интернет-магазин позволяет выбирать между модификацией ускорителя как с памятью HBM3, так и более новой версией с памятью типа HBM3E, которая ещё и предлагается в большем объёме. ![]() Судя по фотографиям рабочей станции, сделанным в интерьере частного дома, система охлаждения этого необычного вычислительного решения строится на вентиляторах Noctua, которые напиханы буквально во все доступные посадочные места. В качестве опций рабочую станцию можно оснастить сетевыми платами Bluefield-3 и ConnectX-7, твердотельными накопителями объёмом до 8 Тбайт, а также жёсткими дисками объёмом до 30 Тбайт. Внутри системного блока может прописаться даже видеокарта GeForce RTX 4060, если пользователю потребуется работать с графикой на более серьёзном уровне. Впрочем, поскольку в качестве операционной системы может использоваться только Ubuntu, рассчитывать на игровое применение такой рабочей станции просто бессмысленно, учитывая концентрацию вычислительных ресурсов именно на стороне NVIDIA GH200. ![]() В принципе, для определённых условий покупка такой рабочей станции примерно за $50 000 может считаться выгодной сделкой, если учесть, что ускоритель NVIDIA H100 предыдущего поколения сам по себе стоит $40 000. Клиенты GPTshop за чуть большие деньги просто получают готовую систему с более высокой производительностью. AMD представила Threadripper 7000 для энтузиастов и 7000 PRO для профессионалов — у флагмана 96 ядер
19.10.2023 [18:56],
Николай Хижняк
Компания AMD представила новые высокопроизводительные десктопные HEDT-процессоры Ryzen Threadripper 7000, а также модели Ryzen Threadripper PRO 7000, предназначенные для профессиональных рабочих станций. Все новинки используют архитектуру Zen 4. ![]() Источник изображений: AMD В состав серии Ryzen Threadripper PRO 7000, предназначенной для рабочих станций, вошли шесть моделей чипов, предлагающих от 12 до 96 вычислительных ядер с поддержкой от 24 до 192 виртуальных потоков. Эти процессоры получили от 76 до 384 Мбайт кеш-памяти L3. Новинки предлагают базовые частоты от 2,5 до 4,7 ГГц, а также максимальные частоты от 5,1 до 5,3 ГГц. Для этих процессоров AMD заявляет энергопотребление в 350 Вт, что на 70 Вт выше, чем у моделей Ryzen Threadripper PRO 5000. Флагманской моделью серии является 96-ядерный Ryzen Threadripper PRO 7995WX с поддержкой 192 виртуальных потоков, работающий в диапазоне частот от 2,5 до 5,1 ГГц. AMD отмечает, что новинка обеспечивает до 223 % более высокую производительность рендеринга в V-Ray, чем конкурирующий флагман Intel. Компания также заявляет о снижении энергопотребления на ядро до 73 % и говорит, что её новинки в 2,2 раза лучше по соотношению производительности и потребляемой мощности, чем чипы Intel. Чипы Ryzen Threadripper PRO 7000 получили 13-процентную прибавку IPC по сравнению с моделями Ryzen Threadripper PRO 5000 предыдущего поколения, а также предлагают 17-процентное увеличение тактовой частоты в расчёте на одно ядро. Особенности процессоров Ryzen Threadripper PRO 7000
Процессоры Ryzen Threadripper PRO 7000 предназначены для использования с новой платформой WRX90. Для неё заявляется поддержка восьмиканальной оперативной памяти DDR5-5200 общим объёмом до 2 Тбайт, поддержка 148 (доступны 144) линий PCIe, до 128 из которых относятся к стандарту PCIe 5.0, поддержка разгона процессоров, оперативной памяти, а также наличие дополнительных функций для удалённого управления и повышения безопасности. Стоимость процессоров Ryzen Threadripper PRO 7000 производитель не сообщил. В состав серии процессоров Ryzen Threadripper 7000 для десктопных систем вошли только три модели: Threadripper 7960X стоимостью $1499, Threadripper 7970X с ценником $2499 и Threadripper 7980X, оценённый в $4999. Первый предлагает 24 ядра с поддержкой 48 виртуальных потоков и работает в диапазоне частот от 4,2 до 5,3 ГГц. Второй получил 32 ядра с поддержкой 64 виртуальных потоков и работает с частотами от 4,0 до 5,3 ГГц. Флагманская модель Threadripper 7980X получила 64 ядра с поддержкой 128 виртуальных потоков и работает в диапазоне частот от 3,2 до 5,1 ГГц. Указанные процессоры имеют заявленный показатель TDP в 350 Вт. Модели Threadripper 7960X и Threadripper 7970X получили по 128 Мбайт кеш-памяти L3. Для старшей модели Threadripper 7980X заявлены 256 Мбайт кеш-памяти третьего уровня. Как и модели PRO, десктопные версии Ryzen Threadripper 7000 тоже поддерживают дополнительный разгон CPU и ОЗУ. Для Ryzen Threadripper 7000 компания предлагает использовать платформу TRX50, которая, к слову, совместима с моделями Ryzen Threadripper PRO 7000, поскольку обе платформы оснащаются процессорными разъёмами sTR5. Но для платформы TRX50 заявляется поддержка четырёхканальной ОЗУ DDR5-5200 общим объёмом до 1 Тбайт и 92 линий (88 доступно) PCIe, 48 из которых стандарта PCIe 5.0, а 32 линии — стандарта PCIe 4.0. AMD заявляет, что HEDT-процессоры Ryzen Threadripper 7000 обладают до 94 % более высокой производительностью по сравнению с конкурентом в лице флагманского Intel Xeon w9-3495X и до 46 % быстрее её собственного Threadripper PRO 5995WX предыдущего поколения для рабочих станций. Обе серии процессоров AMD Ryzen Threadripper 7000 поступят в продажу 21 ноября. Они будут доступны не только в составе готовых сборок и рабочих станций от различных OEM-производителей, но также и в качестве отдельных продуктов. Скоро на рынке появятся настольные 96-ядерные процессоры — близится анонс AMD Ryzen Threadripper PRO 7000
19.09.2023 [15:32],
Николай Хижняк
AMD готовится к анонсу процессоров Ryzen Threadripper PRO 7000 на архитектуре Zen 4 для рабочих станций. Это подтверждает утечка материалов будущей презентации новинок. В частности, в них содержатся сведения об окне запуска новых Ryzen Threadripper PRO 7000, ожидаемый прирост производительности, а также информация как минимум об одной модели чипа, входящего в состав новой серии. ![]() Источник изображений: Underfox / AMD Утечка не содержит конкретных дат старта продаж процессоров. В материалах лишь отмечается, что чипы появятся на рынке этой осенью. В США принято считать началом осеннего сезона дату 22 сентября. Иными словами, официальный анонс Ryzen Threadripper PRO 7000 может состояться уже в ближайшие дни. Что касается производительности новых процессоров, то на слайдах AMD сообщается о 20-процентной прибавке по сравнению с актуальными моделями Ryzen Threadripper PRO 5000. Графиков внутренних тестов AMD, которые хотя бы косвенно подтверждали эти утверждения, утечка, к сожалению, не содержит. Ещё один слайд сообщает, что в составе серии процессоров Ryzen Threadripper PRO 7000 будут представлены модели с количеством ядер до 96, что на 50 % больше, чем готовы предложить Ryzen Threadripper PRO 5000. Также отмечается, что 96-ядерный Ryzen Threadripper PRO 7000 способен на 75 % увеличить число выполненных задач по рендерингу в день. Чип справляется с одной операцией за 657 секунд. Для сравнения, у 56-ядерного Xeon W9-3495X уходит на ту же задачу 1125 секунд. Ожидается, что процессоры Ryzen Threadripper PRO 7000 потребуют наличия нового процессорного разъёма у материнских плат, поскольку чипы будут использовать иную упаковку по сравнению с Ryzen Threadripper PRO 5000. Благодаря переезду на новую платформу новые чипы получат поддержку интерфейса PCIe 5.0 и оперативной памяти DDR5. Как пишет портал VideoCardz, ожидается анонс как минимум четырёх моделей процессоров серии Ryzen Threadripper PRO 7000: 96-ядерного 7995WX, 64-ядерного 7985WX, 32-ядерного 7975WX и 16-ядерного 7955WX. Согласно слухам, флагманская модель сможет работать на частоте до 5,1 ГГц. Показатель TDP новых процессоров составит 350 Вт, что на 70 Вт выше, чем у моделей Ryzen Threadripper PRO 5000. AMD Ryzen Threadripper 7985WX с 64 ядрами Zen 4 показался на сером рынке — выход не за горами
17.09.2023 [12:45],
Дмитрий Федоров
Слухи о подготовке процессоров AMD Ryzen Threadripper PRO 7000-й серии на архитектуре Zen 4 к выпуску ходят уже давно. Косвенным признаком их скоро выхода можно считать появление чипа Ryzen Threadripper PRO 7985WX, а точнее его инженерного образца, в продаже. Известный источник утечек @YuuKi_AnS поделился фотографией новинки, которая уже доступна на сером рынке. ![]() Источник изображения: @Yuuki_AnS / X Источник опубликовал фотографию, предположительно, нового процессора AMD Ryzen Threadripper Pro 7985WX. На снимке запечатлён чип в матовой оранжевой рамке под процессорный разъём SP6. Новинка имеет идентификационный номер 100-000000454-30, который, как отмечают эксперты, не совпадает ни с одним из ранее анонсированных или выпущенных на рынок продуктов компании. Это может свидетельствовать о том, что AMD работает над созданием совершенно нового чипа, не имеющего аналогов в текущем ассортименте. Согласно неофициальной информации, расчётная тепловая мощность (TDP) процессора составляет 350 Вт, что является важным показателем его энергоэффективности и потенциальной производительности. Предполагается, что процессор будет оснащён 64 вычислительными ядрами и сможет обеспечить одновременную обработку до 128 потоков инструкций. Такой уровень мощности позволит значительно увеличить производительность рабочих станций, оснащённых новым чипом. То, что он предназначен для сокета SP6, говорит о поддержке до восьми каналов оперативной памяти DDR5. Однако это не гарантирует, что все продукты с данным сокетом будут обладать таким же набором характеристик. Текущая линейка процессоров AMD Ryzen Threadripper Pro 5000WX уже зарекомендовала себя в области рабочих станций, но архитектуру Zen 3 уже можно считать устаревшей. Ожидается, что новая серия процессоров 7000WX, получившая кодовое имя Storm Peak, предложит пользователям до 96 ядер Zen 4 и поддержку памяти DDR5, а также интерфейс PCIe 5.0 и будет работать с платформой TRX50. Данные характеристики значительно превосходят текущие модели процессоров, используемых сегодня в высокопроизводительных рабочих станциях компаний Dell, HP, Lenovo и других. Однако стоит ожидать, что высокая стоимость новинок сделает её недоступной для широкого круга энтузиастов. Несмотря на это, новые процессоры обещают стать значительным прорывом в индустрии, предлагая передовые технологии и огромное число ядер для профессионального сегмента рынка. Microsoft добавила в PowerToys инструмент Crop and Lock для создания интерактивных мини-окон
03.09.2023 [13:56],
Дмитрий Федоров
Microsoft дополнила свой набор утилит PowerToys новым инструментом Crop and Lock. Он позволяет создавать мини-окна с интерактивным и неинтерактивным контентом. Это нововведение может радикально изменить подход пользователей к организации рабочего пространства, делая его более гибким и функциональным. ![]() Источник изображения: Uzair_Ahmed / Pixabay PowerToys — это не новинка в арсенале Microsoft. Впервые набор утилит для расширения функциональности Windows появился во времена Windows 95, а затем был переосмыслён компанией в 2019 году для Windows 10, после чего Microsoft решила сделать его открытым, выложив на GitHub. Новый инструмент, совместимый с Windows 11 и Windows 10 v2004 (19041) и более новыми версиями, предлагает два режима работы. Первый — это Thumbnail, неинтерактивное мини-окно, которое показывает выбранную пользователем область в реальном времени, без возможности взаимодействия с его содержимым. Второй режим, Reparent, в отличие от первого, позволяет не только наблюдать, но и взаимодействовать с содержимым выбранной области, например, прокручивать страницу внутри мини-окна. Однако стоит учитывать, что этот режим может быть не совместим с некоторыми приложениями. Для активации новой функции в PowerToys предусмотрены следующие сочетания клавиш:
Стоит помнить, что перед активацией комбинации клавиш окно приложения должно быть выбрано. Microsoft также предупреждает пользователей о возможных проблемах:
Тем не менее, Crop and Lock — это ещё один шаг Microsoft к созданию более удобного и гибкого пользовательского интерфейса. Несмотря на некоторые ограничения, новый инструмент открывает дополнительные возможности для пользователей. Новая версия PowerToys 0.73.0 уже включает в себя этот инструмент, доступный для архитектур x64 и Arm64. |