Теги → видеокарта
Быстрый переход

NVIDIA выпустила Quadro Experience для продуктивной работы и комфортной игры на видеокартах Quadro

Компания NVIDIA выпустила специальное многофункциональное приложение Quadro Experience для владельцев профессиональных графических карт серии Quadro. В нём содержатся не только инструменты, упрощающие выполнение профессиональных задач, но и функции, позволяющие оптимизировать графику Quadro для игр.

Наличие встроенных инструментов для скриншотов и записи видео в 4K позволяет быстро обмениваться рабочими материалами, в том числе и через такие популярные платформы, как YouTube и Twitch. Использование функции воспроизведения позволяет записать и воспроизвести до 20 последних минут работы.

Приложение также позволяет стримить напрямую с рабочего стола для нескольких пользователей, что обеспечивает простой и удобный способ проведения презентаций, обучения и встреч.

Кроме того, Quadro Experience имеет встроенные уведомления. Они сообщат о выпуске свежих оптимизированных версий драйверов, скачать и установить которые можно будет прямо из приложения.

Помимо инструментов для более продуктивной работы Quadro Experience предоставляет доступ к таким функциям, как NVIDIA Ansel и Freestyle, которые присутствуют пакете GeForce Experience для игровых видеокарт. Первая является фирменным фоторежимом для игр, вторая представляет собой инжектор шейдеров и предлагает несколько цветофильтров и эффектов. Также приложение позволяет провести оптимизацию игровых настроек для достижения наилучшей производительности графических карт Quadro в игровых приложениях.

Скачать NVIDIA Quadro Experience можно с официального сайта компании.

Новая статья: Обзор видеокарты SAPPHIRE NITRO+ RX 5700 XT SE: за тебя все сделали, просто играй!

Данные берутся из публикации Обзор видеокарты SAPPHIRE NITRO+ RX 5700 XT SE: за тебя все сделали, просто играй!

Бедный родственник: AMD разбавит семейство Navi 2X видеочипом Navi 10

Компания AMD давно не скрывает намерений представить во втором полугодии графические решения с архитектурой RDNA 2, которые обеспечат поддержку трассировки лучей на аппаратном уровне. Широта ассортимента новинок до сих пор оставалась загадкой, но теперь источники сообщают, что в новом семействе окажутся и продукты предыдущего поколения.

Источник изображения: AMD

Источник изображения: AMD

Известный блогер rogame со страниц ресурса HardwareLeaks поделился информацией о предполагаемом ассортименте графических решений AMD на базе видеочипа Navi 21, который принято считать флагманским продуктом нового поколения. Представители сайта VideoCardz систематизировали эту информацию, и от разнообразия модификаций при взгляде на таблицу голова идёт кругом. Первоисточник приписывает Navi 21 наличие 5120 потоковых процессоров и площадь кристалла около 505 мм2.

Источник изображения: VideoCardz

Источник изображения: VideoCardz

Надо сказать, что одним Navi 21 дело не ограничится — в семействе предусмотрен и более компактный графический процессор Navi 23, который по размерам кристалла будет сопоставим с Navi 10, на базе которого сейчас выпускаются видеокарты серии Radeon RX 5700.

Источник изображения: HardwareLeaks

Источник изображения: HardwareLeaks

Самое интересное, что и Navi 10 не уйдёт со сцены осенью. Его обновлённому варианту предстоит сосуществовать с более прогрессивными носителями архитектуры RDNA 2. Задача Navi 10 в сложившихся условиях будет заключаться в защите позиций AMD в нижнем ценовом диапазоне. На основе Navi 10 Refresh будут созданы не только настольные, но и мобильные графические решения.

Игровые видеокарты AMD и NVIDIA нового поколения дебютируют в сентябре

Компания AMD не скрывает намерений представить новые игровые видеокарты поколения Navi 2X до конца года, а NVIDIA пока вывела на рынок только вариант Ampere для ускорения вычислений. Это не мешает тайваньским производителям видеокарт утверждать, что игровые продукты нового поколения обеих марок выйдут в сентябре.

Источник изображения: NVIDIA

Источник изображения: NVIDIA

Как стало понятно после анонса NVIDIA GA100, данный графический процессор для игрового применения не годится, поскольку лишён главного фетиша последних лет — блоков аппаратного ускорения трассировки лучей. Для игрового сегмента NVIDIA придётся разработать новые графические процессоры с архитектурой Ampere. Появляется всё больше свидетельств того, что они выйдут до конца текущего года.

Волну подхватывает тайваньский сайт DigiTimes, который сообщает со ссылкой на производителей видеокарт, что AMD и NVIDIA представят новые графические процессоры в сентябре текущего года. Одновременно будут снижены цены на продукты предшествующего поколения, и это подтолкнёт спрос на игровые видеокарты без оглядки на последствия пандемии коронавируса. Производители видеокарт рассчитывают, что спрос на игровые решения будет расти до самого конца этого года.

AMD должна представить в следующем полугодии графические решения с архитектурой RDNA 2, которая обеспечит поддержку трассировки лучей на аппаратном уровне. Не менее важен и предстоящий дебют флагманского графического продукта, так называемого «Big Navi», который должен улучшить позиционирование продукции AMD в верхнем ценовом диапазоне.

Флагманский графический процессор NVIDIA GA100 не годится для игр

Представляя ускоритель вычислений A100 в середине мая, NVIDIA подчёркивала, что поставки графических процессоров GA100 с архитектурой Ampere уже начались. Чуть позже была опубликована техническая документация, которая позволяет выяснить некоторые нюансы, учитывающие особенности применения новинки. В частности, для трассировки лучей GA100 не годится, а ведь это является важным атрибутом старших видеокарт NVIDIA.

Источник изображения: NVIDIA

Источник изображения: NVIDIA

В этой документации NVIDIA открытым текстом говорит, что в полной конфигурации GA100 содержит восемь вычислительных кластеров, 8192 ядра CUDA, 512 тензорных ядер, шесть стеков памяти HBM2 с 6144-разрядной шиной. В составе ускорителей вычислений NVIDIA A100 используется слегка усечённая версия графического процессора GA100, которая обладает только семью вычислительными кластерами, 6912 ядрами CUDA, 432 тензорными ядрами и пятью стеками HBM2 с 5120-разрядной шиной. Обнаруживается и другая особенность A100 — объём кеш-памяти второго уровня уменьшен с 48 до 40 Мбайт.

Физически все «избыточные» блоки присутствуют на кристалле, они просто отключены. Даже количество стеков памяти типа HBM2 производства Samsung осталось неизменным — на подложке разместились все шесть штук, но один из них не работает. Такая компоновка объясняет, почему при наличии шести стеков памяти её общий объём ограничен 40 Гбайт. Каждый стек содержит 8 Гбайт памяти, но только в полной конфигурации совокупный объём HBM2 может достигать 48 Гбайт. На рынок такая версия GA100 пока не поставляется.

Источник изображения: NVIDIA

Источник изображения: NVIDIA

В каждом стеке HBM2 микросхемы памяти расположены в восемь ярусов. Память работает на частоте 1215 МГц, что в совокупности с наличием 5120-разрядной шины обеспечивает пропускную способность 1555 Гбайт/с. Это более чем в 1,7 раза выше, чем у Tesla V100 (Volta).

В составе графического процессора GA100 нет так называемых RT-ядер, которые отвечают за ускорение отрисовки графики методом трассировки лучей. Это говорит о том, что на игровой рынок путь GA100 заказан. NVIDIA придётся разработать отдельные графические процессоры с архитектурой Ampere для применения в игровом сегменте. Частота графического процессора GA100 в его нынешнем виде ограничена 1410 МГц. Вычислительный модуль в исполнении SXM4 рассчитан на TDP до 400 Вт, в серверном шасси он способен охлаждаться воздушной системой, но по сравнению с предшественниками в радиаторе пришлось значительно увеличить количество тепловых трубок.

NVIDIA отказалась от Tesla, чтобы не было путаницы с Tesla

Компания NVIDIA, похоже, перестанет выпускать ускорители вычислений на базе графических процессоров под названием Tesla. Сообщается, что решение прекратить использовать данную торговую марку принято для того, чтобы избежать путаницы с электромобилями американской компании Tesla. Конечно, ведь люди частенько путают графические ускорители и автомобили.

Первый ускоритель NVIDIA Tesla C870

Первый ускоритель NVIDIA Tesla C870

Серия ускорителей Tesla появилась в 2007 году с устройством Tesla C870 на базе графического процессора Tesla G80. Данный ускоритель был похож на традиционную видеокарту за счёт использования системы охлаждения с тангенциальным вентилятором. Позже NVIDIA отказалась от таких охладителей в угоду пассивным радиаторам, которые продуваются мощными вентиляторами самих серверных стоек.

Последний ускоритель NVIDIA Tesla T4

Последний ускоритель NVIDIA Tesla T4

Последним продуктом NVIDIA серии Tesla стал вышедший в позапрошлом году ускоритель ИИ-вычислений на тензорных ядрах Tesla T4 с архитектурой Turing. Примечательно, что компания сейчас решила его переименовать, и теперь он называется просто NVIDIA T4.

Кстати, на прошлой неделе был представлен ускоритель вычислений на базе новейшего графического процессора Ampere GA100. Прежде он наверняка получил бы название Tesla A100, однако теперь он вышел под именем NVIDIA A100. Это и ознаменовало конец эпохи ускорителей вычислений с названиями Tesla.

Производительность Intel Xe DG1 оставляет желать лучшего, но надежда ещё есть

Почти два года назад компания Intel объявила о возвращении на рынок дискретной графики с архитектурой Intel Xe. В начале этого года была выпущена первая видеокарта на новом GPU — Intel Xe DG1, которая является тестовой платформой для разработчиков ПО под будущие массовые GPU Intel. И теперь в Сети появились подробности о вычислительной производительности данного устройства при использовании фреймворка OpenCL.

Из слухов и утечек известно, что данная видеокарта построена на графическом процессоре с 96 исполнительными блоками (Execution Units) с архитектурой Intel Xe, что означает наличие 768 шейдеров. Для сравнения, у наиболее доступных видеокарт AMD и NVIDIA последних поколений — Radeon RX 5500 XT и GeForce GTX 1650 — имеется 1408 и 896 шейдеров соответственно.

Частота GPU у видеокарты Intel также ниже — около 1500 МГц против примерно 1700 МГц у вышеуказанных конкурентов. Наконец, опытный графический ускоритель Intel оснащён лишь 3 Гбайт видеопамяти, по всей видимости с 96-битной шиной, тогда как у конкурентов есть по 4 Гбайт памяти и 128-битная шина.

Видеокарта Intel была протестирована в синтетических бенчмарках CompuBench и Geekbench с использованием OpenCL. Вполне ожидаемо, что инженерный образец показал гораздо более низкие результаты в тестах обоих бенчмарков. В большинстве случаев наблюдается трёхкратный перевес видеокарт NVIDIA и AMD. Но в тесте физики элементарных частиц (Particle Physics) решение Intel показало примерно вдвое более высокую производительность по сравнению с видеокартой AMD.

Как бы то ни было, нужно помнить, что это — лишь прототип графического ускорителя Intel, и финальный продукт получит совершенно иные характеристики. Да и программная часть новой графики Intel явно ещё не завершена. Будем надеяться, что в итоге у Intel получится действительно конкурентоспособный ускоритель, который расшевелит рынок дискретной графики.

Выход видеокарт и консолей новых поколений грозит обернуться дефицитом графической памяти

Аналитики TrendForce сообщают, что в третьем квартале этого года AMD и NVIDIA представят новые графические процессоры, которым потребуется память типа GDDR6. В случае с NVIDIA речь идёт о более доступных 7-нм GPU с архитектурой Ampere, как утверждает первоисточник. AMD подготовит к этому периоду новые чипы семейства Navi 2X, которые тоже окончательно определят GDDR6 в качестве используемого типа памяти.

Источник изображения: NVIDIA

Источник изображения: NVIDIA

В мобильном сегменте новые графические процессоры AMD и NVIDIA не пропишутся ранее первой половины следующего года, но в четвёртом квартале текущего на рынок выйдут игровые консоли Sony и Microsoft нового поколения, которые будут оснащаться 16 Гбайт памяти типа GDDR6. Все эти факторы, по словам специалистов TrendForce, вызовут рост спроса на микросхемы памяти GDDR6.

Источник изображения: TrendForce

Источник изображения: TrendForce

Если рассматривать весь объём потребления памяти типа DRAM, графическая память занимает не более 6 % в удельном выражении на один контакт. Технология производства GDDR6 достаточно сложна, поскольку такая память сочетает высокое быстродействие с низким энергопотреблением. Переоснастить под её выпуск имеющиеся производственные мощности крайне проблематично. Спрос на GDDR6 будет расти, а существенно увеличить объёмы производства не удастся. По этой причине цены на память для графических решений в текущем году могут вырасти даже в том случае, если вся остальная оперативная память будет дешеветь.

Проблема усугубляется тем, что GDDR6 пока выпускают только Micron и Samsung, а SK Hynix собирается присоединиться к ним только в конце года. В сегменте графической памяти доля GDDR6 в прошлом году не превышала 40 % в удельном выражении на один контакт, по итогам этого года доля увеличится до 70 %, а в следующем может превысить 90 %, если опираться на прогноз TrendForce.

Дискретный графический процессор Intel Xe Gen 12 обладает частотой 1,5 ГГц

Как известно, Intel уже некоторое время вынашивает планы по выходу на рынок дискретных видеоускорителей для ПК. Новая утечка раскрывает некоторые характеристики готовящейся к выходу видеокарты. Согласно полученным данным, графический чип Intel Xe Gen 12 будет работать на частоте как минимум в 1,5 ГГц.

hothardware.com

hothardware.com

Пользователь Twitter, скрывающийся под ником TUM_APISAK, нашёл в базе данных популярного бенчмарка GeekBench результат тестирования графического адаптера Intel. Устройство было идентифицировано как Intel Gen 12 Desktop Graphics Controller. Согласно данным бенчмарка, устройство было протестировано в составе компьютера с процессором Core i7-8700 с 16 Гбайт оперативной памяти стандарта DDR4 с установленной на нём 64-битной Windows 10 Enterprise.

hothardware.com

hothardware.com

Согласно записи в базе данных, таинственная видеокарта имеет 96 исполнительных блоков, максимальную тактовую частоту 1,5 ГГц и 3 Гбайт памяти. Если информация не является поддельной, перед нами, вероятнее всего, видеокарта Intel Xe DG1, которая была впервые была замечена в базе регулятора EEC в декабре 2019 года и показанная производителем на CES 2020. По сути, она является опытным образцом, и её характеристики и производительность отличаются от тех, которые мы увидим в законченном продукте, доступном для потребителей.

hothardware.com

hothardware.com

Видеокарта набрала 55 373 балла в тестировании OpenCL. К примеру, AMD Ryzen 5 3400G с графикой Vega 11 под управлением 64-битной Windows 10 Pro в том же тесте набирает 58152 балла. Однако, к моменту релиза, ситуация может сильно измениться. Как минимум, в это хотелось бы верить.

Потребительские версии NVIDIA Ampere отправились в производство: GeForce RTX 3080 и 3070 можно ждать осенью

На прошлой неделе NVIDIA представила новую архитектуру Ampere, а также первый GPU на её основе — флагманский GA100 для ускорителей вычислений. Теперь же в Сети появились неофициальные подробности о характеристиках других GPU Ampere, которые лягут в основу потребительских видеокарт NVIDIA GeForce RTX 30-й серии.

Источником свежей информации стал пользователь Twitter с псевдонимом Kopite7kimi, отметившийся ранее правдивыми утечками о прошлых продуктах NVIDIA. По его данным, NVIDIA закончила подготовку цифрового проекта графического процессора Ampere GA104 для «гражданских» применений и готова отправить его в производство.

Данный GPU обладает 48 потоковыми мультипроцессорами, что означает наличие 3072 ядер CUDA в полной конфигурации. Для подключения памяти типа GDDR6 в нём предусматривается 256-битная шина. Графический процессор Ampere GA104 может лечь в основу будущей GeForce RTX 3080 и, возможно, GeForce RTX 3070. Сколько ядер CUDA сможет предложить каждая из этих видеокарт, пока что сказать сложно.

В свою очередь сообщение о завершении стадии подготовки к производству старшего графического процессора Ampere GA102 появилось ещё в марте. Данный чип сможет предложить до 84 потоковых мультипроцессоров, то есть до 5376 ядер CUDA, что выглядит весьма впечатляюще. Этот графический процессор должен лечь в основу будущей GeForce RTX 3080 Ti. Заметим, что на данный момент нельзя с полной уверенностью сказать, использует ли NVIDIA в этой видеокарте полную версию чипа, или несколько урезанную.

Стоит отметить, что обычно проходит 6–9 месяцев между завершением цифрового проекта и выходом готовых видеокарт. Поэтому флагманскую GeForce RTX 3080 Ti можно ждать когда-то с августа по ноябрь. В свою очередь видеокарты GeForce RTX 3080 и RTX 3070 могут появиться когда-то в период с октября по январь. Конечно, это лишь предположения, и в реальности новинки могут выйти в другой период.

Заметим, что оба упомянутых графических процессора Ampere для потребительских видеокарт будут производиться компанией Samsung по 8-нм графическому техпроцессу с использованием литографии в сверхжёстком ультрафиолете (EUV). На самом деле, по данным источника, все потребительские GPU поколения Ampere будут производиться по данному техпроцессу. В свою очередь, TSMC будет отвечать лишь за производство чипа GA100 для профессиональных ускорителей вычислений.

Сообщается, что компания NVIDIA отказалась от планов по созданию графических процессоров GA101 и GA103. Первый чип должен был стать основой ускорителей вычислений, и, по сути, он бы являлся половиной от представленного флагманского GA100. Но относительно отмены потребительского GA103 полной уверенности нет, и он всё ещё может выйти. С другой стороны, заменить этот чип с лёгкостью смогут частично бракованные GA102, у которых будет отключена какая-то доля вычислительных блоков.

Наконец, о сроках появления младших графических процессоров Ampere GA106 и GA107 никаких достоверных данных нет вообще. Сообщается лишь, что первый получит 30 потоковых мультипроцессоров (1920 ядер CUDA) и 192-битную шину. А самый младший GA107 предложит до 1280 ядер CUDA в 20 потоковых мультипроцессорах и 128-битную шину.

Акционеры обвинили компанию NVIDIA в сокрытии $1 млрд

На этой неделе против NVIDIA в Калифорнии подана обновлённая жалоба акционеров, считающих себя потерпевшими. Производитель видеокарт обвиняется в том, что пытался выдать продажи ускорителей на сумму порядка $1 млрд для криптовалютного рынка в качестве доходов от игрового оборудования. Это ввело в заблуждение тех инвесторов, которые сторонятся спекулятивной прибыли и привыкли вкладываться в более долгосрочный и стабильный бизнес.

Иск отсылает к временам трёхлетней давности, когда рынок криптовалют процветал: в частности, резко возрос спрос на вычислительные блоки видеокарт для использования их с целью майнинга. «В начале 2017 года NVIDIA столкнулась с необычной проблемой: её флагманский продукт исчез с полок магазинов. В обычных условиях такому положению дел можно было бы порадоваться, — говорится в иске. — Но огромный рост продаж связан не с увеличением спроса со стороны игроков (традиционных потребителей продукции NVIDIA), а скорее с группами онлайн-покупателей, которые скупали ГП тысячами и размещали их в крупных ЦОД для решения сложных математических задач в погоне за цифровыми токенами».

Далее в иске поясняется, что NVIDIA решили подзаработать на криптовалютном буме, продавая специализированное оборудование, предназначенное именно для криптостарателей. Но всё же обнаружила, что многие из её игровых видеокарт покупались для добычи криптовалют. Зная, что рынок оборудования для майнинга может обрушиться в любой момент руководство NVIDIA в лице исполнительного директора Дженсена Хуанга (Jensen Huang), финансового директора Колетт Кресс (Collette Kress) и старшего вице-президента Джеффа Фишера (Jeff Fisher), согласно обвинению, решило скрыть большую часть продаж игровых видеокарт для криптовалютного рынка. Компания якобы представила дело так, будто всплеск продаж игровых видеокарт вызван почти исключительно ажиотажным спросом со стороны игроков, а неизбежный крах криптовалютного рынка не приведёт к обвалу спроса на видеокарты GeForce.

Это позволило NVIDIA создать видимость, что она по-прежнему получает большую часть своих доходов от более стабильного игрового рынка, несмотря на то, что сами игроки в течение нескольких месяцев жаловались на аномальный рост цен или отсутствие видеокарт на фоне активности криптостарателей.

В ноябре 2018 года, когда рынок майнинга криптовалюты действительно рухнул, стоимость акций NVIDIA упала на 20 %, что нанесло существенный удар тем, кто вложил деньги, думая, что вкладывается в более стабильный бизнес. Упомянутые в иске аналитики полагают, что NVIDIA умышленно занизила свои доходы от криптовалютного рынка примерно на $1,13 млрд.

Теперь ряд акционеров с помощью коллективного иска пытается добиться, чтобы NVIDIA компенсировала их убытки. По их словам, менеджеры сознательно исказили информацию об источниках доходов компании, тем самым нарушив законы США о ценных бумагах.

Polaris всё ещё актуален: MSI представила низкопрофильную Radeon RX 550 с 4 Гбайт памяти

Компания MSI довольно неожиданно представила видеокарту на графическом процессоре AMD Polaris — Radeon RX 550 4GT LP OC. Новинка выделяется низкопрофильным исполнением, что позволяет использовать её в различных компактных мультимедийных системах.

Видеокарта MSI Radeon RX 550 4GT LP OC построена на графическом процессоре Lexa Pro семейства Polaris, который способен предложить пользователю лишь 512 потоковых процессоров. Тактовая частота GPU составляет 1203 МГц, то есть здесь присутствует небольшой заводской разгон. У новинки имеется 4 Гбайт видеопамяти GDDR5. Использованы чипы с эффективной частотой 6 ГГц, и подключены они через 128-битную шину.

Габариты видеокарты MSI Radeon RX 550 4GT LP OC составляют 170 × 68 × 38 мм, а весит она всего лишь 276 грамм. За отвод тепла здесь отвечает алюминиевый радиатор с парой небольших вентиляторов. Для вывода изображения имеется по одному HDMI 2.0b и DVI-D. Уровень энергопотребления составляет 50 Вт, так что разъёмов дополнительного питания здесь нет.

Компактная видеокарта MSI Radeon RX 550 4GT LP OC уже поступила в продажу в том числе на российском рынке по цене около 9 тыс. рублей. Это заметно дороже других Radeon RX 550, которые стоят около 6–7 тыс. рублей. 

5 фактов про GeForce RTX 3080, которые прояснил анонс NVIDIA Ampere

Наконец-то NVIDIA представила архитектуру графических процессоров нового поколения. Спустя почти полтора года после запуска серии GeForce RTX 20 на базе NVIDIA Turing и через три года после появления графических процессоров Volta, ориентированных на центры обработки данных, исполнительный директор компании Дженсен Хуанг (Jensen Huang) представил новую архитектуру Ampere. Первый продукт на ней похож на абсолютного вычислительного монстра.

Ampere дебютировала в виде A100, огромного графического процессора для центров обработки данных, использующих новые платформы NVIDIA DGX-A100. Не заблуждайтесь: этот зверь с 6912 ядрами CUDA предназначен для исследователей, а аппаратные блоки оптимизированы для задач глубокого обучения. Для Cyberpunk 2077 подобные ускорители явно не предназначены. Но это не значит, что скромные геймеры на ПК не могут порадоваться анонсу ориентированного на ИИ ускорителя с архитектурой Ampere. Перечислим лишь пять ключевых моментов, которые архитектура NVIDIA Ampere принесёт в следующее поколение GeForce.

1. Ampere рассчитан и на рынок ПК

Как и в случае предыдущих графических архитектур Volta и Pascal, сразу после анонса Ampere приняла форму огромного гигантского графического процессора, созданного для задач центров обработки данных. Однако в отличие от Volta, новая Ampere действительно появится и на рынке потребительских видеокарт.

На предварительной встрече с журналистами глава NVIDIA это подтвердил, заявив, что Ampere упростит линейку графических процессоров NVIDIA, заменив как Volta в ускорителях Tesla, так и Turing в видеокартах GeForce. Аппаратные блоки внутри каждого конкретного графического процессора будут адаптированы к задачам, на которые ориентирован конкретный рынок. «Существует большое сходство в архитектуре, но не в конфигурации», — заявил господин Хуанг о разнице между подходами к корпоративным и потребительским продуктам на базе Ampere.

2. Ampere перешла на 7-нм нормы

Как и ожидалось, ускорители NVIDIA Ampere, наконец, используют передовые 7-нм производственные нормы, уходя от старых добрых 12 нм, используемых для Turing и Volta. Это — большой прогресс, который означает рост производительности и энергоэффективности. AMD в видеокартах Radeon RX серии 5000 на базе архитектуры Navi (а ранее и Radeon VII на базе Vega) первой применила 7-нм техпроцесс, это позволило компании значительно повысить эффективность своих решений.

7-нм карты Navi показали превосходство в производительности и эффективности над своими аналогами из стана GeForce, что немаловажно. До этого переход NVIDIA от 28-нм техпроцесса GeForce GTX 900-й серии к 16-нм нормам GTX 10-серии привёл к значительному увеличению показателей производительности на ватт. В общем, практика говорит, что можно ожидать большого прогресса от новых видеокарт GeForce не только благодаря Ampere, но и за счёт передового техпроцесса.

3. На кристалле Ampere умещается много больше ядер

Переход на более компактные транзисторы означает, что на кристалле можно уместить куда больше вычислительных блоков. Графический процессор Volta флагманского ускорителя Tesla V100 состоит из 21,1 млрд транзисторов, которые позволили создать 80 блоков потоковых мультипроцессоров (SM) с 5120 ядрами CUDA на кристалле площадью 815 мм2. В свою очередь новый A100 на базе Ampere вмещает 54 млрд транзисторов, из которых получилось 108 SM или 6912 ядер CUDA в почти идентичном кристалле площадью 826 мм2.

Это большой шаг вперёд: расширенное количество вычислительных блоков означает куда более быстрые видеокарты. Для справки: GeForce RTX 2080 Ti может предложить 4352 ядра CUDA на кристалле 754 мм2. Преемник рискует стать королём по числу потоковых процессоров.

4. Блоки ИИ в Ampere стали более продвинутыми

Volta и Turing представили миру так называемые тензорные ядра. Это особые аппаратные ускорители задач машинного обучения, а в графических процессорах GeForce они обеспечивают работу технологии масштабирования Deep Learning Super Sampling (DLSS) 2.0 и отвечают за подавление шумов при использовании технологии гибридной визуализации с применением трассировки лучей в реальном времени.

В графическом процессоре A100 используются тензорные ядра третьего поколения, которые значительно повышают производительность в задачах с плавающей запятой при половинной точности (FP16), добавляют поддержку нового эффективного формата TF32 (tensor float 32) для вычислений ИИ с одинарной точностью, а также поддерживают задачи двойной точности FP64.

Ещё неизвестно, как тензорные ядра третьего поколения будут развёрнуты в потребительских графических процессорах на базе Ampere, но NVIDIA очень агрессивно продвигает DLSS и машинное обучение, так что видеокарты GeForce следующего поколения наверняка в этой области станут значительно более продвинутыми. Тем более что активное использование трассировки лучей в играх нового поколения потребует и более качественного шумоподавления, и других «интеллектуальных» уловок.

5. Ampere поддерживает PCIe 4.0

NVIDIA не объявила об этом для своей системы DGX-A100, но Supermicro также представила новые системы на базе графического процессора Ampere A100, и анонс подтвердил, что ГП следующего поколения поддерживают передовой интерфейс PCIe 4.0.

В потребительском сегменте процессоры AMD серии Ryzen 3000 стали первыми, которые обеспечили поддержку нового скоростного интерфейса. В видеокартах таковыми стали ускорители AMD Radeon 5700 на базе Navi. Впрочем, они на системах с PCIe 4.0 работают не быстрее, чем через PCIe 3.0: как правило, большинство современных видеокарт ещё не приблизились к исчерпанию полосы пропускания интерфейса PCIe 3.0. Но вот уже GeForce RTX 2080 Ti за $1200 долларов действительно получает заметное повышение производительности при работе через слот PCIe 3.0 x16 вместо PCIe 3.0 x8, то есть этот графический монстр уже приближается к верхним границам возможностей PCIe 3.0 в системах с несколькими ГП.

Преемник GeForce RTX 2080 Ti на базе Ampere будет очевидно гораздо мощнее, так что это может привести к перегрузке соединений PCIe 3.0. Переход на интерфейс PCIe 4.0 позволит обойти эту проблему. Это также приведёт к новому интересному повороту для сборщиков систем. Новейшие процессоры Intel Core 10-го поколения по-прежнему поддерживают лишь PCIe 3.0. И при создании мощных ПК с несколькими видеокартами Ampere, возможно, появится лишний повод присмотреться к AMD Ryzen. К слову, сама NVIDIA в своей системе DGX A100 использует как раз AMD EPYC Rome.

Анонс NVIDIA A100 не смог раскрыть некоторые характеристики, представляющие основной интерес для геймеров: в частности, тактовые частоты Ampere и производительность в области трассировки лучей. Более высокие тактовые частоты означают, как правило, более высокую производительность в играх. Улучшенные специализированные ядра RT могут значительно расширить возможности трассировки лучей графических процессоров GeForce следующего поколения и сделать новые эффекты не столь тяжёлой задачей, особенно в сочетании с усовершенствованными тензорными ядрами. Недавние утечки и слухи говорят о том, что графические процессоры GeForce Ampere будут работать на ещё более высоких частотах, чем GeForce RTX 20, а увеличение скорости трассировки лучей будет четырёхкратным. Однако источник этих утечек не заслуживает особого доверия, так что лучше подождать более надёжной информации.

С учётом подготовки запуска мощного ускорителя Radeon «Big Navi» и впечатляющих консолей следующего поколения, обеспечивающих более высокую производительность и поддержку трассировки лучей для графических процессоров AMD, компания NVIDIA наверняка постарается смазать триумф своего конкурента в ближайшие месяцы.

NVIDIA DGX A100: дебютная платформа на базе Ampere предложила пять петафлопс быстродействия

В состав системы DGX A100, основу которой Дженсен Хуанг (Jen-Hsun Huang) на днях вынимал из духовки, входят восемь графических процессоров A100, шесть коммутаторов NVLink 3.0, девять сетевых контроллеров Mellanox, два процессора AMD EPYC поколения Rome с 64 ядрами, 1 Тбайт оперативной памяти и 15 Тбайт твердотельных накопителей с поддержкой NVMe.

Источник изображения: NVIDIA

Источник изображения: NVIDIA

NVIDIA DGX A100 — это третье поколение вычислительных систем компании, предназначенных в первую очередь для решения задач искусственного интеллекта. Теперь такие системы строятся на самых современных графических процессорах A100 семейства Ampere, что обуславливает резкий рост их производительности, которая достигла 5 петафлопс. Благодаря этому DGX A100 способна обеспечить работу с гораздо более сложными моделями ИИ и с гораздо большими объёмами данных.

Для системы DGX A100 компания NVIDIA указывает только совокупный объём памяти типа HBM2, который достигает 320 Гбайт. Нехитрые арифметические вычисления позволяют определить, что на каждый графический процессор приходится по 40 Гбайт памяти, а изображения новинки позволяют однозначно судить, что этот объём распределён между шестью стеками. Упоминается и пропускная способность графической памяти — 12,4 Тбайт/с для всей системы DGX A100 в совокупности.

Если учесть, что система DGX-1 на базе восьми Tesla V100 выдавала один петафлопс в вычислениях смешанной точности, а для DGX A100 заявлено быстродействие на уровне пяти петафлопс, можно предположить, что в специфических вычислениях один графический процессор Ampere в пять раз быстрее своего предшественника с архитектурой Volta. В отдельных случаях преимущество становится двадцатикратным.

В общей сложности, в целочисленных операциях (INT8) система DGX A100 обеспечивает пиковое быстродействие на уровне 1016 операций в секунду, в операциях с плавающей запятой половинной точности (FP16) — 5 петафлопс, в операциях двойной точности (FP64) — 156 терафлопс. Кроме того, в тензорных вычислениях TF32 пиковое быстродействие DGX A100 достигает 2,5 петафлопс. Напомним, один терафлопс — это 1012 операций с плавающей запятой в секунду, один петафлопс — 1015 операций с плавающей запятой в секунду.

Важной особенностью ускорителей NVIDIA A100 является способность разделять ресурсы одного графического процессора на семь виртуальных сегментов. Это позволяет значительно повысить гибкость конфигурирования в том же облачном сегменте. Например, одна система DGX A100 с восемью физическими графическими процессорами может выступать в качестве 56 виртуальных графических процессоров. Технология Multi-Instance GPU (MIG) позволяет выделить сегменты разной величины как среди вычислительных ядер, так и в составе кеш-памяти и памяти типа HBM2, причём они не будут соперничать друг с другом за пропускную способность.

Источник изображения: NVIDIA

Источник изображения: NVIDIA

Стоит заметить, что по сравнению с прошлыми системами DGX анатомия DGX A100 претерпела некоторые изменения. Количество тепловых трубок в радиаторах модулей SXM3, на которые установлены графические процессоры A100 с памятью HBM2, значительно увеличилось по сравнению с модулями Tesla V100 поколения Volta, хотя их концы и скрыты от взора обывателя верхними накладками. Практический предел для такого конструктивного исполнения — это 400 Вт тепловой энергии. Это же подтверждается и официальными характеристиками A100 в исполнении SXM3, опубликованными сегодня.

Рядом с графическими процессорами A100 на материнской плате разместились шесть коммутаторов интерфейса NVLink третьего поколения, которые в совокупности обеспечивают двухсторонний обмен данными со скоростью 4,8 Тбайт/с. Об их охлаждении NVIDIA тоже серьёзно позаботилась, если судить по полнопрофильным радиаторам с тепловыми трубками. На каждый графический процессор выделено по 12 каналов интерфейса NVLink, соседние графические процессоры могут обмениваться данными со скоростью 600 Гбайт/с.

Система DGX A100 разместила и девять сетевых контроллеров Mellanox ConnectX-6 HDR, способных передавать информацию со скоростью до 200 Гбит/с. В совокупности, DGX A100 обеспечивает двухсторонний обмен данными со скоростью 3,6 Тбайт/с. Система также использует фирменные технологии Mellanox, направленные на эффективное масштабирование вычислительных систем с такой архитектурой. Поддержку PCI Express 4.0 на уровне платформы определяют процессоры AMD EPYC поколения Rome, в итоге этот интерфейс используется не только графическими ускорителями A100, но и твердотельными накопителями с протоколом NVMe.

Источник изображения: NVIDIA

Источник изображения: NVIDIA

Помимо DGX A100, компания NVIDIA начала снабжать своих партнёров платами HGX A100, являющимися одним из компонентов серверных систем, которые прочие производители будут выпускать самостоятельно. На одной плате HGX A100 может находиться либо четыре, либо восемь графических процессоров NVIDIA A100. Кроме того, для собственных нужд NVIDIA уже собрала DGX SuperPOD — кластер из 140 систем DGX A100, обеспечивающий быстродействие на уровне 700 петафлопс при достаточно скромных габаритных размерах. Компания пообещала оказывать методологическую помощь партнёрам, желающим построить похожие вычислительные кластеры на базе DGX A100. К слову, на строительство DGX SuperPOD у NVIDIA ушло не более месяца вместо типичных для подобных задач нескольких месяцев или даже лет.

Источник изображения: NVIDIA

Источник изображения: NVIDIA

По словам NVIDIA, поставки DGX A100 уже начались по цене $199 000 за экземпляр, партнёры компании уже размещают эти системы в своих облачных кластерах, экосистема уже охватывает 26 стран, среди которых упоминаются Вьетнам и ОАЭ. Кроме того, графические решения с архитектурой Ampere вполне предсказуемо войдут в состав суперкомпьютерной системы Perlmutter, создаваемой Cray по заказу Министерства энергетики США. В её составе графические процессоры NVIDIA Ampere будут соседствовать с центральными процессорами AMD EPYC поколения Milan с архитектурой Zen 3. Узлы суперкомпьютера на основе NVIDIA Ampere доберутся до заказчика во втором полугодии, хотя первые экземпляры уже поступили в профильную лабораторию американского ведомства.

AMD представила видеокарту Radeon Pro VII: новая профессиональная жизнь Vega II

Компания AMD представила новую профессиональную видеокарту Radeon Pro VII. Новинка предназначена для решения рабочих задач, связанных с 3D-моделированием, графикой и инженерными расчётами. Позиционируется ускоритель как более доступная альтернатива Quadro RTX 5000 — стоимость Radeon Pro VII составляет $1899. К слову, в продажу Radeon Pro VII поступит в середине следующего месяца.

По сути, перед нами несколько модифицированная версия потребительской видеокарты Radeon VII. Здесь использован тот же 7-нм графический процессор Vega 20, способный предложить 60 вычислительных блоков (3840 потоковых процессоров). Тактовая частота чипа не уточняется, но она будет несколько ниже, нежели у потребительской версии. Уровень энергопотребления составляет 250 Вт.

С процессором на одной подложке расположилось два стека памяти HBM2 общим объёмом 16 Гбайт. Память подключается по 4096-битной шине и обладает пропускной способностью в 1 Тбайт/с. Что важно для профессиональных систем, память здесь поддерживает коррекцию ошибок ECC.

Наиболее значительное отличие новинки от её потребительской предшественницы заключается в производительности в профессиональных задачах. В операциях на числах с плавающей запятой двойной точности (FP64) пиковая производительность Radeon Pro VII достигает 6,5 Тфлопс, тогда как у Radeon VII этот показатель равен 3,46 Тфлопс.

По данному показателю видеокарта AMD способна конкурировать с куда более дорогими решениями NVIDIA. Например, NVIDIA Quadro GP100 на базе Pascal обладает производительностью FP64 всего в 5,16 Тфлопс, тогда как Quadro GV100 способна обеспечить до 7,4 Тфлопс. При этом цена данных ускорителей составляет $7769 и $8999 соответственно.

В операциях одинарной точности (FP32) производительность Radeon Pro VII равна 13,1 Тфлопс, что на 0,7 Тфлопс ниже показателя Radeon VII. Здесь новая видеокарта AMD ощутимо опережает NVIDIA Quadro RTX 5000, у которой производительность FP32 достигает 11,2 Тфлопс. При этом цена последней составляет $2299.

Согласно информации AMD, в реальных задачах Radeon Pro VII также оказывается либо впереди, либо наравне с Quadro RTX 5000. В обработке видео наблюдается значительный перевес в приложениях Nuke и DaVinci. В Adobe After Effects и Photoshop видеокарты оказываются примерно наравне. В ПО для расчётов движения частиц Altair EDEM преимущество новинки AMD составляет 42–68 %.

Ещё важным по мнению AMD отличием профессиональной Radeon Pro VII от потребительской Radeon VII является поддержка интерфейса PCIe 4.0, что увеличивает скорость обмена данными с процессором. К слову, при создании связок из нескольких Radeon Pro VII используются мосты с шиной Infinity Fabric с пропускной способностью 168 Гбайт/с. А для вывода изображения на Radeon Pro VII имеется шесть портов Mini DisplayPort 1.4 с поддержкой разрешений до 8K и расширенного динамического диапазона (HDR).

window-new
Soft
Hard
Тренды 🔥