Теги → nvlink

MSI представила свой собственный мостик NVLink для видеокарт GeForce RTX

В новом поколении видеокарт компания NVIDIA решила отказаться от устаревшего интерфейса SLI и использовать для объединения двух видеокарт GeForce RTX 2080 или RTX 2080 Ti более новый и куда более скоростной разъём NVLink. Правда, для использования нового интерфейса необходимы специальные новые мостики, и многие производители уже представили такие, а теперь их ряды пополнила и компания MSI.

Новый мостик под названием MSI NVLink GPU Bridge выполнен в том же фирменном стиле, что и видеокарты MSI GeForce RTX серий Ventus и Gaming. Как и полагается, новинка оснащена настраиваемой светодиодной RGB-подсветкой Mystic Light. Хотя в списке поддерживаемых видеокарт значатся только модели MSI, новый мостик должен быть совместим абсолютно со всеми моделями GeForce RTX 2080 или RTX 2080 Ti, от любого производителя.

Габариты MSI NVLink GPU Bridge составляют 74,5 × 75,5 × 23,1 мм. Расстояние между разъёмами составляет 60 мм, что соответствует трём слотам расширения, а это означает, что новинка подойдёт даже для довольно крупных видеокарт. Мостик MSI NVLink GPU Bridge в скором времени поступит в продажу, а его рекомендованная цена составит 79 евро, как и у эталонного NVLink-мостика от самой NVIDIA.

Две GeForce RTX 2080 Ti в связке NVLink: комфортный гейминг в 8K стал реальностью

Компания NVIDIA позиционирует видеокарты GeForce RTX 2080 и RTX 2080 Ti в качестве отличных решений для игр в разрешении 4K (3840 × 2160 точек). Независимые тесты подтвердили, что новинки действительно способны справиться с такой задачей. Однако наши коллеги из TweakTown решили выяснить, как новинки покажут себя в ещё более высоком разрешении 8K (7680 × 4320 точек).

Подобные тесты не имеют большого практического значения, потому как дисплеев с разрешением 8K пока что не так много, да и стоят они отнюдь не мало, а потому и пользователей с такими экранами совсем немного. Но всё же интересно узнать, способны ли новинки NVIDIA справиться с задачами, для которых они совсем не предназначены. И сразу ответим, что нет, не могут, в одиночку. А вот парами — вполне.

Как видно на диаграммах, в одиночку видеокарты GeForce RTX 2080 и RTX 2080 Ti не способны обеспечить приемлемый уровень производительности в разрешении 8K. Исключением является только F1 2018. Также связка из двух GeForce RTX 2080 хоть и обеспечивает более высокую производительность, однако достаточной её назвать сложно.

А вот две видеокарты GeForce RTX 2080 Ti, объединив усилия через NVLink, как раз оказались способны обеспечить вполне достаточную частоту кадров в большинстве игр. Однако просадки частоты, конечно же, встречаются. Если же сравнивать пару GeForce RTX 2080 Ti с парой флагманов прошлого поколения, GeForce GTX 1080 Ti, то наблюдается следующая картина:

  • Rise of the Tomb Raider — на 43 % быстрее GeForce GTX 1080 Ti SLI;
  • Shadow of War — на 45 % быстрее GeForce GTX 1080 Ti SLI;
  • Rainbow Six Siege — на 212 % быстрее GeForce GTX 1080 Ti SLI (85 % быстрее GeForce single RTX 2080 Ti);
  • Far Cry 5 — на 23 % быстрее GeForce GTX 1080 Ti SLI;
  • F1 2018 — на 45 % быстрее GeForce GTX 1080 Ti SLI (на 62 % быстрее одной GeForce RTX 2080 Ti);
  • Shadow of the Tomb Raider — на 48 % быстрее GeForce GTX 1080 Ti SLI (на 100 % быстрее одной GeForce RTX 2080 Ti).

Заметим, что тесты проводились на высоких и/или максимальных настройках качества графики, а в качестве основы тестового стенда для всех видеокарт выступал процессор Intel Core i7-8700K, разогнанный до 5 ГГц. 

Напомним, что в новом поколении видеокарт GeForce RTX компания NVIDIA отказалась от традиционного интерфейса SLI и вместо него использовала интерфейс NVLink. Он отличается значительно большей пропускной способностью, нежели SLI, за счёт чего обладает лучшим потенциалом. Заметим, что получили новый интерфейс только старшие GeForce RTX 2080 и RTX 2080 Ti, а вот видеокарта GeForce RTX 2070 данного интерфейса лишена.

Мостик ASUS ROG GeForce RTX NVLink с подсветкой оценён в €89

Компания NVIDIA в новом поколении видеокарт решила отказаться от устаревшего интерфейса SLI и использовать для объединения двух видеокарт GeForce RTX 2080 или RTX 2080 Ti более новый и куда более скоростной NVLink. Для работы нового интерфейса потребуются специальные новые мостики, и компания ASUS уже представила собственное решение такого рода.

Мостик под названием ROG GeForce RTX NVLink выполнен в фирменном стиле Republic of Gamers. Дополняет картину логотип ASUS ROG, оснащённый настраиваемой RGB-подсветкой Aura Sync. Новинка будет хорошо сочетаться с видеокартами ASUS серии ROG Strix, но, конечно же, совместима она абсолютно со всеми видеокартами GeForce RTX 2080 или RTX 2080 Ti, от любого производителя и любой серии.

Габариты новинки составляют 99 × 76 × 26 мм, а доступна она в двух версиях, у которых расстояние между разъёмами составляет два и три слота расширения. Мостик ASUS ROG GeForce RTX NVLink в скором времени поступит в продажу, а его рекомендованная цена составит 89 евро. Заметим, что это на 10 евро дороже, чем NVLink-мостик от самой NVIDIA.

NVIDIA видит большие перспективы интерфейса NVLink в видеокартах GeForce RTX

Видеокарты NVIDIA нового поколения получили массу новых технологий, в том числе и новый для них интерфейс NVLink, предназначенный для создания связок из нескольких графических процессоров. Ранее этот интерфейс применялся только в профессиональных решениях, но теперь он пришёл и к массовому пользователю. Но какими же преимуществами он обладает?

На базовом уровне соединение через NVLink довольно сильно похоже на старый-добрый SLI. Новый интерфейс также использует специальный мостик для объединения видеокарт, через который GPU «общаются» друг с другом и производят совместный рендеринг картинки в играх. Однако в отличие от SLI, интерфейс NVLink имеет куда большую пропускную способность. У GeForce RTX 2080 и RTX 2080 Ti этот показатель составляет 50 и 100 Гбайт/с соответственно, тогда как у видеокарт Pascal с мостиками SLI HB не достигает даже 10 Гбайт/с.

Но хотя NVLink и обеспечивает лучшую пропускную способность, он вряд ли принесёт значительный прирост производительности в актуальных играх с поддержкой SLI. Новый интерфейс скорее является заделом на будущее и даёт некоторую надежду, что в будущем появится больше игр, у которых благодаря использованию связок из двух GPU будет наблюдаться по-настоящему значительный прирост производительности.

Как отметил Том Питерсен (Tom Petersen), директор NVIDIA по техническому маркетингу, с помощью NVLink компания хочет заложить фундамент и мотивировать разработчиков внедрять поддержку связок из двух GPU в свои игры. На самом деле компания не хочет больше использовать альтернативную обработку кадров (AFR), присущую SLI. Вместо этого должно быть создано что-то новое, что позволит разработчикам использовать высокую пропускную способность NVLink, а также преимущества того, что это одноранговый интерфейс (peer-to-peer).

По сути теперь графические процессоры в связке будут «ближе» друг к другу, и это должно позволить разработчикам использовать возможности NVLink для своих игр более элегантным способом, нежели это было со SLI. По словам Питерсена, новый интерфейс открывает возможности для того, чтобы GPU работали вместе, а не по очереди, как это было раньше, ведь новый интерфейс значительно уменьшает латентность соединения GPU-GPU, которая являлась одной из главных проблем соединения через SLI.

Производительность NVIDIA Pascal в режиме FP64 превысит 4 терафлопса

Уже прошедшая Supercomputing Conference ’15 продолжает служить источником весьма интересной информации. На этот раз речь пойдёт об одном из самых амбициозных проектов NVIDIA — архитектуре Pascal и процессорах на её основе. Мы намеренно опускаем эпитет «графический», поскольку видеокарты на базе Pascal, конечно, будут выпущены, но станут лишь побочной ветвью, а основной целью NVIDIA является доминирование на рынке супервычислений (HPC), и с учётом этой цели Pascal и разрабатывается. Кроме того, компания поделилась информацией и о будущем наследнике Pascal, проекте Volta.

Уже известно, что процессоры Pascal будут выпускаться с использованием 16-нм технологических норм, и на SC15 NVIDIA подтвердила использование техпроцесса 16-нм FinFET+. О том, на какой именно фабрике будут производиться новые чипы, компания умолчала, но имя главного контрактного поставщика было названо — TSMC. Неудивительно, ведь первые образцы процессора GP100 были получены именно c помощью вышеупомянутого техпроцесса TSMC. Поэтому не исключен сценарий, в котором мы увидим анонс Pascal уже в первой половине 2016 года. Таким образом, ранние предсказания о том, что выпуском Pascal может заняться и Samsung, не оправдались.

Плотность упаковки транзисторов, как мы уже знаем, удвоена в сравнении с Maxwell GM200, так что Pascal будет состоять из примерно 16 ‒ 17 миллиардов активных элементов. В сравнении с технологией 20SoC, техпроцесс 16FF+ может обеспечить до 40 % прироста производительности и до 60 % выигрыша в уровне энергопотребления, что для таких монстров, как GP100, является очень важным фактором. Итак, пока мы знаем о GP100 следующие факты:

  • Поддержка возможностей DirectX 12 уровня 12_1 или выше;
  • Наследник GM200, будет использован в новых флагманских моделях видеокарт;
  • Производится с использованием техпроцесса TSMC 16-нм FinFET+;
  • Состоит из 16 ‒ 17 миллиардов транзисторов;
  • Впервые получен в кремнии ещё в июне 2015 года;
  • Получит 4 сборки HBM2 4-Hi, объём памяти — 16 Гбайт в потребительской версии, 32 Гбайт в профессиональном варианте;
  • Ширина интерфейса памяти 4096 бит;
  • Получит высокоскоростную шину NVLink;
  • Будет поддерживать вычислительные нагрузки смешанного характера: FP16, 32 и 64;
  • Производительность в режиме FP16 вдвое выше, нежели в режиме FP32, полноценная поддержка FP64;
  • Производительность в режиме FP64 свыше 4 терафлопс (см. вышеприведённую диаграмму);
  • Производительность в режиме FP32 свыше 10 терафлопс.

А в следующем поколении процессоров под кодовым названием Volta NVIDIA планирует достичь цифр в районе 7 терафлопс, что очень впечатляет: новейший 14-нм ускоритель Intel Knight’s Landing развивает в режиме FP64 лишь несколько более 3 терафлопс, а самый мощный на сегодня двухпроцессорный ускоритель NVIDIA Tesla K80 — всего 2,91 терафлопса, да и то в турборежиме.

Volta послужит основой для нового поколения сверхмощных суперкомпьютеров, таких, как Summit Supercomputer (Oak Ridge National Laboratory) и Sierra Supercomputer (Lawrence Livermore National Laboratory). Оба проекта рассчитываются на пиковую производительность более 100 петафлопс и будут включать в себя несколько тысяч узлов производительностью более 40 терафлопс каждый.

Несомненно, процессорам Pascal нужна по-настоящему быстрая шина для обмена данными между собой в многочисленных узлах суперкомпьютера или вычислительного кластера. Такую шину GP100 действительно получит. Первое поколение NVLink будет обладать пропускной способностью 80 Гбайт/с, в будущих реализациях NVIDIA надеется увеличить этот показатель до 200 Гбайт/с. Неплохое добавление к уже имеющимся 1 Тбайт/с в случае обмена данным с памятью HBM2. В NVLink будет воплощена концепция унифицированной виртуальной памяти (UVM) с произвольной адресацией. Поскольку пропускная способность NVLink в 5 ‒ 12 раз превысит аналогичный показатель PCI Express, реализация UVM не станет узким местом.

Даже в случае с обычными мощными видеокартами проблема энергопотребления и тепловыделения стоит довольно остро. Но для разработчиков суперкомпьютеров она, наверняка, является одной из тем ночных кошмаров. Быстрая память таким системам просто необходима, но HBM2 в Pascal и Volta при пропускной способности 1,2 Тбайт/с добавляет целых 60 ватт к энергопакету процессора. Даже HBM1, использующаяся в AMD Fiji, и то добавляет 25 ватт к потреблению ядра. В дальнейшем планируется достичь скоростей в районе 2 Тбайт/с, и тут-то и начинается ужас: пропускная способность HBM2 на уровне 2,5 Тбайт/с обойдётся в 120 ватт на процессор, а при повышении ПСП до 3 Тбайт/с этот показатель увеличится до 160 ватт. Умножьте это на количество процессоров в узле и на количество узлов в суперкомпьютере — и будет понятно, какую цену приходится платить за высокую производительность подсистемы памяти.

В ближней перспективе это приемлемо, поскольку HBM2 является на сегодня оптимальным типом памяти для решений такого рода. Но к 2020 году, с появлением новых, ещё более производительных процессорных архитектур, кризис энергопотребления многослойной памяти может обостриться до предела. NVIDIA это понимает, поэтому, по всей видимости, уже ведёт исследования в области создания новой, высокопроизводительной, но при этом экономичной архитектуры памяти. Какой она будет, сейчас сказать крайне сложно. Даже в общих чертах неясно, как сохранить скорости в районе единиц или даже десятков терабайт в секунду и удержать при этом уровень энергопотребления в мало-мальски приемлемых рамках.

Итак, новая архитектура Pascal и первый процессор на её основе, GP100, появится в 2016 году, что официально подтверждено NVIDIA. Насчёт первой половины года заявлений нет, но с учётом всех вышеперечисленных факторов вероятность раннего анонса Pascal довольно высока. Компания также заявила о поддержке широкого спектра платформ — x86, ARM и IBM Power. Для рынка HPC будут выпущены модули Pascal с поддержкой NVLink, в то время, как классические графические карты и серверные ускорители сохранят привычный форм-фактор PCI Express c пропускной способностью до 16 Гбайт/с. Посмотрим, каков будет ответ AMD: её новая «тяжёлая артиллерия» под кодовым названием Arctic Islands, базирующаяся на техпроцессе Global Foundries 14FF и новой версии архитектуры GCN, обещает стать серьёзным соперником Pascal.

Процессор NVIDIA Pascal GP100 получит 4096-битную шину памяти и память HBM2 8-Hi

Пропускная способность подсистемы видеопамяти — одна из важнейших характеристик современных графических систем, поскольку от неё во многом зависит производительность в высоких разрешениях, что особенно актуально ввиду роста популярности формата 4K. Очевидно, что память типа GDDR5 уже исчерпала свой потенциал, но пути к дальнейшему росту этого показателя есть, как это продемонстрировала AMD, применив в новом графическом процессоре Fury многослойную память типа HBM с 4096-битным доступом (1024 бита на сборку). А сейчас стали известны некоторые детали о новом ядре следующего поколения, разрабатываемом NVIDIA.

Как сообщают зарубежные источники, чип под кодовым названием GP100, основанный на микроархитектуре Pascal, также получит 4096-битную шину видеопамяти и будет укомплектован четырьмя сборками HBM2. В первой версии Pascal эти сборки будут четырёхслойными (4-Hi), но затем планируется использование и более совершенных и ёмких сборок с восемью слоями DRAM (8-Hi). В обоих вариантах частота, на которой функционирует видеопамять, составит привычные 500 (1000) МГц. Если верить сегодняшним прогнозам, дорогие и более ёмкие восьмислойные сборки HBM2 будут устанавливаться только на профессиональные решения классов Quadro и Tesla, в то время как игровые карты серии GeForce продолжат довольствоваться сборками 4-Hi. Но поводов для беспокойства нет, поскольку даже в последнем случае максимально возможный объем видеопамяти составит 16 Гбайт.

Что касается самого чипа GP100, то он будет производиться с использованием 16-нанометрового техпроцесса FinFET+ на мощностях крупнейшего контрактного производителя, компании TSMC. Более того, известно, что опытные, но при этом функционирующие образцы чипов Pascal уже получены и находятся в лабораториях NVIDIA. В этом плане NVIDIA несколько опережает AMD, которая до сих пор не решила, будет ли новое поколение графических процессоров Arctic Islands производиться с использованием 16-нанометрового техпроцесса TSMC или же 14-нанометрового процесса Samsung. Правда, при этом следует учесть, что AMD, благодаря соглашению с SK Hynix, первой получит доступ к массовым поставкам чипов HBM2.

Если архитектура Maxwell не слишком хорошо подходит для вычислений вследствие слабой производительности при расчётах двойной точности (FP64), то Pascal, судя по всему, готовится NVIDIA и в качестве мощного вычислительного решения. Об этом говорит поддержка нового межчипового интерфейса NVLink, который обещает в 5–12 раз превзойти PCI Express 3.0 по производительности, а значит, устранить узкое место в многопроцессорных вычислительных системах на базе Pascal. IBM уже поддержала данную инициативу и собирается интегрировать NVLink в будущее поколение серверных процессоров PowerPC.

NVIDIA представила GeForce GTX TITAN Z и следующую за Maxwell архитектуру Pascal

Во время мероприятия NVIDIA GPU Technology Conference исполнительный директор NVIDIA Дженсен Хуанг (Jen-Hsun Huang) представил игровой графический ускоритель, созданный с прицелом на энтузиастов, желающих получить максимальное качество и производительность. Речь идёт о видеокарте GeForce GTX TITAN Z, которая, по словам производителя, создана с прицелом на игры следующего поколения в разрешениях 5K и на нескольких мониторах.

Ускоритель построен на двух мощных ядрах GK110 на базе архитектуры Kepler и в совокупности наделён 12 Гбайт графической памяти GDDR5 с эффективной частотой 7 ГГц. Каждое ядро может предложить 2880 потоковых процессоров, что в сумме даёт 5760 потоковых процессоров. «Если вы отчаянно нуждаетесь в суперкомпьютере рядом с вашим рабочим столом, у нас есть то, что вам нужно», — прокомментировал анонс господин Хуанг.

Как отмечает производитель, двойной флагман создан специально с тем, чтобы чипы работали в идеальной гармонии с точки зрения производительности и динамического управления энергопотреблением. К сожалению, более подробных технических характеристик компания пока не сообщает.

NVIDIA особо гордится тем, что видеокарта GeForce GTX TITAN Z, способная обеспечить теоретическую производительность на уровне до 8 терафлопс, остаётся тихой и холодной, а не горячей и шумной. Низкопрофильные компоненты и направленные каналы охлаждения спроектированы, чтобы минимизировать турбулентность и улучшить акустические показатели системы охлаждения. Хотя ускоритель выполнен в трёхслотовом дизайне, он использует только один вентилятор. Компания даже создала рекламный ролик, в котором два одночиповых флагманских ускорителя объединяются в одну мощную карту:

NVIDIA подчёркивает, что для игроков, желающих создать идеальную систему для игр нового поколения в разрешениях UltraHD и выше (и очевидно не ограниченных бюджетом), покупка двух ускорителей GeForce GTX TITAN Z с рекомендованной ценой в $3000 каждый является отличным выбором. С живыми снимками ускорителя можно ознакомиться в материале нашего сотрудника, побывавшего на презентации.

Как известно, первые ускорители NVIDIA на базе архитектуры Maxwell увидели свет, но компания уже готова продемонстрировать ранние чипы на основе следующей архитектуры Pascal. На конференции NVIDIA GPU Technology Conference, Дженсен Хуанг показал один из ранних рабочих прототипов на основе GPU семейства Pascal. Плата весьма компактна и по площади чуть больше двух кредитных карт. NVIDIA отмечает, что благодаря новшествам Pascal стало возможным создание модуля, размеры которого в три раза меньше, чем у современных аналогичных решений.

Эта графическая архитектура, названная по традиции в честь французского математика XVII века Блеза Паскаля, ляжет в основу ускорителей NVIDIA следующего поколения, которые начнут появляться на рынке в 2016 году. Архитектура принесёт три ключевых новшества: многослойную память DRAM (Stacked Memory), унифицированный доступ к памяти и шину NVLink.

О технологии многослойной памяти DRAM (Stacked Memory) мы уже слышали на NVIDIA GTC 2013, когда NVIDIA впервые рассказывала об архитектуре Volta, которая теперь трансформировалась в Pascal. Идея заключается в том, чтобы помещать чипы памяти в плотные многослойные модули, размещённые при этом в одной упаковке с графическим чипом. Это позволит ускорить обмен данными с GPU, увеличив пропускную способностью и эффективность работы, даст возможность создавать более компактные ускорители (что особенно актуально для мобильных устройств) и повысить энергоэффективность. Согласно оценкам NVIDIA, технология позволяет повысить пропускную способность в несколько раз, удвоить объём памяти и вчетверо повысить её энергоэффективность.

Технология унифицированного доступа к памяти уже продвигается компанией AMD в своих однокристальных системах: она позволяет создавать приложения, лучше использующие сильные стороны GPU и CPU за счёт того, что CPU может обращаться напрямую к тем же участкам памяти, что и GPU. Это позволяет добиться нового уровня эффективности вычислений (особенно в расчётах GPGPU).

Технология NVLink — это шина NVIDIA, позволяющая принципиально ускорить обмен данными между CPU и GPU (или между несколькими GPU в конфигурациях с несколькими графическими ускорителями). Компания сообщает, что её технология обеспечивает обмен на скорости более чем 80 Гбайт в секунду против доступных сегодня 16 Гбайт/с. При этом NVLink, по словам компании, вдвое энергоэффективнее PCIe 3.0. Впрочем, технология должна поддерживаться не только видеокартой, но и процессором — посмотрим, как NVIDIA собирается решить эту проблему. Возможно, NVLink, прежде всего, будет применяться в чипах Tegra. При желании можно ознакомиться с фотографиями, снятыми нашим сотрудником во время презентации.

window-new
Soft
Hard
Тренды 🔥