Сегодня 23 февраля 2017
18+
Теги → графические процессоры
Быстрый переход

Известен аппаратный идентификатор первого чипа NVIDIA Volta

Архитектура NVIDIA Volta, которая должна прийти на смену Pascal, окружена завесой тайны. О ней пока известно не очень много: предположительно, первые чипы выйдут уже в этом году, они будут использовать 12-нм техпроцесс и память типа HBM2. Похоже, первое предположение близко к истине и NVIDIA действительно спешит с запуском GV100.

Дело в том, что в последней версии популярной утилиты AIDA64 обнаружился аппаратный идентификатор 1D81. Описывается он как «Graphics Device [GV100]», а значит, принадлежит первому графическому процессору NVIDIA на базе архитектуры Volta. Опытные образцы новых ГП уже вполне могут существовать в кремнии и находиться в руках не только NVIDIA, но и её партнёров. Дебютирует новинка либо в виде аналога TITAN, либо в виде вычислительного ускорителя для рынка HPC, как это случилось с GP100.

Некоторые источники сомневаются в возможности использования 12-нм техпроцесса и вполне может оказаться, что самые первые GV100 будут выпущены с использованием уже отработанной и отлично показавшей себя в случае с Pascal 16-нм технологией FinFET. А вот чего мы не увидим в ближайшее время точно — так это чипов Volta на базе 7-нм техпроцесса. Первые изделия на его основе появятся лишь во второй половине следующего года, среди них называется чип AMD Vega 20.

Графические решения на базе AMD Vega появятся во втором квартале

В последних финансовых отчётах корпорация Advanced Micro Devices подтвердила, что графические карты на базе архитектуры Vega увидят свет во втором квартале текущего года. Уже ранее было известно, что Vega — продукт «первого полугодия», но именно к этому периоду и относится второй квартал. В отчёте за 2016 год прямым текстом сказано следующее:

«AMD представила предварительные данные о будущей архитектуре графических процессоров Vega, предназначенных для использования в наиболее серьёзных сценариях нагрузки, как графических, так и сценариях обработки данных. Ключевые архитектурные нововведения включают в себя новую дифференцированную подсистему памяти (вероятно, имеется в виду продвинутое кеширование HBCC), геометрический и вычислительный движки нового поколения, а также новый пиксельный движок. Начало поставок продуктов на базе архитектуры Vega ожидается во втором квартале 2017 года».

Продвинутая подсистема памяти в Vega

Продвинутая подсистема памяти в Vega

Увы, тем, кто надеялся на покупку карты с чипом Vega 10 в феврале или марте, придётся подождать ещё, но AMD никогда напрямую и не говорила о том, что планирует выпустить Vega в первом квартале этого года. Ожидания основывались на слухах и опыте с агрессивно рекламируемой архитектурой Polaris, которая воплотилась в кремнии довольно быстро, в течение нескольких месяцев.

Финансовые результаты AMD: 7 % годового прироста, 15 % квартального в сравнении с 2015 годом

Финансовые результаты AMD: 7 % годового прироста, 15 % квартального в сравнении с 2015 годом

Следует ожидать, что видеокарты на базе Vega будут выпущены в мае или июне в серии Radeon 500, в которую, возможно, войдут и некоторые недорогие модели на базе Polaris — это типичная практика AMD и NVIDIA, когда старый чип получает новый цифровой индекс, дабы не создавать путаницы на рынке. Упоминался и адаптер Radeon RX 490. Пока неясно, чьим наследником станет Vega 10 — Fury X или скорее Radeon R9 390X. А весь первый квартал 2017 года AMD явно намеревается посвятить продвижению новой процессорной архитектуры Ryzen, чьё появление на рынке ожидается в конце февраля или начале марта.

AMD Radeon Pro Duo дешевеет: самую быструю карту AMD можно приобрести за $800

Изначально двухпроцессорная графическая карта на базе процессоров AMD Fiji была разработана для установки в рабочие станции разработчиков VR-приложений и тех, кто работает над внедрением API DirectX 12, в том числе и в плане поддержки новых, более эффективных методов использования нескольких графических процессоров. Отсюда и название — Radeon Pro Duo. Стоимость этого монстра была под стать его характеристикам на момент анонса: $1500 не выглядело чрезмерной суммой для профессиональной карты с 8192 потоковыми процессорами GCN 1.2 и 8 Гбайт самой передовой на тот момент памяти HBM с совокупной пропускной способностью 1024 Гбайт/с.

Благодаря использованию HBM, плата Radeon Pro Duo относительно проста

Благодаря использованию HBM плата Radeon Pro Duo относительно проста

Мы не знаем, в каких объёмах продавался Radeon Pro Duo, но в соответствующем секторе, упомянутом выше, он явно нашёл своё применение: о Polaris ходили только слухи, а Vega вообще представлялась как нечто далёкое, подобно оригинальной звезде, давшей название архитектуре. Несмотря на мощность в районе 16,4 Тфлопс на вычислениях одинарной точности, Radeon Pro Duo обходился довольно скромной системой жидкостного охлаждения, практически такой же, какая была использована и в AMD Fury X, благо разработчикам удалось уложиться в 350-ваттный теплопакет. Это было лучшее из того, что могла предложить AMD в плане игровой и профессиональной графики на тот момент. Radeon Pro Duo в полтора раза опережал тогдашнего флагмана NVIDIA, GeForce GTX Titan X.

Но сегодня на рынке уже имеется масса решений на базе Polaris 10, и довольно скоро свет должно увидеть ещё более совершенное поколение видеокарт, в основе которых будет лежать архитектура Vega. В этом поколении HBM2 сменит HBM первого поколения, а также будет реализована масса нововведений, включая оптимизации конвейера ГП для более эффективной многопоточности, а также специальную систему кеширования, позволяющую использовать видеопамять более эффективно. Неудивительно, что интерес к Radeon Pro Duo и серии Fury в целом стал угасать. Партнёры AMD, стремясь распродать имеющиеся запасы карт, прибегли к испытанному методу — снизили цену, и теперь этого монстра можно приобрести всего за $800; впрочем, в зависимости от магазина и региона, скидки могут варьироваться в пределах 31‒46 %. Однопроцессорный вариант, Fury X, также можно встретить с ценником, близким к $300. Если вам явно не по карману будущая Vega 10, это неплохой шанс приобрести достаточно мощную игровую видеокарту с отличной производительностью в DirectX 12, Mantle и Vulkan.

Графические процессоры AMD Vega имеют продвинутую систему кеширования

Попытка выйти за пределы, диктуемые объёмом локальной видеопамяти, не нова — ещё в эпоху становления шины AGP, разработанной компанией Intel, в неё были заложены такие технологии, как DMA и DME, последняя из которых позволяла графическому процессору работать в общем адресном пространстве для локальной и системной памяти. Существовал даже чип, а точнее, целая серия чипов, родоначальником которой является Intel i740, для которой способ хранения текстур в системной памяти ПК был единственным. Но даже в режиме AGP 8x пропускная способность составляла всего 2 Гбайт/с, чего очень быстро стало недостаточно для 3D-графики. Позднее похожий подход использовали некоторые малобюджетные решения NVIDIA, но скорости доступа к локальной видеопамяти уже выросли настолько, что сделали саму затею бессмысленной.

Как оказалось, сама идея не умерла; более того, AMD воплотила её в кремнии в новых графических процессорах Vega и назвала High Bandwidth Cache. На блок-схеме всё выглядит логично; к тому же можно вспомнить NVIDIA с её шиной NVLink, которая, по сути, служит той же цели. Но пропускная способность NVLink составляет 80 Гбайт/с, а у наиболее распространённого сегодня варианта PCI Express версии 3.0 она лишь приближается к 16 Гбайт/с. Таким образом, эффективность использования системной памяти в связке с куда более быстрой памятью на борту современных графических ускорителей находится под вопросом, но у AMD есть за пазухой любопытное решение, позволяющее обойти данное ограничение. Глава подразделения Radeon Technologies Group компании AMD Раджа Кодури (Raja Koduri) заявил, что подавляющее большинство современных игр, охочих до объёма видеопамяти (в качестве примера приведены The Witcher 3 и Fallout 4 в режиме 4K), используют захваченную память чрезвычайно неэффективно — порой в процессе рендеринга задействуется лишь половина объёма, а вторая занимается «на всякий случай».

И разработчики игр, ориентирующиеся на охват как можно более широкого ассортимента графических процессоров, вынуждены поступать так, поскольку перемещение больших массивов данных из видеопамяти и обратно очень негативно отражается на конечной производительности. По сути, они вынуждены страховаться, резервируя дополнительный объём видеопамяти под своеобразный кеш. В состав Vega же входит новый контроллер памяти под названием HBCC (High Bandwidth Cache Controller). Его логика работы чем-то похожа на технологию «умных предсказаний», реализованную в Zen: он способен подгружать в быструю набортную память HBM2 только действительно нужные данные. По словам Кодури, выиграть от этого могут даже уже имеющиеся игры, например, при процедуре переключения задач в ОС, когда игроку нужно переключиться в браузер и обратно — такое действие будет выполняться гораздо быстрее. В теории основная игровая конфигурация Vega 10 с 8 Гбайт HBM2 на борту сможет работать, как будто она оснащена 16 Гбайт памяти, но насколько технология HBC будет эффективна на практике, покажет тестирование в современных играх. Ждать осталось не так уж долго: рабочие карты на базе Vega 10 уже были продемонстрированы публике, а официального их появления стоит ожидать в течение первого полугодия.

GeForce GTX 1080 Ti может быть анонсирована 10 марта на PAX East

В этом году многие поклонники бренда NVIDIA GeForce с нетерпением ждали открытия в Лас-Вегасе ежегодной выставки CES, на которой, по их мнению, компания должна была представить новую флагманскую видеокарту — GeForce GTX 1080 Ti. Но, как мы уже знаем, этого события не произошло и ряд энтузиастов высказал по этому поводу разочарование. Их чувства можно понять, ведь признаков того, что AMD продемонстрирует архитектуру Vega в действии, тоже не было, однако это произошло, пусть показанные образцы карт и были задрапированы наглухо от любопытных взглядов. Несмотря на это, новинки на базе Vega 10 успешно показывали запуск нового Doom в режиме Vulkan с производительностью свыше 60 кадров в секунду в разрешении 4К.

Но всё это не означает отказа «зелёных» от выпуска GeForce GTX 1080 Ti. Напротив, можно счесть шаг NVIDIA частью стратегии: предоставить первый ход оппоненту, вынуждая показать его не отлаженные до конца прототипы новых графических карт, и одновременно получить дополнительное время для доводки своего нового флагмана, пока GeForce GTX 1080 продолжает удерживать титул «самой быстрой игровой карты». К тому же ранний анонс GeForce GTX 1080 Ti мог бы негативно сказаться на продажах флагмана в секторе HEDT —  TITAN X Pascal. Этот монстр успел побывать в нашей тестовой лаборатории и успешно доказал своё первенство, хотя «рубашка теплопакета» в 250 ватт оказалась ему тесноватой.

Zauba.com: возможно, речь о прототипах GeForce GTX 1080 Ti

Zauba.com: возможно, речь о прототипах GeForce GTX 1080 Ti

Как сообщают источники, близкие к NVIDIA, анонс GeForce GTX 1080 Ti может состояться на следующем крупном всемирном мероприятии в IT-сфере — выставке PAX East 2017. Penny Arcade Expo (PAX) является серией игровых мероприятий, проходящих в Сиэтле, Бостоне, Мельбурне и Сан-Антонио, в этом году PAX East начнётся 10-го и окончится 12 марта. За это время все партнёры NVIDIA успеют подготовиться к выпуску своих вариантов GeForce GTX 1080 Ti и приобрести такие модели видеокарт можно будет с первого же дня официального начала продаж. Точных характеристик GeForce GTX 1080 Ti до сих пор не знает никто. Существуют лишь неофициальные данные, гласящие об использовании чипа GP102 с количеством активных процессоров CUDA от 3072 до 3584, дополненного 10 Гбайт видеопамяти типа GDDR5X. Вариант с полной конфигурацией ядра маловероятен, поскольку явно повредит продажам TITAN X Pascal.

В поисках идеала HTPC: GIGABYTE представила компактные версии GeForce GTX 1050

Типичная система класса HTPC должна выглядеть соответствующим образом: обычно для постройки таких систем энтузиасты приобретают корпуса, своим обликом напоминающие аппаратуру класса Hi-Fi: такой корпус не стыдно разместить в гостиной в одной стойке с проигрывателем Blu-ray, ресивером и прочей аудио- и видеотехникой. Но от современной системы HTPC требуется поддержка аппаратного декодирования новейших форматов видео высокого разрешения, таких как H.265 (HEVC), а корпуса этого класса часто ограничивают владельца в выборе видеокарты, поскольку по габаритам способны вместить в себя только низкопрофильные модели.

На помощь пришла компания GIGABYTE, без каких-либо громких анонсов представившая новые низкопрофильные модели видеокарт GeForce GTX 1050 и GeForce GTX 1050 Ti. На сегодняшний день эти модели NVIDIA относятся к самым доступным видеокартам игрового класса, а с точки зрения владельца домашнего кинотеатра они близки к идеальному решению, поскольку поддерживают стандарт HDMI 2.0b. Пригодятся они не только энтузиастам HTPC, но и владельцам недорогих готовых OEM-систем в качестве недорогой опции модернизации графической подсистемы, которая изначально представлена лишь интегрированной графикой Intel либо AMD. Новинки в лице GIGABYTE GeForce GTX 1050 Ti OC Low Profile 4G и GeForce GTX 1050 OC Low Profile 2G используют графическое ядро GP107 в разных конфигурациях и несут на борту 4 или 2 Гбайт видеопамяти GDDR5 с эквивалентной частотой 7 ГГц соответственно.

Они используют единый дизайн печатной платы с маркировкой V16156-0 и оснащаются компактной двухслотовой системой охлаждения. Благодаря экономичности GP107 проектировщикам удалось обойтись скромным алюминиевым радиатором и небольшим вентилятором. Набор видеоинтерфейсов у новинок одинаков и включает себя один двухканальный порт DVI-D, два порта HDMI 2.0b и разъём DisplayPort 1.4. Поддерживается технология HDCP 2.2, необходимая для проигрывания фильмов в формате Ultra HD Blu-ray. Стоит заметить, что даже в столь скромных видеокартах GIGABYTE применила заводской разгон. При этом уровень энергопотребления удалось сохранить в пределах 75 ватт и подключения дополнительного питания новые компактные видеокарты не требуют — достаточно мощности, обеспечиваемой силовой частью разъёма PCI Express.

На производительность при декодировании видео это не окажет видимого невооружённым глазом эффекта, зато может пригодиться при запуске игр. GIGABYTE не стала пионером в этой области: первой компанией, выпустившей низкопрофильные версии карт на базе GP107, является MSI. По всей вероятности, за ними последуют и другие производители графических решений. Напомним, что GP107 является полноценным представителем семейства Pascal и поддерживает все новейшие стандарты 3D-графики, включая DirectX 12 и Vulkan. Видеодекодер GP107 реализует в себе самый полный набор функций (VDAPU feature set H), позволяющий аппаратно воспроизводить видеопотоки в формате H.265/HEVC с разрешениями вплоть до 8192 × 8192. Цена новинок не объявлена, но вряд ли она будет намного выше установленных NVIDIA рекомендованных цен: $139 за GeForce GTX 1050 Ti и $109 за GeForce GTX 1050.

CES 2017: замечен графический адаптер AMD Radeon RX 560M

В преддверии появления графических карт AMD, базирующихся на следующей за Polaris технологией Vega, большинство новостей, касающихся разработки GPU, посвящены либо этой архитектуре, либо NVIDIA Volta. На CES 2017 была замечена любопытная новинка, косвенно относящаяся к данной теме. Компания Lenovo представила свой новый игровой ноутбук Y520, который может оснащаться различной дискретной графикой в зависимости от предпочтений покупателя.

В этом не было бы ничего необычного: в списке фигурируют такие опции, как NVIDIA GeForce GTX 1050 и 1050 Ti, но обнаружилась в нём и необычная модель под названием Radeon RX 560M, оснащённая 4 Гбайт видеопамяти — по всей видимости, GDDR5. Что это, ошибка со стороны Lenovo, случайная публикация закрытых данных, относящихся к решениям на базе AMD Vega, или же обычная для разработчиков графических чипов политика переименования продуктов для унификации названий в серии?

Ответа на этот вопрос нет, здесь можно оперировать лишь вероятностями. Наименее вероятен сценарий с Vega, поскольку о такой карте AMD не проронила ни слова, а наиболее вероятно, что речь идёт о переименовании RX 460M. Не исключён, правда, и ещё один сценарий: в новой системе Lenovo найдёт место графический процессор Polaris 12. Это название уже было замечено в исходных кодах драйвера amdgpu для Linux и, по всей видимости, речь идёт об обновлённой версии Polaris 11 — более экономичной и с повышенным частотным потенциалом. Аналогичным образом некогда поступила NVIDIA, выпустив обновлённую версию процессора GF100 (GeForce GTX 480) под именем GF110 (GeForce GTX 580).

CES 2017: Графический процессор Vega 10 запечатлён на фото

Главными героями в новостных ресурсах, посвящённых компьютерным технологиям, сегодня являются Intel Kaby Lake, AMD Ryzen и AMD Vega. Если с первым всё ясно и процессоры Intel 7 поколения имеют практически ту же производительность, что и Skylake, то любая информация, касающаяся Ryzen или Vega, неизменно вызывает ажиотаж. Так, подтвердилось, что процессоры AMD Ryzen SR7 уже способны работать с частотной формулой 3,6/3,9 ГГц, а в серию пойдёт новый степпинг, для которого родной будет формула 3,6/4,0 или 3,7/4,0 ГГц. С учётом сравнительно демократичной цены Ryzen SR7 станет очень серьёзным соперником для процессоров Intel класса HEDT, таких как Core i7-6900K.

А тем, кто интересуется игровой графикой, интересно будет взглянуть на свежие снимки чипа AMD Vega. Выглядит будущее сердце серии Radeon RX 500 весьма любопытно. Мы привыкли, что первый в мире графический процессор с памятью HBM, AMD Fiji, имел конфигурацию «кристалл ГП в центре, четыре сборки HBM по периметру»; NVIDIA GP100 выглядит аналогично. А вот внешность Vega весьма непривычна: сборок HBM2 здесь всего две и расположены они сбоку от основного кристалла. При этом проклятие Fiji, ограниченный значением 4 Гбайт объём видеопамяти, успешно преодолено — несмотря на меньшее количество сборок, у Vega 10 этот параметр равен 8 Гбайт. Для современных игр такой объём уже стал стандартом де-факто.

А вот пиковая пропускная способность памяти осталась прежней и составляет 512 Гбайт/с. У Fiji она была такой же, но потенциал не был задействован полностью из-за наличия в составе чипа всего 64 блока растровых операций (RBE). Vega этим недостатком не страдает и сможет нагрузить подсистему видеопамяти полностью. Подход AMD выглядит логичным: HBM2 имеет вдвое более высокую пропускную способность, нежели HBM1 при более высокой ёмкости, поэтому оказалось возможным сохранить имеющийся потенциал пропускной способности, установив всего два многослойных кристалла вместо четырёх. Память типа HBM дорога в производстве и использование всего двух сборок явно положительно сказалось на себестоимости Vega.

С учётом того, что площадь кристалла одной сборки HBM2 составляет 92 квадратных миллиметра против всего 35 квадратных миллиметров у HBM1, такая экономия выглядит более чем оправданной. Площадь основного кристалла ГП воображения не поражает, но она, как минимум, не меньше площади кристалла Fiji и составляет по разным оценкам от 530 до 560 квадратных миллиметров. Тем не менее, это свидетельствует о чудовищной сложности нового чипа, ведь при аналогичной (596 мм2) площади Fiji использовал 28-нм техпроцесс, так что Vega 10 претендует на звание самой сложной микросхемы, выполненной с использованием технологии 14-нм FinFET. Здесь, как и с Ryzen, AMD доказывает, что способна быть лидером в области новейших компьютерных технологий.

О производительности нового ГП AMD говорить ещё рано, но демонстрационные системы, оснащённые прототипами Radeon RX 500, с запущенным Doom демонстрируют производительность в районе между GeForce GTX 1080 и GeForce GTX 1070. Это несколько разочаровывает, но лишь на первый взгляд. Во-первых, речь идёт о прототипах, а во-вторых, как сообщают зарубежные источники, все вентиляционные отверстия демонстрационных систем на базе Vega были тщательно заклеены и закрыты от любопытных взглядов, так что графические карты, вероятно, работали в невероятно тяжёлых термальных условиях. В этом случае не исключен троттлинг или намеренное использование пониженных частот во избежание необратимого повреждения демонстрируемых образцов, имеющих огромную ценность.

Видеокарты Radeon на базе Vega будут использовать разные типы памяти

Совсем недавно мы рассказывали читателям о демонстрации прототипа устройства под названием «Куб Кодури», который в рабочем варианте должен развивать производительность порядка 50 терафлопс на операциях одинарной точности. Пока это лишь прототип, но уже видно, что базироваться он будет на чипах Vega с использованием памяти HBM2. Но получат ли игровые версии Vega новую память или дело, как в случае с NVIDIA, ограничится GDDR5X? Как сообщают зарубежные источники, Radeon Technologies Group готовит новую серию карт на базе архитектуры Vega, которая будет покрывать все сегменты рынка, от бюджетного до элитного. Теоретически её можно называть Radeon 500.

Ранее Роберт Халлок (Robert Hallock), глава отдела технического маркетинга Radeon Technologies Group, подтвердил, что архитектура GCN совместима как с HBM, так и с GDDR5X; подтверждение тому существует в металле —  графические процессоры Fiji используют именно HBM, пусть и первого поколения. Нет никаких причин считать, что в случае с Vega будет иначе. Более того, использование HBM2 в старших моделях Vega подтверждено. Опытный образец, оснащённый 8 Гбайт такой памяти, уже успел обойти на 10 % GeForce GTX 1080 в новом Doom, запускаемом в режиме использования API Vulkan в разрешении 4К. Менее мощные модели Vega будут довольствоваться GDDR5X и GDDR5.

Внутреннее строение потоковых процессоров Vega

Внутреннее строение потоковых процессоров Vega

Самое интересное в архитектуре Vega — это существенные изменения в архитектуре самих потоковых процессоров. Текущее воплощение GCN использует процессоры с четырьмя 16-потоковыми векторными блоками SIMD, которые способны исполнять «волны» (wave, группы потоков) шириной 16 за четыре такта; кроме того, имеется один блок скалярных вычислений, исполняющий одну инструкцию за такт. Все блоки SIMD работают синхронно, вне зависимости от «ширины» «волн», что снижает эффективность архитектуры в целом. В случае «волны» шириной 4 потока 12 ALU будут просто простаивать. В новой версии GCN, воплощённой в Vega, данный недостаток будет искоренён: новая архитектура получит более умные планировщики и подсистемы когерентности, что позволит исполнять «волны» разной «ширины» максимально эффективно, без простоя ALU. Осталось лишь выяснить, насколько хорошо эти усовершенствования покажут себя на практике.

AMD отключила поддержку асинхронных вычислений для первого поколения GCN

Разработчикам графических процессоров трудно поддерживать несколько технологий одновременно, особенно если таких технологий накопился целый зоопарк. Никто не станет упрекать AMD или NVIDIA в отсутствии поддержки для карт с архитектурами VLIW4/5 или GeForce FX. Но иногда компании любят рубить с плеча: так, владельцы карт NVIDIA на базе предыдущих поколений, Maxwell и Kepler, сообщают, что в новых драйверах заметна тенденция к снижению общего уровня производительности таких решений. Увы, не избежала подобной печальной участи и AMD. Решение вынужденное, поскольку технологии со времён первых чипов с поддержкой GCN успели уйти вперёд, но последствия его вряд ли можно назвать приятными для владельцев таких карт.

Принцип работы асинхронного конвейера в Radeon

Принцип работы асинхронного конвейера в Radeon

Как сообщают зарубежные источники, начиная с версии драйверов Crimson 16.9.2, выпущенной в сентябре этого года, поддержка асинхронных вычислений — то, чем так гордится разработчик архитектуры GCN — доступна не всем картам на основе данной архитектуры. Графические процессоры с реализацией GCN первого поколения (1.0), такие как Oland, Tahiti, Pitcairn и Cape Verde, остались без поддержки асинхронных вычислений. Сама возможность, конечно, не делась никуда, поскольку предусмотрена аппаратно, но программно она более не поддерживается. Под удар попали самые разнообразные карты, в том числе и игровые — Radeon HD 7850 и Radeon HD 7970, а также двухпроцессорный Radeon HD 7990. Более поздних процессоров, таких как Hawaii  (Radeon R9 290/390), эта проблема не касается, поскольку в них реализована более новая версия GCN 1.1.

Прощайте, южные острова...

Прощайте, южные острова...

Что самое печальное, под ударом автоматически оказались и владельцы переименнованных версий Radeon на базе первого поколения GCN, в частности, Radeon R9 280X (Tahiti) и ряд других. Впрочем, последнее пока не подтверждено, в драйверах вполне может быть программная подсистема, считывающая название видеоадаптера, и в зависимости от совпадения с заложенными шаблонами отключающая поддержку асинхронных вычислений. AMD оправдывает то, что первое поколение движков, обеспечивающих асинхронные вычисления, не полностью совместимо с современными играми, в частности, в новом Tomb Raider эта функция не работает. Блоки GCN1 ACE не столь эффективны, как в более поздних версиях, и оптимизировать игры с учётом их использования становится всё сложнее, ведь тому же Tahiti 9 января 2017 года исполнится пять лет.

Анонсировано новое семейство мобильной графики AMD Radeon Pro 400

Компания AMD официально анонсировала новую серию экономичной, но производительной дискретной графики, предназначенной для установки в ноутбуки класса «переносная рабочая станция». Общее название семейства — Radeon Pro 400. И данный анонс нельзя отнести к категории бумажных: новинка уже успела дебютировать в новой 15-дюймовой модели Apple MacBook Pro. Ноутбуки Apple с приставкой Pro как раз и относятся к категории «мобильных рабочих станций», они очень популярны у дизайнеров, проектировщиков, художников, аниматоров и обладателей аналогичных профессий, в которых мощная дискретная графика будет отнюдь не лишней. Разумеется, базируется Radeon Pro 400 на новейшей на данный момент графической архитектуре AMD Polaris 11, кремний для которой производится с использованием техпроцесса 14-нм FinFET. Для того чтобы создать как можно более тонкий кристалл, AMD применила технологию die thinning, что позволило довести толщину кремниевой подложки с нормальных 780 микрон до 380 микрон (чуть тоньше стопки из четырёх листов бумаги, если верить источникам).

Все объявленные модели, Radeon Pro 450, 455 и 460, укладываются в сценарий с максимальным энергопотреблением, не превышающим 35 ватт. Это позволяет устанавливать их не только в мощные ноутбуки класса DTR, но и достаточно тонкие и лёгкие модели, примером которых как раз может служить MacBook Pro 15″. Любопытно, что старшая модель семейства, Radeon Pro 460, имеет 16 активных вычислительных блоков (1024 процессора GCN 1.3, четвёртое поколение), хотя в настольном варианте Radeon RX 460 два блока отключены, но уровень энергопотребления всё равно заметно выше. Сказывается отличная оптимизация кремния Polaris 11 именно в плане энергопотребления. Версия Radeon Pro 455 имеет 12 активных вычислительных модулей (768 процессоров GCN), а Radeon Pro 450 довольствуется 10 активными модулями, составляющими 640 процессоров GCN. Пиковая производительность новинок составляет 1,86, 1,3 и 1,0 терафлопс соответственно. Подсистема памяти у них одинаковая, в мобильном варианте она обеспечивает пропускную способность на уровне 80 Гбайт/с, это заметно меньше показателя настольной версии, составляющего 112 Гбайт/с; по всей видимости, пострадала тактовая частота чипов GDDR5.

Вся серия поддерживает стандарты HDMI 2.0 и DisplayPort 1.2, что позволяет пользоваться мобильной станцией с графикой Radeon Pro 400 и в стационарном режиме, подключив несколько мониторов с разрешением 1440p или 2160p. Помимо собственно анонса новых решений, AMD объявила о запуске кампании «Meet the Creators» (Встреча с творцами), призванной ещё более объединить людей творческих профессий, поведать им о новых возможностях, предоставляемых новым поколением мобильной дискретной графики и предоставить возможность поучаствовать в рекламных кампаниях AMD, касающихся бренда Radeon Pro. В частности, благодаря новой кампании большую известность должен получить новый движок рендеринга Radeon ProRender с открытым кодом, выпущенный ранее в этом году. Он позволет моделировать различные физические спецэффекты и уже доступен для использования в таких приложениях, как Autodesk Maya, Rhino и многих других средствах работы с трёхмерной графикой. Подробности о кампании Meet the Creators можно узнать на новом веб-сайте, открытом графическим подразделением AMD.

Драконье пламя: $10 000 и 1 Тбайт видеопамяти

Если верить зарубежным ресурсам, то графическое подразделение Advanced Micro Devices работает над одним из самых безумных проектов в своей истории. Причём слово «безумный» в данном случае следует понимать во многих смыслах, если сделать небольшое отступление. Как известно поклонникам саги Джорджа Мартина «Песнь Льда и Пламени», королевская династия Таргариенов славилась не только настоящими драконами, но и своим безумием, которое, в конце концов, и погубило последнего короля из этого рода. Но речь не о безумном Эйрисе II Таргариене, а о том, что новый проект AMD носит имя Dracarys (Дракарис, драконье пламя на высоком валирийском) —  так звучала боевая команда, по которой драконы выдыхали испепеляющее всё на своем пути пламя.

https://www.youtube.com/user/HBO

www.youtube.com/user/HBO

Весьма претенциозное название для графической карты, правда, и параметры у неё под стать названию: сердцем AMD Dracarys должен стать новейший процессор Vega 10, а возможно, даже не один. Но ещё более внушительно выглядит объём локальной видеопамяти, который в этом проекте должен достичь невиданной величины 1 Тбайт. Лишь 16 Гбайт этой памяти будут выполнены в виде многослойных модулей HBM2, а остальной объём будет представлен массивом памяти на борту карты, как это было сделано в конструкции профессионального решения Radeon Pro SSG. Но отличия всё же есть: Dracarys получит прямой доступ к массиву быстрой памяти, а не будет пользоваться обычными SSD в форм-факторе M.2, производительность которых довольно высока, но всё же не настолько, чтобы играть роль видеопамяти. Тип памяти в Dracarys и её производительность пока остаются тайной.

Кому нужен такой объём памяти? Ответ достаточно очевиден: в первую очередь тем, кто работает над спецэффектами в современных фильмах. По мере роста разрешений и популярности формата 4К профессиональные видеокарты требуют всё больше и больше памяти для достаточно быстрой работы в соответствующих профессиональных приложениях. А ведь не за горами и пришествие форматов с ещё более высоким разрешением и расширенным цветовым охватом. Здесь-то и пригодится AMD Dracarys с её чудовищным по нынешним меркам объёмом локальной памяти. Можно также предположить востребованность новинки на рынке HPC. К сожалению, кроме типа процессора и объёма видеопамяти о проекте пока известно немного. Мы знаем лишь, что первый дракон AMD должен «вылупиться из яйца» во второй половине следующего года и стоить такой «малыш» будет очень дорого — $10 000. Впрочем, для крупных киностудий это не слишком высокая цена.

AMD планирует выпустить двухпроцессорную версию Vega 10

Новости с фронтов войны за рынок дискретной игровой графики не очень хороши для «красных»: мало того, что решения «зеленых», чипы Pascal, показывают отличные результаты в текущем виде, так NVIDIA ещё и планирует выпустить их обновлённую версию с отточенным до совершенства техпроцессом и, судя по всему, серьёзно возросшим потенциалом. Если же верить сообщениям AMD, то разработка чипов следующего за Polaris поколения под кодовым названием Vega идёт по плану, но компания, похоже, опасается, что Vega 10 не сможет стать новым королём трёхмерной графики. В таких случаях и «красные», и «зелёные» прибегают к одному простому методу — выпускают флагманскую графическую карту с двумя графическими процессорами, каждый из которых поодиночке не тянет на лидерство. И теперь появилась информация о том, что во втором квартале 2017 года Radeon Technologies Group планирует выпустить двухпроцессорную карту с двумя чипами Vega 10 на борту.

Мы знаем, что Vega 10 будет иметь 64 унифицированных вычислительных блока (4096 ядер GCN в совокупности), так что гипотетическая Vega 10 X2 получит 8192 потоковых процессора GCN. Совокупный объём памяти HBM2 составит 32 Гбайт, по 16 Гбайт на чип, что даст пиковую пропускную способность 1 Тбайт/с. Как и Pascal, AMD Vega будет ориентирована не только на игровой рынок, но и на рынок супервычислений, поэтому новые чипы AMD будут поддерживать смешанные вычисления в различных форматах, начиная с FP16. Ожидается, что каждый процессор Vega 10 сможет развивать 24 терафлопса в режиме FP16 и 12 терафлопс в режиме FP32, а значит, совокупная мощь Vega 10 X2 составит 24 терафлопса в наиболее востребованном сегодня режиме вычислений FP32.  Тактовые частоты новых процессоров ожидаются в районе 1465 МГц, и это не очень хорошая новость для болельщиков из лагеря «красных» — уже имеющееся поколение Pascal имеет более высокий частотный потенциал, а ведь на смену ему придёт ещё более совершенное поколение Volta.

Как правило, двухпроцессорные решения — будь то игровые карты или вычислительные ускорители — не используют полностью частотный потенциал каждого чипа, поскольку система охлаждения, способная отводить нужный объём тепловой энергии, просто не уместится в стандартный двухслотовый форм-фактор карты расширения. Есть причины ожидать, что Vega 10 X2 получит частоты ядер в районе 1100‒1200 МГц, а значит, совокупная вычислительная производительность окажется в районе 18‒19,6 терафлопс. Вычисляется эта цифра легко: следует умножить количество потоковых процессоров на частоту и затем на два (2 инструкции на такт). Если NVIDIA не выпустит двухпроцессорных версий P100, то гипотетическая Vega 10 X2 может стать вполне конкурентоспособным с точки зрения производительности решением. Источники сообщают о появлении Красного Монстра во втором квартале 2017 года, но первая демонстрация его может состояться раньше, уже в конце этого года.

NVIDIA может выпустить обновлённую версию Pascal

Графическая архитектура NVIDIA Pascal оказалась очень удачной. Видеокарты на её основе с полным основанием доминируют сегодня на рынке игровой дискретной графики. И одной из самых приятных черт новых ГП является их высокий частотный потенциал. Но, похоже, «зелёным» недостаточно уже достигнутого успеха — во всемирной Сети циркулируют любопытные слухи о том, что NVIDIA может выпустить обновлённую версию Pascal с ещё более высокими частотами. Такие слухи не лишены оснований: первые ГП Pascal были выпущены с использованием 16-нм техпроцесса TSMC, находившегося на тот момент времени во младенчестве.

Сама TSMC постоянно работает над усовершенствованием своей последней технологии и планирует оптимизировать её для повышения доли выхода годных кристаллов Pascal. Почему бы и NVIDIA вслед за этим не выпустить новые версии уже нашумевших видеокарт, предложив потребителям ещё более высокие тактовые частоты, а значит, и производительность? Пока слухи говорят о том, что обновление коснётся флагманского игрового ядра, GP102, являющегося сердцем новейшего варианта Titan X. Как известно, даже в нём активны не все физически присутствующие на кристалле ядра CUDA, так что Pascal Refresh может означать не только увеличение частот, но и использование всего потенциала, заложенного в конструкцию GP102.

В конце концов, такая тактика не является для NVIDIA новой: предыдущая архитектура Maxwell тоже делится на два поколения, а до неё компания выпускала и обновлённую версию графических ядер Kepler. Пока не известно, коснётся ли обновление GP104, менее дорогого и в силу этого более популярного ядра, являющегося сердцем GeForce GTX 1080 и GeForce GTX 1070. Зарубежные источники считают, что обновлённая версия GP102 сможет «из коробки» предложить пользователям частоты в районе 2 ГГц и при этом поддерживать их даже при работе под нагрузкой. Для сравнения, текущая версия Titan X имеет заводскую частотную формулу 1417/1531 МГц и без применения экстремальных мер разгоняется примерно до 1620 МГц в обычном режиме и лишь в пике переваливает за отметку 2 ГГц.

Как и первая версия, обновлённый Titan X получит память GDDR5X; в настоящее время компания Micron работает над увеличением выхода годных чипов этого стандарта. Ожидается, что вся обновлённая линейка Pascal получит GDDR5X, поскольку точка дефицита будет уже пройдена. Исключением станет процессор начального уровня GP107. Это даст серьёзный прирост пропускной способности памяти, а значит, и повысит производительность в современных играх, запускаемых в разрешении 4К (3840 × 2160). Если изменения затронут такие модели, как GeForce GTX 1070 и GeForce GTX 1060, это сделает их ещё популярнее, а ситуация для AMD Radeon Technologies Group обострится, поскольку у «красных» пока нет ответа даже на текущие версии GP104, не говоря уже о GP102. Обновление, о котором идёт речь, должно состояться в следующем, 2017 году.

Существует также информация, касающаяся следующей архитектуры NVIDIA под кодовым названием Volta. Эта наследница Pascal должна быть анонсирована на конференции GPU Technology Conference 2017, всего лишь спустя год после появления предшествующей архитектуры. Как и в случае с Pascal, первые процессоры Volta GV110 будут предназначены для рынка супервычислений (HPC) и получат многослойную память HBM2. А вот потребительские версии Volta могут появиться лишь в 2018 году. Если верить слухам, стандартным объёмом видеопамяти для них станет значение 16 Гбайт, причём будет использован стандарт GDDR6, а не HBM2 или HBM3, как считалось ранее. В сравнении с GDDR5X, GDDR6 сможет предложить 1,6-кратное увеличение пропускной способности при более низком уровне энергопотребления. Новый аналог Titan X на базе чипа GV102 получит ещё больше памяти — 24 Гбайт в первой итерации и, возможно, 48 Гбайт во второй. 384-битная шина доступа сохранится, как и 256-битная у аналогов GeForce GTX 1080/1070.

В компьютерах Apple может снова появиться графика NVIDIA

NVIDIA разместила несколько объявлений о поиске специалистов: информация в описании вакансий позволяет сделать вывод о том, что графика компании может снова появиться в компьютерах Apple.

Сейчас в ПК «яблочной» империи применяются графические контроллеры, интегрированные в процессоры Intel, а также дискретные ускорители AMD. Между тем решения NVIDIA компания Apple сейчас не использует, но ситуация может измениться в ближайшем будущем.

В описании вакансий NVIDIA, в частности, говорится, что будущим сотрудникам предстоит «оказать содействие в создании следующих революционных продуктов Apple» и «работать в партнёрстве с Apple». Кроме того, упомянута разработка графических драйверов и программного обеспечения для компьютеров Mac.

Всего обнаружились три вакансии NVIDIA с упоминанием сотрудничества с Apple. В самих компаниях, впрочем, ситуацию пока никак не комментируют.