Видеокарты

Обзор видеокарты NVIDIA GeForce RTX 4080: шаг вперед и два назад

⇣ Содержание

Флагманский представитель 40-й серии GeForce — RTX 4090 — занял место в ряду самых впечатляющих релизов NVIDIA наравне с такими легендами, как GeForce GTX 980 Ti и GTX 1080 Ti. Благодаря тому, что создатели архитектуры Ada поставили во главу угла энергоэффективность и вычислительную мощность GPU, RTX 4090 совершил настоящий прорыв в игровой производительности, опередив 90-ю модель прошлого поколения на 62–72 %. В большинстве тайтлов ему даже не требуется масштабирование кадров для того, чтобы получить фреймрейт выше 60 FPS в 4К с рейтрейсингом. А главное, отношение быстродействия к цене тоже двинулось вверх по сравнению со старшими представителями 30-й серии. Тем не менее даже при рекомендованной стоимости $1 599 без учета ажиотажных накруток (в этот раз наверняка кратковременных) GeForce RTX 4090 чрезвычайно дорог. Мы посоветовали не спешить с покупкой, ведь обычно топовые модели не самые выгодные. Но после знакомства с RTX 4080 складывается впечатление, что придется подождать еще немного.

#Технические характеристики, цены

В основе новых потребительских видеокарт NVIDIA лежит кремний Ada Lovelace, который производится силами тайваньской TSMC по техпроцессу 4N. Последний, вопреки названию, является разновидностью 5-нанометрового узла N5, заточенной специально под «зеленые» чипы. Тем не менее переход с нормы 8 нм, которой NVIDIA пользовалась ранее, обеспечил колоссальный рост плотности транзисторов и позволил создать такой графический процессор, как AD102 — его компонентный бюджет составляет ни много ни мало 76,3 млрд транзисторов. Именно на масштабе, а также высоких тактовых частотах зиждется производительность чипов Ada, ведь по сравнению с Ampere архитектура «зеленых» GPU не претерпела больших структурных изменений. Можно подчеркнуть лишь увеличенную пропускную способность блоков рейтрейсинга, тензорных ядер и возможность кодирования видео AV1 силами выделенного ASIC. В остальном Ada является продуктом экстенсивного развития — настолько, что инженеры NVIDIA пренебрегли двумя ожидаемыми функциями: поддержкой PCI Express пятого поколения и выходами DisplayPort 2.0.

Как бы то ни было, если судить по достижениям флагманского GeForce RTX 4090, вклад в чистую производительность GPU окупился сполна. Однако побочным эффектом чрезвычайно высокой вычислительной мощности стало то, что даже передовые десктопные CPU не в состоянии раскрыть потенциал RTX 4090 в любых режимах, кроме игры на 4К-экране (и лучше еще и с трассировкой лучей). Решение проблемы было найдено в алгоритме DLSS версии 3.0, который не только масштабирует кадры, прошедшие полный конвейер рендеринга, но и генерирует промежуточные при помощи оптического потока — специально для этого блок Optical Flow в чипах Ada был усилен, а с GPU прошлого поколения (по крайней мере формально) DLSS 3.0 не совместим.

Ключевые признаки и некоторые другие, не столь заметные нововведения архитектуры Ada Lovelace мы обсуждали подробно в обзоре GeForce RTX 4090. Сегодня же сосредоточимся на характеристиках и производительности второй по старшинству модели серии, GeForce RTX 4080.

ПроизводительNVIDIA
Название AD104 AD103 AD102
Где используется Н/Д GeForce RTX 4080 GeForce RTX 4090
Микроархитектура Ada Lovelace Ada Lovelace Ada Lovelace
Техпроцесс, нм TSMC 4N TSMC 4N TSMC 4N
Число транзисторов, млрд 35,8 45,9 76,3
Площадь чипа, мм2 295 378,6 608,6
Число SM/TPC/GPC
Streaming Multiprocessors (SM) 60 84 144
Thread Processing Clusters (TPC) 30 42 72
Graphics Processing Clusters (GPC) 5 7 12
Конфигурация потокового мультипроцессора (SM)
CUDA-ядра FP16 Нет Нет Нет
CUDA-ядра FP32 4 × 32 4 × 32 4 × 32
CUDA-ядра FP64 2 2 2
CUDA-ядра INT32 4 × 16 4 × 16 4 × 16
ALU специального назначения (SFU) 4 × 4 4 × 4 4 × 4
Тензорные ядра 4 × 1 4 × 1 4 × 1
RT-ядра 1 1 1
Блоки наложения текстур (TMU) 4 4 4
Объем регистрового файла, Кбайт 256 256 256
Объем кеша L1/разделяемой памяти, Кбайт 128 128 128
Программируемые вычислительные блоки GPU
CUDA-ядра FP16 Нет Нет Нет
CUDA-ядра FP32 7 680 10 752 18 432
CUDA-ядра FP64 120 168 288
CUDA-ядра INT32 3 840 5 376 9 216
ALU специального назначения (SFU) 960 1 344 2 304
Тензорные ядра 240 336 576
RT-ядра 60 84 144
Блоки GPU фиксированной функциональности
Блоки наложения текстур (TMU) 240 336 576
Блоки операций растеризации (ROP) 80 112 192
Конфигурация памяти
Объем кеша L2, Мбайт 48 64 96
Разрядность шины RAM, бит 192 256 384
Тип микросхем RAM GDDR6X SGRAM GDDR6X SGRAM GDDR6X SGRAM
Интерфейс NVLINK Нет Нет Нет
Интерфейс PCI Express 4.0 x16 4.0 x16 4.0 x16

В отличие от 30-й серии, вся верхушка которой укомплектована кристаллами GA102, 80-я и 90-е позиции нового поколения опираются на разные графические процессоры: AD102 и AD103 соответственно. Чип второго эшелона содержит всего лишь 62 % компонентного бюджета AD102 — 45,9 млрд транзисторов, что, тем не менее, на 62 % больше, чем у крупнейшего чипа Ampere — GA102. При этом AD103 полностью копирует формулу основных вычислительных блоков GA102: 84 потоковых мультипроцессора и, соответственно, 10 752 CUDA-ядра стандартной точности, а также 256 блоков наложения текстур и 112 блоков операций растеризации. Значительная часть дополнительных транзисторов ушла на массивный кеш второго уровня, объем которого в AD103 составляет 64 Мбайт. Таким образом создатели Ada уменьшили требования к пропускной способности VRAM — в результате AD103 довольствуется нехарактерно узкой для мощных видеокарт 256-битной шиной памяти.

В GeForce RTX 4080 не используется полностью функциональный кристалл AD103: чип урезали на 8 SM, оставив в распоряжении пользователя 9 728 CUDA-ядер FP32, 304 текстурных блока и 112 ROP. Таким образом, по формуле GPU новинка оказалась в промежутке между GeForce RTX 3080 и RTX 3080 Ti, однако благодаря чрезвычайно высоким тактовым частотам (консервативный параметр Boost Clock составляет 2 505 МГц) по теоретической вычислительной мощности RTX 4080 превосходит не только RTX 3080 (на 64 %), но и даже RTX 3090 Ti (на 34 %).

Локальная память GeForce RTX 4080 набрана микросхемами GDDR6X с номиналом 22,4 Гбит/с (выше, чем 21 Гбит/с у GeForce RTX 4090) но в связи с узкой 256-битной шиной общая пропускная способность VRAM оказалась даже ниже, чем у GeForce RTX 3080, — что и должен компенсировать большой кеш второго уровня. Объем памяти, напротив, составляет достаточные всем современным играм и многим рабочим задачам 16 Гбайт.

ПроизводительNVIDIA
Модель GeForce RTX 3080 GeForce RTX 3080 Ti GeForce RTX 3090 Ti GeForce RTX 4080 GeForce RTX 4090
Графический процессор
Название GA102 GA102 GA102 AD103 AD102
Микроархитектура Ampere Ampere Ampere Ada Lovelace Ada Lovelace
Техпроцесс Samsung 8N Samsung 8N Samsung 8N TSMC 4N TSMC 4N
Число транзисторов, млрд 28,3 28,3 28,3 45,9 76,3
Тактовая частота, МГц: Base Clock / Boost Clock 1 440/1 710 1 365/1 665 1 395/1 695 2 210/2 505 2 230/2 520
Шейдерные ALU FP32 8 704 10 240 10 752 9 728 16 384
Блоки наложения текстур (TMU) 272 320 336 304 512
Блоки операций растеризации (ROP) 96 112 112 112 176
Тензорные ядра 272 320 336 304 512
RT-ядра 68 80 84 76 128
Оперативная память
Разрядность шины, бит 320 384 384 256 384
Тип микросхем GDDR6X SGRAM GDDR6X SGRAM GDDR6X SGRAM GDDR6X SGRAM GDDR6X SGRAM
Тактовая частота, МГц (пропускная способность на контакт, Мбит/с) 1 188 (19 000) 1 188 (19 000) 1 313 (21 000) 1 400 (22 400) 1 313 (21 000)
Объем, Мбайт 10 240 12 288 24 576 16 384 24 576
Объем кеша L2, Мбайт 6 6 6 64 96
Шина ввода/вывода PCI Express 4.0 x16 PCI Express 4.0 x16 PCI Express 4.0 x16 PCI Express 4.0 x16 PCI Express 4.0 x16
Производительность
Пиковая производительность FP32, GFLOPS (из расчета максимальной указанной частоты) 29 768 34 099 36 449 48 737 82 575
Производительность FP64/FP32 1/64 1/64 1/64 1/64 1/64
Производительность FP16/FP32 1/1 1/1 1/1 1/1 1/1
Пропускная способность оперативной памяти, Гбайт/с 760 912 1 008 717 1 008
Вывод изображения
Интерфейсы вывода изображения DisplayPort 1.4a, HDMI 2.1 DisplayPort 1.4a, HDMI 2.1 DisplayPort 1.4a, HDMI 2.1 DisplayPort 1.4a, HDMI 2.1 DisplayPort 1.4a, HDMI 2.1
TBP/TDP, Вт 320 350 450 320 450
Розничная цена (США, без налога), $ 699 (рекоменд. в момент выхода) 1 199 (рекоменд. в момент выхода) 1 999 (рекоменд. в момент выхода) 1 199 (рекоменд. в момент выхода) 1599 (рекоменд. в момент выхода)
Розничная цена (Россия), руб. 63 490 (рекоменд. в момент выхода) 116 900 (рекоменд. в момент выхода) Н/Д Н/Д Н/Д

80-е модели 30-го и 40-го семейства рассчитаны на одинаковую потребляемую мощность в пределах 320 Вт, при том что GeForce RTX 3090 Ti и GeForce RTX 4090 расходуют вплоть до 450 Вт. Как следствие, GeForce RTX 4080 не только сулит большую абсолютную производительность, чем любая видеокарта прошлого поколения, но и в то же время превосходит их по быстродействию на ватт. А вот преимущество новинки в игровых FPS на доллар стоимости под сомнением, ведь несмотря на то, что RTX 4080 основан на GPU второго эшелона, ему назначили такую же рекомендованную цену, как RTX 3080 Ti, — $1 199, а RTX 3080 и вовсе намеревались продавать за $699. Конечно, большую часть своего жизненного цикла ускорители 30-й серии не были доступны по MSRP из-за повышенного спроса и дефицита полупроводников, но получается, что теперь NVIDIA возвела цену кризисного периода в норму, а для геймерской 80-й модели это более чувствительное изменение, чем для просьюмерского ускорителя RTX 4090.

Что касается российского рынка, то на старте продаж GeForce RTX 4080 отдавали как минимум за 103 999 руб., в то время как стоимость RTX 4090 в данный момент составляет 157 787 руб. и выше.

#Palit GeForce RTX 4080 GameRock OC: конструкция

Рассмотрим GeForce RTX 4080 на примере видеокарты, которая, собственно, и является одной из самых доступных версий новинки в России. Хотя потребляемая мощность предтоповой модели на целых 130 Вт меньше, чем у RTX 4090, на вид Palit GeForce RTX 4080 GameRock OC трудно отличить от старшего устройства под маркой GameRock. Ускоритель также занимает в корпусе ПК четыре слота расширения, насчитывает почти 33 см в длину и 138 в высоту, а весит чуть меньше 2 кг.

Систему охлаждения GameRock OC обслуживают три вентилятора диаметром 90 мм. Всю фронтальную панель кожуха занимает прозрачная накладка с рельефом, имитирующим хрустальную друзу, через которую сияют разноцветные LED. На торце видеокарты подсвечены надписи «GameRock» и «GeForce RTX », а паттерн работы светодиодов настраивается фирменной программой ThunderMaster. Однако Palit предлагает альтернативную модификацию GeForce RTX 4080 с пометкой OmniBlack, у которой все кристаллы черные, а подсветки нет.

Обратная поверхность печатной платы защищена металлической пластиной с отверстиями, через которые радиатор продувается насквозь. При низкой загрузке и температуре GPU видеокарта охлаждается пассивно.

Сам радиатор GeForce RTX 4080 GameRock OC устроен так же, как у RTX 4090 той же серии, с одним отличием: место испарительной камеры занимает никелированная медная площадка. К теплосъемнику примыкает не только кристалл графического процессора, но и микросхемы памяти GDDR6X, хотя чипы емкостью 16 Гбит нагреваются значительно меньше своих предшественников, которые NVIDIA использовала в ускорителях 30-й серии. Отдельные плоские выступы радиатора прижаты к силовым каскадам и дросселям VRM, а тепло по радиатору распределяют восемь термотрубок.

Толстая рамка, заложенная по периметру PCB, обеспечивает всей конструкции жесткость, однако к видеокарте прилагается еще и сборная подпорка. Другая деталь в комплекте поставки — кабель для синхронизации внешней светодиодной подсветки. Как и GeForce RTX 4090, предтоповая модель питается через разъем 12VHPWR. К блокам питания нового образца ее можно подключить напрямую, а старым нужен переходник — в данном случае с трех восьмиконтактных разъемов на один 12VHPWR.

#Palit GeForce RTX 4080 GameRock OC: печатная плата

PCB для GeForce RTX 4080 в исполнении Palit имеет такие же размеры, как плата GeForce RTX 4090 GameRock, и такую же разводку под VRM графического процессора, которая предусматривает вплоть до 24 фаз питания. Однако задействованы лишь 15 фаз, а регулятор напряжения видеопамяти изначально задуман как трехфазный. В обоих VRM используются силовые каскады OnSemi NCP302150 с номинальным током 50 А. В остальном видеокарта довольствуется упрощенной элементной базой: фазы VRM графического процессора подключены параллельно к восьмифазному ШИМ-контроллеру uPI uP9512R, а на входе и выходе фаз установлены конденсаторы сквозного монтажа вместо более дорогих SMD.

Микросхемы памяти GDDR6X производства Micron рассчитаны на пропускную способность 24 Гбит/с, то есть больше положенных GeForce RTX 4080 22,4 Гбит/с, а значит, наверняка поддаются эффективному разгону.

Видеокарта имеет две микросхемы BIOS. «Тихая» прошивка устанавливает тактовые частоты, максимально приближенные к спецификациям NVIDIA — 2 205/2 505 МГц, — и не позволяет увеличить резерв мощности сверх номинальных 340 Вт. «Производительный» BIOS задействует фабричный разгон до 2 205/2 640 МГц, а TBP поддается регулировке в пределах 400 Вт. Тем не менее дальнейшие тесты мы провели с использованием «тихого» BIOS, чтобы продемонстрировать референсную производительность GeForce RTX 4080.

Следующая страница →
 
⇣ Содержание
Если Вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
⇣ Комментарии
Прежде чем оставить комментарий, пожалуйста, ознакомьтесь с правилами комментирования. Оставляя комментарий, вы подтверждаете ваше согласие с данными правилами и осознаете возможную ответственность за их нарушение.
Все комментарии премодерируются.
Комментарии загружаются...
window-new
Soft
Hard
Тренды 🔥
Илон Маск теперь не самый богатый человек в мире — его сместил Бернар Арно 11 мин.
Мифологический шутер PERISH с кооперативом на четверых и трассировкой лучей получил дату выхода и улучшенную демоверсию 2 ч.
Слухи: Sony одобрила перезапуск Uncharted, но не от Naughty Dog 4 ч.
Соавтора «Соника» снова арестовали — теперь из-за Final Fantasy 4 ч.
Банк России готов разрешить майнерам продавать криптовалюты, но только на иностранных биржах 5 ч.
Декабрьское обновление Telegram принесло анонимную регистрацию, автоудаление всего, антиспам и многое другое 5 ч.
Google объявила самые популярные темы поиска в 2022 году: игра Wordle, Джонни Депп и Букингемский дворец 6 ч.
В WhatsApp появился конструктор аватаров, которые можно использовать как стикеры 7 ч.
Amazon урегулировала обвинения Еврокомиссии в притеснении сторонних продавцов 8 ч.
Европа может запретить Meta навязывать пользователям целевую рекламу 8 ч.
Гнущийся игровой монитор Corsair Xeneon Flex можно будет заказать с 15 декабря — цена $2000 и предложение ограничено 20 мин.
Твердотельный накопитель Phison на 8 Тбайт прошёл сертификацию NASA и полетит на Луну в 2023 году 42 мин.
Прогноз по квартальным поставкам iPhone специалисты снизили ещё на 3 млн единиц 3 ч.
TECNO представила флагман Phantom X2 Pro с выдвижным объективом 50-Мп портретной камеры 3 ч.
IDC: объём мирового рынка корпоративного WLAN-оборудования вырос на треть 3 ч.
Первый спутник «Экспресс-РВ» в рамках проекта «Сфера» отправится в космос в 2025 году 5 ч.
Китайская космическая станция может стать больше — рассматривается вариант добавления ещё одного центрального модуля 6 ч.
В Японии всплыли цены на SSD с интерфейсом PCIe 5.0 — от $400 за 1 Тбайт до $1600 за 4 Тбайт 7 ч.
Власти Сан-Франциско отозвали разрешение на применение летального оружия роботами 7 ч.
NASA рассказало о роботизированном манипуляторе COLDArm, который сможет работать в экстремальном холоде на Луне 7 ч.