Сегодня 21 января 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Видеокарты

Обзор видеокарты NVIDIA GeForce GTX 750 Ti: первый GPU на архитектуре Maxwell

⇣ Содержание

GeForce GTX 750 Ti, как следует из названия, — это видеоадаптер начального уровня. Одновременно NVIDIA запускает GeForce GTX 750, а название GTX 740 остается зарезервированным для наиболее дешевой и слабой модели. И все же GTX 750 Ti — бюджетный вариант и как таковой не вызвал бы большого интереса, если бы в то же время не являлся первой моделью на базе архитектуры Maxwell. Соответственно, на примере GTX 750 Ti у нас есть возможность изучить Maxwell как в теории, так и на практике, не дожидаясь выхода флагманского GPU.

В основе GTX 750 Ti лежит графический процессор GM107. В существующей номенклатуре NVIDIA позицию 107 занимает наиболее компактное ядро. Соответственно, в будущем следует ожидать появления GM104 и GM110 (или GM101). Однако транзисторный бюджет GM107 не так уж мал для его класса — 1,87 млрд. Для сравнения: GK107 состоит из 1,3 млрд транзисторов.

Количество вычислительных блоков GM107 ощутимо больше, чем у GK107: 640 ядер CUDA и 40 текстурных блоков вместо 384 и 32 соответственно. Однако GM107 по-прежнему обладает 16 блоками ROP и 128-битной шиной памяти. Сами по себе эти числа не удивляют, если бы не тот факт, что GM107 остался в тех же рамках энергопотребления, что и GK107 (заявленный TDP даже немного меньше — 60 против 64 Вт). По сути, это и есть предназначение архитектуры Maxwell — увеличить производительность на ватт.

#Архитектура Maxwell

Если судить по представленным диаграммам, основное новшество Maxwell заключается в незначительной на вид, но потенциально весьма эффективной реорганизации блоков GPU. На глобальном уровне GM107 следует принципам, заложенным еще в Kepler (подробнее о них можно прочитать в обзоре GeForce GTX 680). Вся вычислительная логика сосредоточена в структуре под названием Graphics Processing Cluster (GPC), которая в GM107 всего одна, хотя в более крупных чипах их будет больше. Вне GPC расположен весь back-end процессора в виде блоков ROP и двух 64-битных контроллеров памяти, а также Giga Thread Engine, выполняющий функции смены контекста, одновременного исполнения kernel’ов и распределения потоков нагрузки между GPC (последнее пока — не наш случай). Количественное отличие от Kepler здесь состоит в кеше L2, увеличенном с 256 до 2048 Кбайт, что должно компенсировать узкую, 128-битную шину, а также сократить расход энергии на транзакции с весьма прожорливой памятью, каковой является GDDR5 SDRAM.

На уровне GPC значимых нововведений по сравнению с Kepler не заметно. Есть несколько Stream Multiprocessors, и есть единственный Raster Engine, выполняющий первоначальные стадии рендеринга: определение граней полигонов, проекцию и отсечение невидимых пикселов.

Главные изменения произошли внутри потоковых мультипроцессоров. Идея состоит в том, чтобы сместить соотношение управляющей и вычислительной логики в пользу первого компонента. Как и в Kepler, потоковый мультипроцессор (SMM в терминологии Maxwell) содержит четыре планировщика, но число ядер CUDA уменьшилось с 192 до 128, а текстурных блоков — с 16 до 8. Каждый планировщик привязан к шейдерному блоку, в который, помимо 32 ядер CUDA, входят 8 блоков Load/Store и SFU (Special Function Units, выполняющие, к примеру, тригонометрические операции). Каждая пара таких единиц в пределах SMM имеет общую секцию кеша L1, совмещенного с текстурным кешем, и связана с четырьмя текстурными блоками.

Известно, что отдельно взятый планировщик за такт может обратиться к одному (а при наличии параллелизма в потоке — сразу к двум) из следующих массивов вычислительных блоков:

  1. 32 ядра CUDA.
  2. 8 блоков Load/Store.
  3. 8 SFU.
  4. 4 текстурных блока.

В составе шейдерного мультипроцессора Kepler есть ядра CUDA, специализированные для вычислений FP64, но пока неизвестно, есть ли они и в SMM Maxwell. Итак, какие преимущества по сравнению с Kepler дает такая организация? Очевидно, что потоковый мультипроцессор Maxwell, избавившись от 64 ядер CUDA, меньше полагается на параллелизм инструкций: четыре планировщика даже в пессимистичном сценарии способны обслужить 128 ядер CUDA. Эта логика согласуется с тем, что Maxwell унаследовал от Kepler статические планировщики. Вся работа по планированию внеочередного исполнения инструкций выполняется на уровне компилятора. Такой подход позволил существенно сократить энергопотребление GPU и не оказывает большого негативного влияния на собственно шейдерные вычисления. В то же время расчеты, не связанные с графикой, не всегда предсказуемы для компилятора, поэтому чипам Maxwell явно не помешает дополнительный шаг от параллелизма на уровне инструкций к параллелизму на уровне потоков.

Попутно упрощается логика планировщиков, что в конечном счете позволяет сохранить 90% производительности отдельного потокового мультипроцессора при существенно меньшей площади SMM — по сравнению с оной у Kepler — и достигнуть столь впечатляющей энергоэффективности. Планировщики также оптимизированы с целью уменьшения латентности исполнения инструкций.

Финальный штрих к архитектуре Maxwell — усовершенствованный аппаратный кодек H.264 NVENC. Теперь GPU способен кодировать видео на скорости в 6-8 раз быстрее реального времени (4х для Kepler) и декодировать в 8-10 раз быстрее. Кроме того, в Maxwell предусмотрен новый режим энергопотребления GC5, предназначенный для снижения мощности при легкой нагрузке — такой как декодирование видео силами NVENC. Жаль только, что NVIDIA еще не внедрила поддержку стандарта H.265 для проигрывания 4К-видеозаписей.

Обновленный блок NVENC для кодирования видео пригодится прежде всего не в профессиональных приложениях, а в казуальных задачах: таких, например, как запись игрового процесса с помощью NVIDIA ShadowPlay или GameStream — трансляция видеопотока на консоль NVIDIA SHIELD.

#GeForce GTX 750 Ti: технические характеристики

Тактовые частоты GeForce GTX 750 Ti довольно высоки. Базовая частота составляет 1020 МГц. Поскольку здесь используется технология GPU Boost 2.0, то есть и Boost Clock, равная 1085 МГц. Видеопамять работает на эффективной частоте 5400 МГц. Таким образом, по совокупным характеристикам GTX 750 Ti близок к GTX 650 Ti на чипе GK106, даже без учета более эффективной архитектуры Maxwell. Сам 650 Ti, кстати, будет снят с производства, уступив место GTX 750 и 750 Ti.

Известны рекомендованные розничные цены новинок. GeForce GTX 750: в США — от $119 (без налогов), в России — от 4 490 руб. GTX 750 Ti: в США — от $149 (без налогов), в России — от 5 490 руб.

Для проверки GeForce GTX 750 Ti в деле у нас есть на руках две платы — референсный образец NVIDIA и ASUS GeForce GTX 750 Ti OC Edition.

#NVIDIA GeForce GTX 750 Ti

Референсный образец — минималистичная однослотовая плата, которая, благодаря низкому энергопотреблению чипа, обходится без дополнительного питания.

GPU охлаждается простым алюминиевым кулером-таблеткой.

Память набрана чипами SK hynix H5GC4H24MFR-T2C со штатной эффективной частотой 5 ГГц. Система питания максимально примитивная — две фазы для GPU и фаза для микросхем памяти.

#ASUS GeForce GTX 750 Ti OC Edition

Карточка ASUS построена на печатной плате собственного дизайна и оснащена более внушительной системой охлаждения, а также разъемом дополнительного питания. Частоты ядра повышены до 1072/1150 МГц (Base/Boost Clock соответственно). Видеопамять работает на референсной частоте — 5400 МГц.

Кулер с двумя вентиляторами по внешнему виду напоминает модели DirectCU того же производителя, только здесь нет ни тепловых трубок, ни медного основания.

Вы не поверите, но здесь есть отдельный видеовыход VGA.

Чипы памяти Samsung K4G41325FC-HC03 обладают штатной эффективной тактовой частотой 6 ГГц. Формула системы питания: две фазы для GPU, фаза для чипов памяти, фаза PLL.

Следующая страница →
 
⇣ Содержание
Если Вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Вечерний 3DNews
Каждый будний вечер мы рассылаем сводку новостей без белиберды и рекламы. Две минуты на чтение — и вы в курсе главных событий.

window-new
Soft
Hard
Тренды 🔥
У Nvidia закончились игровые видеокарты в облаке 8 мин.
Российское ПО не удовлетворяет 63 % айтишников по части совместимости с другим софтом 15 мин.
Олдскульная стратегия Tempest Rising в духе Command & Conquer стала доступна для предзаказа в российском Steam и обзавелась временной демоверсией 24 мин.
Золотой век наступил раньше времени: разработка Sid Meier’s Civilization VII официально завершена 2 ч.
«Мечты сбываются»: амбициозный мод GTA: Vice City Nextgen Edition на движке от GTA IV наконец получил точную дату выхода 2 ч.
RuStore стал вторым самым популярным магазином Android-приложений в России 2 ч.
«Начало новой эры»: Marvel Snap возобновила работу в США после разблокировки TikTok и готовится к переменам 4 ч.
Трамп подписал указ, который отсрочил на 75 дней блокировку TikTok в США 7 ч.
Canon выпустила приложение для стриминга с нескольких камер, но не своих собственных 8 ч.
Китайцы создали нейросеть, которая превзошла мыслящую OpenAI o1 в важных тестах 14 ч.
Amazon снова стала крупнейшим в мире корпоративным покупателем возобновляемой энергии в 2024 году 10 мин.
Учёные отказали частицам тёмной материи в возможности быть сверхтяжёлыми 24 мин.
Спецслужбы США и ЕС: причиной обрывов кабелей в Балтийском море стали не диверсии, а низкая квалификация экипажей 32 мин.
Seagate начала поставки HAMR-дисков Exos M вместимостью 36 Тбайт 50 мин.
Трамп отменил принудительный перевод США на электромобили 51 мин.
AAEON выпустила плату Boxer-8654AI-Kit на базе NVIDIA Jetson Orin NX 53 мин.
Huawei стала помогать клиентам внедрять ИИ-ускорители Ascend, чтобы отвоевать рынок у Nvidia 54 мин.
Huawei показала взрывной рост и стала вторым брендом смартфонов в Китае — Apple быстрее всех теряет рынок 2 ч.
Российским операторам разрешили готовиться к тестированию 5G 2 ч.
Seagate представила HDD на 36 Тбайт — это самый плотный жёсткий диск с CMR-записью 4 ч.