Сегодня 16 сентября 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Видеокарты

Процессорозависимость видеосистемы. Часть I - Анализ

⇣ Содержание

Как правильно оценивать производительность видеокарты

Вопрос может показаться надуманным, Казалось бы, чего сложного - взяли стенд покруче, установили видеокарту и давай гонять во всех режимах. Ну, в общем-то, так обычно и делается. Собственно, вопрос состоит в трактовке полученных результатов. Все не так просто, как кажется. Давайте еще раз посмотрим на наш график и поищем подводные камни. Чтобы излишне не загружать картинку, в этот раз мы оставили линии только для трех режимов.


График 3

Красная линия показывает результаты тестирования видеокарты в режиме 1024х768 NO AA/AF. Что в этом случае мы измеряем? Производительность видеокарты? Вряд ли. Посмотрите, как сильно меняются результаты при изменении частоты CPU, но ведь видеокарта у нас осталась та же самая, и производительность у нее не могла измениться! Вывод – в этом режиме мы, по сути, измеряем производительность центрального процессора в скорости генерации кадров, ведь результаты практически линейно зависят от частоты CPU.

Теперь посмотрим на коричневую линию, которая соответствует режиму 1600х1200 NO AA/AF. Нагрузка на видеокарту заметно возросла и о прямой линии речь уже не идет. Тем не менее, разброс результатов остается значительным. Какое именно значение отражает производительность видеокарты? Как мы видим, корректный ответ обязательно должен включать условия тестирования, и если не целиком, то производительность (частоту) CPU, при которой получен результат – обязательно.

И, наконец, третья линия зеленого цвета, соответствующая режиму 1600х1200 4AA/16AF. Смотрите, начиная с частоты CPU 1600 МГц результаты, показываемые видеокартой, перестали зависеть от мощности CPU. Поэтому мы можем с полной уверенностью утверждать, что тот уровень FPS, на котором находится горизонтальная «полочка», как раз и характеризует производительность видеокарты! Отсюда следует:

Критерий корректного сравнения производительности видеокарт (при прочих равных условиях) – допустимо сравнивать лишь те значения производительности (FPS), показываемые видеокартами, которые соответствуют горизонтальным уровням на графике процессорозависимости.

Для этого необходимо использовать тестовый стенд с достаточно мощным центральным процессором и выбирать режим тестирования так, чтобы получилась горизонтальная «полочка» результатов. Получившаяся «полочка» - и есть уровень производительности видеокарты в данном режиме.

Трактовка результатов, показываемых multi-GPU системами

Вы уже знакомы со способами объединения производительности видеокарт – SLI и CrossFire, и знаете, что смысл этих технологий состоит в увеличении производительности видеосистемы. Если говорить простыми словами (снова обращаясь к рисунку 1), то две видеокарты гораздо быстрее «раскрашивают» «каркас» кадра, чем одиночная видеокарта. Мы умышленно не говорим «вдвое быстрее», потому что обычная арифметика здесь не работает, и «два» не всегда вдвое быстрее, чем «один». Сказываются накладные расходы на распределение нагрузки между двумя видеокартами, время на синхронизацию и т.д. Поэтому двукратный прирост производительности от объединения двух видеокарт существует лишь в теории, а на практике максимальный прирост ограничен величиной примерно в 80-90%, то есть в 1,8-1,9 раз. Однако и 80% прироста от установки второй видеокарты удается увидеть далеко не всегда. Используя вышеприведенные графики, мы теперь можем объяснить, почему так происходит.
Возьмем график 3 и, добавив несколько линий, покажем как это можно сделать.


График 4

Как и прежде, зеленая, коричневая и красная линии соответствуют результатам, показываемым видеокартой, в разных графических режимах в зависимости от частоты центрального процессора. Прямая линия синего цвета обозначает «линию максимальных результатов», которая является следствием ограничения производительности со стороны центрального процессора. Серые двухсторонние стрелки показывают теоретически возможный прирост при наращивании производительности видеоподсистемы. Как легко заметить, для красной линии «запас прироста» минимален, поскольку она и так практически совпадает с синей прямой. Поэтому, при увеличении мощности видеоподсистемы с помощью технологий SLI или CrossFire, мы увидим минимальное увеличение производительности или не увидим его. Для коричневой линии, соответствующей более тяжелому графическому режиму, «запас прироста» несколько больше, но все равно меньше, чем теоретический предел 80-90% ( 120 fps + 80% ~ 220 fps, а мы получаем примерно лишь 150 fps). Наиболее благоприятная ситуация складывается для самого тяжелого графического режима – 4AA/16AF в разрешении 1600х1200. В этом случае «запас прироста» еще больше и связка из двух видеокарт может проявить себя в полную силу. Как видите, для полноценного раскрытия потенциала технологий SLI и CrossFire требуется мощный центральный процессор (при движении вправо по оси Х «запас прироста» увеличивается), а также тестирование в тяжелых графических режимах.

Конечно, все эти выводы были интуитивно понятны еще в момент анонса технологий объединения производительности видеокарт, мы лишь наглядно показали, где искать этот прирост.

Наверное, у вас возник вопрос – а что на графике делают оранжевые пунктирные линии? Предположим, что нижняя из двух пунктирных линий - это результаты, показанные в еще более тяжелом графическом режиме (скажем, 4AA/16AF в разрешении 2048x1536). Верхняя пунктирная линия проведена на уровне, который на 80% выше, то есть соответствует производительности двух видеокарт в SLI или CrossFire (нижняя пунктирная стрелка). А что же тогда показывает верхняя пунктирная стрелка? Разумеется, она показывает оставшийся «запас прироста», который может быть реализован, например, с помощью… Quad SLI. Как видите, поиски реального прироста производительности в этом случае требуют еще более тяжелого графического режима и, конечно же, мощного центрального процессора. (Замечание – приведенный для Quad SLI пример не отражает реальных значений производительности данной связки видеокарт и лишь иллюстрирует то, что подходы, рассматриваемые в статье, с успехом могут быть применены и к таким видеорешениям).

Проверка полученных выводов на других 3D-приложениях

До сих пор мы проводили все наши рассуждения на примере лишь одного 3D-приложения, а именно – игры Half-Life 2 с демо-сценой «d1_canals_09 3dnews02». Насколько выводы, полученные нами, справедливы в других приложениях? Давайте проверим. Ниже мы приведем еще два сводных графика, подобных графику 2, но для игр DOOM 3 и F.E.A.R., с использованием встроенных в эти игры демок.


График 5

Как видите, общая картина очень напоминает ту, что мы видели в Half-Life 2. Разумеется, абсолютные значения FPS другие, но общий характер поведения линий сохраняется.


График 6

Игра F.E.A.R. настолько «тяжела», что даже при использовании довольно мощной видеокарты 7800GTX, мы практически сразу получаем горизонтальные «полочки», причем в режимах NO AA/AF, то есть без включения полноэкранного сглаживания и анизотропной фильтрации. Поэтому, для поиска «линии максимально возможных результатов» пришлось использовать самое низкое из доступных разрешений – 640х480 (темно-зеленая линия на графике). Что касается более высоких разрешений, то некоторая «корявость» линий связана с тем, что встроенный в игру F.E.A.R. тест выдает целочисленные значения, что при небольших абсолютных значениях дает заметную относительную погрешность.

Ну и наконец – популярнейшие синтетические тесты семейства 3DMark. Для примера мы взяли 3DMark’05.


График 7

Как оказалось, с ростом частоты центрального процессора, результаты видеокарты GeForce 7800GTX (зеленая линия) при стандартных настройках 3DMark’05 превращаются в «полочку». Согласно полученному нами «критерию корректного сравнения производительности видеокарт» это означает, что производительность GeForce 7800GTX в этом тесте определена верно. А значит, корректно будет сравнивать и более «слабые» видеокарты с помощью 3DMark’05.

Думаю, теперь понятно, почему мы не стали приводить здесь результаты, полученные в 3DMark’06. Поскольку в этот бенчмарк включены тесты CPU, то мы не сможем получить горизонтальную «полочку» результатов на графике процессорозависимости, а значит корректное сравнение производительности видеокарт остается под вопросом.

Возвращаемся к графику 7. Для того, чтобы найти «линию максимальных результатов» в этом тесте мы использовали видеокарту Radeon X1900XTX (поскольку 3DMark’05 благоволит Radeon’ам), и тестировали в разрешении 320х240 (прочие настройки теста не менялись). Получившаяся красная линия хотя и не является геометрической прямой, тем не менее вполне подходит на роль «линии максимальных результатов». Как видите, с использованием процессора Athlon 64 4000+, работающего на частоте 2400 МГц, максимальное количество «марков» находится на уровне около 12000, или 12500, если следовать аппроксимирующей кривой. До сих пор ни одна протестированная нами система (7900GTX-SLI, CrossFire, Quad-SLI) не преодолела рубеж в 12000 «марков» в тесте 3DMark’05 на используемом нами стенде, что подтверждает сделаные нами выводы.

Следующая страница → ← Предыдущая страница
⇣ Содержание
Если Вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.

window-new
Soft
Hard
Тренды 🔥
Вышла Apple macOS Tahoe 26 — она получила интерфейс Liquid Glass, новые средства автоматизации и многое другое 9 мин.
Планы Sony на сентябрьский выпуск State of Play подтвердил ещё один инсайдер — шоу пройдёт совсем скоро 2 ч.
Спустя полтора года в раннем доступе нашумевший симулятор «покемонов с пушками» Palworld взял курс на полноценный релиз 3 ч.
В корпоративном пакете Microsoft 365 заработал бесплатный Copilot Chat 3 ч.
США и Китай договорились об условиях сделки с TikTok, их утвердят в пятницу лидеры этих стран 7 ч.
Apple выпустила watchOS 26: дизайн Liquid Glass, новые функции Apple Intelligence и мониторинг гипертонии 11 ч.
Календарь релизов 15–21 сентября: Dying Light: The Beast, Lego Voyagers, Ratatan, Jump Space 12 ч.
Apple выпустила iPadOS 26 со множеством изменений и дизайном Liquid Glass 12 ч.
Российский ужастик про незваных гостей No, I’m not a Human стартовал в Steam с 96 % положительных отзывов 13 ч.
Наушники Apple AirPods получили семь новых функций с iOS 26 13 ч.
ИТ-холдинг Fplus оказался на грани банкротства — претензии почти на 1 млрд руб. есть уже у трёх банков 10 мин.
OpenAI планирует заняться гуманоидными роботами и собирает команду специалистов в робототехнике 40 мин.
В числе первых чипов, которые выпустит TSMC по 2-нм техпроцессу, окажется следующий Mediatek Dimensity 58 мин.
eSIM от Yesim: как забыть о роуминге и не остаться без связи за границей 2 ч.
Спутниковый интернет Amazon к концу первого квартала 2026 года будет доступен в пяти странах мира 3 ч.
NVIDIA обязалась выкупить у CoreWeave все нераспроданные ИИ-мощности за $6,3 млрд 3 ч.
Умные очки Meta Ray-Ban Display с дисплеем показались на видео до презентации 3 ч.
Завершение сделки по отделению Altera позволило Intel снизить план по операционным расходам на 2025 год на $200 млн 3 ч.
С апрельских минимумов акции Tesla выросли в цене на 85 % 4 ч.
Nvidia намерена оказаться в числе первых клиентов TSMC на ангстремный техпроцесс A16 5 ч.