⇣ Содержание
|
реклама
Самое интересное в новостях
Ботозависимость, или зачем 3D-играм мощный CPU
Предисловие. Постановка вопроса.Разговоры от том, что важнее для комфорта в 3D-играх – мощный центральный процессор или топовая видеокарта, не утихают с момента появления первых 3D-ускорителей. Конечно, в идеале хотелось бы одновременно иметь и самый производительный центральный процессор, и самую мощную видеосистему. Однако ограниченность ресурсов для покупки компьютера топовой конфигурации, а тем более скачкообразное развитие технологий CPU и GPU, оставляют массу вопросов в выборе оптимального сочетания этих двух самых важных составляющих современного компьютера. Одни настаивают на необходимости использования мощной видеосистемы, другие говорят, что без мощного CPU тоже не обойтись. Правы и те, и другие. Дело в том, что какие-то 3D-приложения более чувствительны к производительности видеосистемы, а какие-то – к мощности центрального процессора. Если же в вышеупомянутом «споре» не указывать детально, к какому именно случаю относится приводимый пример, то этот спор рискует затянуться до бесконечности. Это как спорить о том, что лучше – яблоки или апельсины? Первоначально, поводом написания этой статьи послужило желание определить ту минимальную грань производительности центрального процессора, которой было бы достаточно для комфортной игры в настоящий момент. Нечто подобное, отчасти, мы уже видели, когда сравнивали производительность современных AGP-видеокарт на разных платформах. Как показало то тестирование, в условиях ограниченной производительности видеосистемы мощность центрального процессора (и всей платформы в целом) не имеет решающего значения. Отсюда и возникла мысль - а что если взять достаточно мощную видеокарту и, варьируя мощность CPU, посмотреть, как будет меняться FPS в этом случае. Собственно, этому вопросу и посвящено наше сегодняшнее исследование. К сожалению, в рамках одной статьи невозможно сравнить между собой все имеющие на данный момент платформы, поэтому мы решили остановиться на двух из них - Intel Core 2 Duo и Athlon 64 X2. Однако даже с использованием только этих двух платформ можно получить весьма интересные результаты.Условия тестированияПервая платформа это наш стандартный стенд:
График 1
Полученный график в особых комментариях не нуждается. Четко видно превосходство процессоров Intel Core 2 Duo. И спад FPS при росте числа ботов у них начинается существенно позже, и превосходство архитектуры C2D даже на равных частотах составляет порядка 1,5-2 раза по сравнению с Athlon.
На этом можно было бы и остановиться, но вы же не думаете, что все это затевалось ради одного единственного графика? На самом деле, пока мы увидели только верхушку айсберга. Данные, собранные в процессе тестирования, позволяют «копнуть» гораздо глубже и получить еще массу весьма занятных сведений. Интересно? Читаем
Если вы внимательно изучили График 1, то наверняка задались вопросом – почему линии графика такие «кривые»? Тем более странно, что в некоторых случаях увеличение числа ботов приводит к повышению значения среднего FPS, хотя по логике вещей такого быть не должно, да и вообще, линии графика должны плавно и равномерно приближаться к оси Х по мере возрастания нагрузки на процессор. Однако такого не происходит. И вот почему. Во-первых, мы измеряем FPS с помощью FRAPS. Такой способ сам по себе содержит определенную погрешность. Во-вторых, время тестирования каждой сцены достаточно мало (15-20 секунд, а потом боты начинают убивать друг друга), это тоже вносит определенную погрешность. В-третьих, мы не знаем, как движутся и взаимодействуют друг с другом боты в каждом раунде, но можно утверждать, что разные раунды совершенно точно не идентичны друг другу.
Казалось бы, как в таких условиях можно получить «приличные» результаты? Однако попробовать можно. Давайте построим еще один график, но вместо среднего FPS, как на Графике 1, возьмем минимальный FPS из того же файла FRAPS с именем «…minmaxavg.csv». Смотрите, что получится.
График 2
Теперь линии графиков ведут себя гораздо ближе к теории. При увеличении числа ботов в игре минимальный FPS уже не превышает предыдущих значений и графики стремятся к оси Х более плавно. Почему так получается? Давайте вспомним определение среднего FPS – это суммарное количество кадров, отрендеренных в процессе тестирования демо-сцены, поделенное на время тестирования. То есть, средний FPS есть величина интегральная. А вот минимальный FPS величина несколько другого рода, и характеризует уровень «провалов» FPS в процессе тестирования демо-сцены. В наших условиях тестирования эти «провалы» обусловлены не видеокартой, поскольку она совсем не нагружается, а загрузкой центрального процессора. Увеличивая число ботов, мы нагружаем CPU, то есть на просчет каждого кадра требуется все больше и больше времени. Таким образом, минимальный FPS как величина, обратная времени, должен уменьшаться. Именно это мы и видим на графиках.
Продолжим. Для дальнейшего изложения мы воспользуемся методами, указанными в статье «Методика тестирования видеокарт 2007. Использование FRAPS». Сейчас мы продемонстрируем, как «разделяются» FPS на два типа – те, которые зависят от GPU, и те, которые зависят от CPU. Звучит ненаучно и совершенно фантастично, но это так. Давайте возьмем платформу Core 2 Duo @ 2,93 ГГц и построим диаграммы распределения FPS для разного числа ботов. Итак.
График 3
Когда число ботов равно нулю, а главный герой стоит лицом к стенке, мы видим один колокол распределения, причем весьма узкий. Так и должно быть. Поскольку ничего не происходит, видеокарта рисует столько кадров сколько может, с незначительными флюктуациями вокруг среднего значения равного 151 FPS. Увеличим число ботов до 10 штук.
График 4
Как видите, при увеличении числа ботов главный пик остается практически на том же месте, но колокол «размазывается» по оси Х. Как видно из Графика 2, заметное проседание минимального FPS на платформе Core 2 Duo @ 2,93 ГГц начинается с 14 ботов (в наших условиях тестирования). Давайте возьмем 16 ботов, так сказать – с запасом, и посмотрим на диаграмму распределения FPS.
График 5
И опять получаем главный пик на уровне 150 FPS и размазанный по оси Х спектр. Но что это, левая часть спектра отделилась от основной массы и образует отдельный «колокол»! Смею утверждать, что этот левый колокол как раз и образован из значений FPS, зависящих от производительности центрального процессора. Если предположение верно, то при увеличении нагрузки на CPU (добавлении ботов), «колокол CPU» будет смещаться влево по оси Х. Давайте проверим. Возьмем 24 бота.
График 6
Как видите, «колокол CPU» действительно смещается влево. Если взять 30 ботов и более, то такое «движение» станет еще более очевидным.
График 7
График 8
Помимо смещения влево колокола, образуемого «процессорными» FPS, на этих диаграммах прослеживается еще одна очень интересная тенденция. Во-первых, увеличивается расстояние между левой и правой частями распределения FPS, впрочем, так и должно быть. Во-вторых, правая часть распределения также несколько смещается влево. В-третьих, по мере роста нагрузки на CPU, количество FPS в правой части распределения значительно уменьшается по сравнению с количеством значений в левом «колоколе». О чем это говорит? Скорее всего, о том, что CPU настолько «поглощен работой», что не в состоянии выдать видеокарте требуемое количество «каркасов для раскраски». Подчеркнем, что такая картина распределения справедлива для всех платформ.
Возможна ли такая ситуация, когда CPU будет загружен настолько, что второй (правый) колокол просто исчезнет? Возможна. И это можно продемонстрировать, если мы увеличим количество ботов для этой платформы или… возьмем другую платформу, «послабее». Давайте возьмем ту же платформу на базе Intel Core 2 Duo, но с частотой центрального процессора не 2,93 ГГц, а 1,87 ГГц. Ниже приведена диаграмма распределения FPS при количестве ботов 30 штук.
График 9
А далее приведем диаграмму для этой же платформы Intel Core 2 Duo @ 1,87 ГГц, но уже с числом ботов равным 32 штуки.
График 10
Как видите, правый колокол распределения исчез. Центральный процессор уже не позволяет продемонстрировать всю свою мощь видеокарте, которая при этом совершенно не нагружена.
Означает ли это что, выражаясь разговорным языком, процессор «не тянет» видеокарту? В принципе, можно сказать и так. Но с другой стороны, с этой же видеокартой этот же самый процессор 30 ботов, выходит, тянет? На самом деле, видеокарта здесь не при чем. В данных условиях центральный процессор «не тянет» возложенную на него нагрузку, и какая бы видеокарта не присутствовала в системе, результат отличался бы не сильно (если, конечно, видеокарта не полный low-end).
Теперь можно сформулировать граничный критерий недостаточной мощности CPU. Если в заданных условиях (игры или тестирования) нагрузка на видеокарту минимальна, а на диаграмме распределения FPS правый колокол распределения «исчезает», то производительность центрального процессора – недостаточна.
И еще одно важное практическое следствие, обусловленное «исчезанием» правого колокола распределения. В этот момент должно наблюдаться резкое падение среднего FPS. И вот почему. Пока присутствуют оба колокола распределения, очевидно, средний FPS будет находиться между ними. Если же правый колокол исчезает, то средний FPS будет находиться примерно посередине оставшегося левого колокола. Если мы вычислим средний FPS на основе мгновенных FPS из Графиков 9 и 10, то получим, что для Графика 9 средний FPS будет равен 68, а для Графика 10 – всего 23. Как видите – трехкратный скачок в показываемой производительности при добавлении всего лишь двух «лишних» ботов, при этом от видеокарты совершенно ничего не зависит.
ЗаключениеНет никаких сомнений, что данный материал вызовет неоднозначную реакцию читателей и оставит очень противоречивые впечатления. Да, по сути, это частный случай тестирования одной единственной игры. Да, условия тестирования также выглядят нереально «синтетическими» (где это видано – «играть в игру, стоя лицом к стенке»). Да, измерение FPS утилитой FRAPS вносит приличную погрешность, особенно на коротких интервалах времени и при неидентичных демо-сценах. Критерий, который был сформулирован в конце статьи, тоже достаточно трудно использовать на практике. Все это так. Тем не менее, не претендуя на микронную точность количественных измерений, мы получили весьма интересные качественные результаты о «вкладе» центрального процессора в общую производительность системы. Конечно, много вопросов осталось открытыми, но мы надеемся, что данное исследование все же будет вам интересно или, по крайней мере, даст пищу для размышлений. Обсудить на форуме
⇣ Содержание
Если Вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
|