Оригинал материала: https://3dnews.ru/183374

Игровой движок Unreal следующего поколения: производительность ускорителей

Перевод: Дмитрий Чеканов
Оригинал: Anandtech

При измерении производительности ускорителей в играх мы обычно тестируем современные карты на современных играх. Долгое время самым популярным игровым тестом была Quake III Arena, и вы наверняка еще помните те времена, когда лишь немногие конфигурации могли запускать эту игру с достаточными fps при полных визуальных опциях. Сегодня ситуация уже совсем иная: мы уже привычно констатируем 200+ fps в Quake III Arena.

В последнее время появились и другие игровые тесты. Скажем, Serious Sam обладает движком с богатыми возможностями настройки, соответственно эта игра является довольно гибким инструментом в руках тестера. Можно вспомнить и Unreal Tornament, которая чаще всего больше зависела от процессора, чем от видеокарты.

Однако все эти тесты являются уже вышедшими играми. Мы можем лишь экстраполировать результаты и предположить производительность видеокарт в будущих играх, но точные значения мы получим лишь в момент выхода игры. Сейчас ни у кого не вызывает сомнение опасность вложения денег в видеокарту. С шестимесячным циклом разработки сегодняшний high-end через год станет повсеместно встречающимся товаром. Вот и приходится гадать, насколько данная видеокарта будет актуальна в будущем.

Посмотрите хотя бы на вышедшую почти 12 месяцев назад GeForce3. Карты было более чем достаточно для игр современного времени, но многие покупали ее из расчета превосходной производительности в будущих DirectX 8 продуктах. Что же мы имеем сегодня? Все еще нет ни одной сколь-нибудь популярной игры, задействующей DX8 возможности GeForce3. И те, кто купил карту в момент выпуска, прогадали. Уже через полгода можно было купить GeForce3 дешевле, да и с большей производительностью.

Мы только что рассмотрели позицию конечного пользователя. А теперь встаньте на место разработчика. Они пытаются создать игру максимально эффектной, но для этого им нужно «железо», драйвер и API. В то же время изготовители видеокарт, типа ATi и nVidia, не будут терять драгоценное место на кристалле для внедрения тех функций, которые не будут востребованы в ближайшее два года. Мы приходим к стандартной проблеме курицы и яйца. Слава Богу, ATi и nVidia уже выпустили «яйца» в своих DX8 чипах.

Переходим к драйверам. Будут ли производители видеокарт тратить драгоценное время программистов на оптимизацию драйверов под те возможности чипа, которые не будут востребованы в ближайшие 6-12 месяцев, или в основу будет положена оптимизация под существующие сегодня тесты и игры? Ответ очевиден, но что же делать в такой ситуации разработчикам игр? Им приходится использовать доступные сегодня карты, чтобы создать и протестировать движки следующего поколения. Если же на доступных сегодня драйверах их движок следующего поколения не заработает, то разработчикам придется либо ждать, пока производители чипа исправят драйверы (а это не принесет быстрой отдачи производителям), либо значительно оптимизировать движок на конкретные модели видеокарт (или конкретную марку). Сейчас на рынке осталось лишь два значимых производителя – ATi и nVidia. Поэтому сегодня как никогда важно внимание производителей не только к конечным пользователям, но и к разработчикам. Кстати, мы рады вам сообщить, что в нынешнее время ATi и nVidia почти всегда прислушиваются к проблемам разработчиков с драйверами.

Итак, мы очертили ряд проблем, возникающих как перед тестером, так и перед разработчиком. Но как же их решать?

К счастью, нам удалось пообщаться с одной из компаний-разработчиков, и результат вы можете видеть ниже.


Движок Epic

С именем «Epic» знаком каждый игрок. Эта компания выпустила множество продуктов, начиная с Epic Pinball и заканчивая Unreal Tournament, не без участия команды талантливых разработчиков.

Движок Unreal, без сомнения, является детищем Epic. Движок много раз эволюционировал, а первую его итерацию мы наблюдали в игре Unreal. Многие из вас играли в Unreal Tournament, созданной на последующей версии движка. Вскоре же мы увидим такие игры, как Unreal Tournament II, Unreal II и Unreal Championship (Xbox), в которых будет задействована новая версия движка.

Имейте в виду, что новая версия движка значительно изменилась со времени Unreal Tournament. Об этом говорит и номер версии. Если в Unreal Tournament использовался билд 436, то современная версия Unreal Engine – 848.

Основные изменения коснулись увеличения числа полигонов, используемых движком в каждой конкретной сцене. Причины поняты – мощь видеоускорителей значительно возросла в последнее время. А учитывая выход ATi Radeon 8500 и nVidia GeForce3 Ti 500 (равно как и обещания выпуска более мощных карт), разработчики в Epic продолжают экспериментировать над увеличением детализации сцен.

Используя последний билд движка Unreal, Epic выпустила тест Unreal Performance Test 2002. Он рассчитан на максимальную нагрузку процессора и видеокарты, используя движок, который мы увидим в будущих играх. С помощью Epic мы сможем более уверенно ответить на вопрос: а как ваша система будет работать в будущих играх.

Если вы помните, первый движок Unreal поддерживал программный рендеринг, сейчас же он полностью переделан под аппаратный, что увеличивает преимущества этого теста при измерении производительности чипа.

Следует сразу оговориться, что Unreal Performance Test 2002 не является законченным продуктом, он постоянно дорабатывается, поскольку модернизируется основа теста – движок Unreal. По мере выпуска новой версии теста, равно как и новых версий драйверов и видеокарт, мы будем возвращаться к этому тестированию.

Текущая версия движка в использованном нами тесте – 848. И хотя в нем пока что не задействуются программируемые пиксельные/вершинные шейдеры, мы считаем его наиболее эффективным тестом GPU из всех существующих.

Для того, чтобы вы поняли всю сложность движка и теста, мы попросили двух ведущих специалистов Epic, Даниеля Вогеля (Daniel Vogel) и Тима Свини (Tim Sweeney), дать краткую его характеристику.

«Unreal Performance Test 2002 на сегодняшний момент заключается в полете над территорией, содержащей около 100.000 треугольников. По своей природе данный тест сильно зависит от пропускной способности памяти GPU. Для загрузки же центрального процессора мы добавили 14 роботов, случайно появляющихся на территории.

Для получения статистики использовалось 2510 кадров в режиме максимально быстрого рендеринга. Фиксированная частота кадров в игре – 30 fps. Первые 10 кадров отбрасываются».

Обратите внимание, что число полигонов здесь в 50-100 раз больше, чем было в Unreal Tornament. Использование же текстур возросло раз в 8. Благодаря DXT компрессии текстур, нагрузка на пропускную способность памяти увеличилось только в 2 раза.

Тест не является синтетическим, он специально разработан для получения представления о производительности последних билдов Unreal Engine. Это не просто полет над поверхностью, это именно симуляция, скажем, типичной нагрузки для стрелялки от первого лица.

К сожалению, Unreal Performance Test 2002 не является публично доступным, так что мы не можем его распространять.


Тестирование

Данная статья является лишь предварительным, установочным тестированием. Поэтому мы использовали лишь одну конфигурацию. Для максимального уменьшения зависимости от процессора был использован топовый процессор Athlon XP 2000+. В будущем же мы проанализируем влияние как процессора, так и остальной системы на результаты.

Тестирование производилось в пяти разрешениях с отключенной v-sync: 640x480x32, 800x600x32, 1024x768x32 и 1600x1200x32.

Тестовая система на базе Windows XP
Аппаратное обеспечение
Процессор AMD Athlon XP 2000+
Материнские платы ASUS A7V266-E (KT266A)
Память 256 Мб Crucial PC2100 DDR SDRAM
Жесткий диск 7200 об/мин
IBM Deskstar 30GB 75GXP Ultra ATA/100
Видеокарта ATI Radeon 8500 64 Мб DDR
ATI Radeon 7500 64 Мб DDR
ATI Radeon 64 Мб DDR

NVIDIA GeForce3 Ti 500 64 Мб DDR
NVIDIA GeForce3 64 Мб DDR
NVIDIA GeForce3 Ti 200 64 Мб DDR
NVIDIA GeForce2 Ti 200 64 Мб DDR
NVIDIA GeForce2 Pro 64 Мб DDR
NVIDIA GeForce2 Ultra 64 Мб DDR
NVIDIA GeForce2 MX 400 64 Мб DDR
NVIDIA GeForce2 MX 200 32 Мб SDR
NVIDIA GeForce 64 Мб DDR
NVIDIA GeForce 256 32 Мб SDR

Hercules 3D Prophet 4500 64 Мб SDR
Программное обеспечение
Операционная система и драйверы Windows XP Professional

ATI Radeon 8500 Drivers v6.13.10.3286
ATI Radeon 7500 Drivers v6.13.3276
NVIDIA Detonator 4 v23.11
Hercules 3D Prophet 4500 14.02 Drivers


Если вы посмотрите на результаты ускорителей в современных играх при разрешении 640x480, то все, что находится выше GeForce2 Pro, показывает примерно равные результаты. Здесь, как видите, ситуация иная.

Лучшие результаты здесь показала карта Radeon 8500, хотя отрыв от GeForce3 Ti 500 совсем небольшой. К сожалению, на Radeon 8500 возникла небольшая проблема в виде мерцающего тумана, о чем мы уже оповестили ATi. Проблема будет решена в следующей версии драйверов.

Еще одна интересная деталь: Radeon 7500 показал себя значительно лучше, чем в сегодняшних играх. Разрыв от GeForce3 составляет всего лишь 4%. Несмотря на то, что GeForce3 исполнился почти год, она все еще находится в первой тройке.

Между GeForce2 Ultra и GeForce3 Ti 200 не наблюдается существенной разницы, поскольку Ultra имеет намного большую частоту, чем GeForce3 Ti200. Главное же преимущество GeForce3 Ti200 заключается в улучшенном контроллере памяти и поддержке программируемых вершинных/пиксельных шейдеров.

Мы также включили в тестирование Kyro II, который не имеет встроенного модуля T&L и использует центральный процессор для обработки треугольников и вершин. На пару с таким мощным процессором, как Athlon XP 2000+, Kyro II превосходит все карты low-end и опасно близко подходит к первому ATi Radeon. С мощным процессором Kyro II выглядит хорошим low-end решением, но давайте посмотрим, как изменится ситуация при увеличении разрешения.

При увеличении разрешения разрыв между Radeon 8500 и GeForce3 Ti500 усугубляется, превосходя 14%. Как мы считаем, такие результаты связаны с лучшей реализацией HyperZ II по сравнению с визуальной подсистемой nVidia, но доказать это нельзя. Раскладка особо не изменилась, однако GeForce3 Ti200 «перепрыгнула» ATi Radeon 7500 на 15%.

Kyro II поднялся вверх и сейчас он лишь на 6% отстает от GeForce2 Ti200.

Если посмотреть на этот тест с точки зрение приемлемой игровой производительности, то линейка GeForce2 MX оказалась слишком медленной, равно как и первый Radeon. Выше 800x600 они вряд ли станут полезными.

Самое популярное разрешение 1024x768 дает интересную картину. Разрыв между Radeon 8500 и GeForce3 Ti500 сократился до 6%. Kyro II достиг производительности уровня GeForce2 Ti200, и все благодаря мощному центральному процессору. В будущем мы постараемся более глубоко исследовать зависимость результатов Kyro II от мощности центрального процессора. Интересно, какова должна быть его мощность, чтобы Kyro II смог конкурировать с аппаратными T&L решениями от ATi и nVidia.

Обратите внимание, как сильно упала производительность Radeon 7500. Как показало дальнейшее тестирование, такая аномалия наблюдается лишь в 1024x768. Скорее всего, ошибка здесь в драйверах.

Если мы будем считать 30 fps порогом для нормальной игры, то вам понадобится карта не хуже GeForce3 Ti200. По всей видимости, пришло время выжимать производительность из драйверов.

И вновь Radeon 8500 и GeForce3 Ti500 идут голова в голову. Результаты остальных ускорителей весьма скромны, поскольку 1280x1024 явно оказывается им не по зубам.

Порог в 30 fps превзошли только GeForce3 Ti500 и Radeon 8500.

А вот при 1600x1200 вы не сможете комфортно поиграть ни на одной современной видеокарте.


Заключение

Пока мы не протестировали несколько систем, вряд ли имеет смысл подводить окончательные итоги. Тем более что движок Unreal находится в состоянии разработки, и при должной поддержке в драйверах, производительность ускорителей должна возрасти. Однако уже сейчас можно взглянуть на то, как будут работать на наших картах будущие игры (при максимальном качестве).

Но все же нам хотелось бы сделать четыре вывода.

  1. Radeon 8500 показал исключительно хорошие результаты, потеряв лидерство только при максимальном разрешении 1600x1200. Единственное, что нас беспокоит, останется ли производительность такой же высокой, когда будет исправлена ошибка с туманом.
  2. Первая GeForce3, учитывая ее огромную цену год назад, все же входит в тройку лучших ускорителей. Согласитесь, приятно услышать, что технология, выпущенная на рынок год назад, не устарела.
  3. Судя по результатам, частота GPU будет вскоре играть более значимую роль, чем в прошлом. При этом хорошо бы сохранить идеальный баланс между частотой GPU и памяти, как это сделано в GeForce3.
  4. Low-end решения от ATi и nVidia показали отвратительные результаты, так что вам действительно стоит их обновить в будущем.

На ряд вопросов мы пока еще не получили ответы, учитывая вопрос об актуальности аппаратного T&L на медленных системах. Так что наше исследование будет продолжено.





Оригинал материала: https://3dnews.ru/183374