Если нужно выбрать самое яркое свидетельство прогресса в компьютерных технологиях, убедительное не только в глазах специалистов, но и для широкой публики, то это, без сомнения, будет мобильный гаджет — смартфон или планшет. Вместе с тем, и более консервативный класс устройств — ноутбуки — прошел громадный путь: от дополнения к настольному ПК, с ограничениями которого волей-неволей приходится мириться, чтобы иметь возможность поработать в дороге, к полноценной замене громоздкого десктопа. Размеры уменьшаются, а быстродействие растет. Многим пользователям теперь и не нужна какая-либо интеллектуальная техника помимо ноутбука и смартфона, ведь компактные компьютеры весом меньше 2 кг годятся для большинства повседневных надобностей. Даже требовательные игры, в прошлом привязанные к башенным ПК с энергопотреблением в несколько сотен ватт, стали привычным явлением на экранах ноутбуков.
Осталась единственная зона, в которой десктопы не уступают своего безоговорочного лидерства — рабочие приложения для создания цифрового контента. В отличие от сравнительно легкого софта для простых смертных — офисных пакетов и веб-браузеров, — а также игр, запросы которых легко отрегулировать под возможности железа, профессиональные инструменты видеомонтажа и, тем паче, 3D-рендеринга (а в какой то мере даже средства обработки фотографий) съедают все ресурсы быстродействия, какие только есть. Считается, и не без оснований, что пользоваться ими на мобильном компьютере без связи с фермой рендеринга в серверной комнате можно разве что за неимением лучших вариантов или тогда, когда компьютер трудно, не краснея, назвать действительно мобильным. Но как долго еще продержится status quo?
Сразу отметим, что в этом вопросе нам чужд безграничный оптимизм: для рабочих задач с высокими требованиями к времени и качеству результатов ситуацию невозможно изменить в корне, а неподвижная рабочая станция или выделенная ферма всегда будут царить в коммерческой сфере. Тем не менее, не станем закрывать глаза на то, что ноутбук уже стал вполне состоятельным инструментом для производства визуального контента в небольших масштабах. Обработка фото с цифровой камеры, графический дизайн в 2D или нарезка видео в умеренном разрешении и без изысканных форматов сжатия — все это по зубам стандартной переносной машине, иной раз даже без дискретного графического процессора. Магистраль развития лежит не в этих крайностях, а где-то между роликом на YouTube и Голливудом, и у производителей сейчас есть масса возможностей для того, чтобы сделать следующий крупный шаг вперед.
Эта статья посвящена двум связанным между собой задачам. Во-первых, мы намерены выяснить, на что способны ноутбуки в рабочих приложениях, причем с большим размахом по ресурсоемкости ПО — от казуальной обработки фотографий одной кнопкой до видеомонтажа и 3D-рендеринга на коммерческом уровне. И тестовое железо для этой цели тоже выбрали максимально разношерстное — несколько ноутбуков под управлением антагонистичных операционных систем (Windows и macOS), с разными процессорами (от двух до шести ядер) и графикой (интегрированной интеловской либо дискретными GPU разного уровня). Такой подход, хоть и не претендует на научность и четкие рекомендации, которые привыкли видеть посетители 3DNews, позволит отметить несколько опорных точек в множестве возможных комбинаций железа и рабочего ПО, а если читатели поддержат наш экскурс в сферу профессиональных приложений, то в дальнейшем мы направим усилия в сторону более широких и одновременно сфокусированных исследований.
С другой стороны, мы обратим внимание на последнюю инициативу хорошо знакомой читателям компании NVIDIA в области мобильных ПК, которая, в конечном счете, и подтолкнула нас к работе над этим обзором. Сравнительно недавно, в конце мая, с трибуны Computex объявили, что к прилавкам движется плеяда мобильных компьютеров под маркой RTX Studio, благодаря которой NVIDIA собирается демократизировать и в то же время окончательно подмять по себя рынок мобильных рабочих станций. Неужели NVIDIA решила стать производителем ноутбуков, а если нет, то что в действительности представляет собой программа RTX Studio и какие преимущества она несет создателям цифрового контента?
Если честно, когда автор статьи впервые услышал о программе RTX Studio, но не успел прочитать пресс-релиз, он и вправду подумал, что NVIDIA выпустила ноутбуки под собственным брендом, и даже не слишком удивился такому известию. Как ни крути, NVIDIA не чужды смелые эксперименты, компания то и дело стремится проникнуть в, казалось бы, несвойственные ей рыночные ниши, ценит такие понятия как «экосистема» и «вертикальная интеграция» и в целом движется от производства чипов к законченным потребительским и профессиональным продуктам. К примеру, стоечные фермы и отдельно стоящие рабочие станции для рендеринга и GP-GPU «зеленые» уже поставляют напрямую покупателям. Не будем гадать, какие решения NVIDIA примет в будущем, но в данный момент она преследует другую цель.
RTX Studio представляет собой сертификацию компьютеров различных производителей на соответствие определенным конфигурациям железа, отказоустойчивости и другим эксплуатационным характеристикам, связанным с рабочими задачами. Причем среди одобренных NVIDIA систем есть не только ноутбуки, но также машины 3-в-1 и настольные ПК. Все компьютеры располагают видеокартой уровня GeForce RTX 2060 и выше — вплоть до TITAN RTX, — а список остальных компонентов включает центральный процессор Intel Core i7 или i9, не меньше 16 Гбайт оперативной памяти и твердотельный накопитель объемом от 512 Гбайт. Системы с графикой Quadro (RTX 3000, 4000 и 5000) отнесены к отдельной категории рабочих станций — стационарных или мобильных.
Наклейкой RTX Studio уже обзавелись в общей сложности 27 ноутбуков восьми производителей: Acer, ASUS, Dell, GIGABYTE, HP, Lenovo, MSI и Razer. Розничные цены устройств начинаются с отметки $1599 за базовую конфигурацию, и в то же время стоимость более развитых моделей, особенно в комплектации с видеокартой Quadro, легко может достигнуть нескольких тысяч долларов.
Таким образом, исключительно со стороны железа программа RTX Studio служит в качестве фильтра, исключающего из множества систем, претендующих на высокий уровень производительности, несбалансированные конфигурации — к примеру, без запаса по объему RAM и SSD, — и продукты в целом сомнительного качества, т. к. сертификация подразумевает проверку и тестирование железа со стороны NVIDIA.
Однако для того, чтобы удостоиться марки RTX Studio, ноутбук или моноблок обязан иметь еще и достаточно хороший дисплей. Минимальные требования на сайте NVIDIA указывают только на разрешение 1080p или 4К, но из других документов можно сделать вывод, что ноутбук RTX Studio должен и в этом так или иначе выделяться среди себе подобных — будь то функция G-SYNC или другие особенности, более значимые в профессиональном контексте: цветовой охват, широкий динамический диапазон, сертификация PANTONE и т. п. Получается, наличие значка RTX Studio гарантирует определенный уровень качества изображения у той или иной машины, но не закрывает этот вопрос окончательно. Нам хотелось бы увидеть более строгий перечень требований к характеристикам экрана, коль скоро NVIDIA не просто фокусируется на голой производительности CPU и GPU, а стремится упростить выбор платформы творцам визуального контента.
Вместе с тем, программа RTX Studio не исчерпывается сертификацией компьютеров и включает обширный набор ПО, дополняющий возможности распространенных инструментов дизайна, разработки и отладки приложений. Все API и SDK, входящие в NVIDIA Studio Stack, можно разбить на три категории: средства обработки видео и статичных изображений, пакеты для 3D-моделирования и программирования (библиотеки материалов, профилировщики, SDK под различные графические API и т. д.), а также, разумеется, библиотеки для полного цикла тренировки и применения нейросетей.
Наконец, специально для рабочих приложений NVIDIA развивает отдельную ветку драйверов GPU под Windows 10, которую раньше называли Creator Ready, а теперь тоже окрестили Studio. Однако список поддерживаемых ею видеокарт не сводится к участникам программы RTX Studio и распространяется на формально устаревшие модели 10-й серии, начиная с GeForce RTX 1050. Как утверждают разработчики, «студийный» драйвер содержит все оптимизации для игр, свойственные выпускам Game Ready, но подвергается проверке на стабильность в ключевых рабочих приложениях (включая одновременную работу нескольких таких программ) и открывает некоторые функции, недоступные игровому драйверу — такие, как поддержка цвета с разрешением 10 бит на один канал в приложениях Adobe, ранее активная только в драйвере для ускорителей Quadro.
Вдобавок к этому Studio обещает определенный рост производительности в соответствующем ПО. В наших бенчмарках мы не нашли статистически значимой разницы результатов между драйвером Game Ready и Studio, однако не будем исключать возможности, что попросту искали преимущество не там, где следует, а в ПО, выходящем за рамки нашей тестовой методики, при использовании специфических функций или на другом железе драйвер Studio действительно может использовать ресурсы GPU более эффективно.
Также заметим, что выпуски Game Ready и Studio нумеруются по общей схеме, но профессиональный пакет обновляется значительно реже, чем игровой в связи с тем, что его выпуски привязаны к крупным обновлениям приложений для создания контента. В период работы над статьей была доступна версия 431.86 от четвертого сентября, хотя свежий игровой драйвер 436.48 вышел первого октября. Если учесть, насколько сильно производительность игры (или попросту возможность ее запустить) может зависеть от драйвера видеокарты, пользователям компьютеров RTX Studio придется иногда жонглировать драйверами, чтобы отвлечься от работы.
Вот вся ключевая информация о программе RTX Studio, которая пригодится покупателю рабочей лошадки с графическим процессором нового поколения на борту и, надеемся, поможет сделать выбор в пользу подходящей конфигурации. А нам осталось выяснить, каким образом кампания NVIDIA в сфере профессиональных приложений соотносится с широкой темой нашего исследования — производительностью ноутбуков в ПО для обработки цифрового контента, — и как она в итоге может повлиять на диапазон задач, которые уже вполне по силам массовым лэптопам, или, наоборот, до сих пор считаются прерогативой стационарных рабочих станций.
NVIDIA неспроста именно сейчас стремится увеличить свои и без того обширные владения на профессиональном рынке. Уже в то время, когда были представлены первые видеокарты на чипах Turing (тогда еще лишь для настольных компьютеров) не было ни малейшей причины усомниться в том, что новаторские функции семейства RTX — аппаратное ускорение трассировки лучей и обработка данных нейросетями (inference) — рано или поздно найдут дорогу в рабочие приложения и будут востребованы в этой сфере не меньше, а то и больше, чем в играх. Последнее утверждение могло прозвучать двусмысленно, если учесть, что большинство игроделов пока не торопятся интегрировать трассировку лучей и масштабирование изображения при помощи DLSS в свои продукты, а волна громких релизов под флагом RTX On накроет геймеров не раньше, чем в конце текущего-начале следующего года. Однако нужно понимать, чем отличается рынок профессионального ПО от игровой индустрии.
С одной стороны, он более консервативен: инструменты для создания цифрового контента дорого обходятся и разработчикам, и покупателям. Определенный софт используют годами, обслуживают годами, отлаживают рабочие процессы, и пользователи не торопятся переходить на следующую версию исключительно ради новых заманчивых функций. С другой стороны, этот рынок быстро воспринимает полезные инициативы и нередко в одночасье прекращает поддержку устаревших или просто неудобных технологий, не волнуясь о клиентах, оказавшихся за бортом. Создателям игр приходится учитывать, что владельцев ускорителей GeForce RTX пока не так уж много, а ведь каждой студии нужно проделать собственную часть работы, чтобы задействовать «лучи» и DLSS вместо того, чтобы попросту взять свежую сборку Unreal Engine или Unity. Напротив, рабочий софт для 3D-моделирования или видеомонтажа связан в единую инфраструктуру с массой общих компонентов — SDK, рендереров, кодеков и т. д. Владельцы (или команды open source-разработчиков) этих инструментов не могли проигнорировать потенциал специализированных блоков в новых чипах NVIDIA. Интеграция в программы с громкими названиями может занять долгий срок, но как только поддержка со стороны софтверного сообщества наберет критическую массу, новые функции закрепятся в нем навсегда и быстро найдут широкое применение. Ведь, в отличие от игр, аппаратно-ускоренная трассировка лучей и нейросети в рабочих задачах не вызывают тормоза, а наоборот, приносят чистый выигрыш в производительности.
И к счастью, некоторые рабочие программы уже сейчас могут пустить RT-блоки и тензорные ядра чипов Turing в дело. Какие-то из них пока находятся лишь в статусе бета-версии (как 3D-рендерер Arnold с поддержкой Turing и ускорения на GPU как такового), а иные уже довели поддержку платформы RTX до коммерческого внедрения — это Adobe Photoshop Lightroom и рендерер Octane. Среди десятка приложений, которые мы выбрали для тестов ноутбуков, эти программы составляют немногим меньше трети. Согласитесь, более интересная пропорция по сравнению с игровой методикой 3DNews в обзорах дискретных видеокарт.
⇡#ASUS ZenBook Pro Duo (UX581GV)
Перед тем, как мы приступим к результатам бенчмарков и огласим полный список участников тестирования, следует отдать должное первому устройству под маркой RTX Studio, которое попало в наши руки, — разве что без значка на корпусе, ведь для него там просто нет подходящего места. Читатели, обнаружившие в ноутбуке сходство с недавнем гостем тестовой лаборатории — ASUS ZenBook Pro Duo UX581GV, — совершенно правы. Перед нами та же самая модель, однако список компонентов немного изменился: на этот раз вместо топовой модификации, включающей центральный процессор Intel Core i9-9980HK (восемь ядер, Hyper Threading и Turbo-частота вплоть до 5 ГГц) нам досталась версия с Intel Core i7-9750H (шесть ядер, Hyper Threading и Turbo-частота вплоть до 4,5 ГГц), а оперативной памяти здесь не 32, а 16 Гбайт.
В остальном конфигурация машины не претерпела ни малейших изменений со времен знакомства. ПЗУ представляет высокопроизводительный накопитель Samsung MZVLB1T0HALR объемом 1 Тбайт, который любит устанавливать в свои лэптопы ASUS — это полный аналог давно изученного нами Samsung 970 EVO, только для OEM-поставок, а не розничной продажи. Связь с внешним миром поддерживает чип Intel AX200 стандарта IEEE 802.11b/g/n/ac/ax, работающий на частотах 2,4 и 5 ГГц (с полосой пропускания 160 МГц) и теоретическим быстродействием вплоть до 2,4 Гбит/с. Он же обслуживает канал Bluetooth 5. А вот от проводной сети ASUS отказалась, хотя при необходимости к ZenBook Pro Duo можно подключить хоть внешний ethernet-адаптер без дополнительного питания, хоть коробку с 10-гигабитным NIC по интерфейсу Thunderbolt 3.
Все варианты UX581GV оборудованы видеокартой GeForce RTX 2060 с 6 Гбайт оперативной памяти. Причем, согласно спецификациям лэптопа, данная версия дискретной графики NVIDIA не относится к категории Max-Q, а следовательно должна работать под нагрузкой на достаточно высоких тактовых частотах по сравнению с аналогичными чипами в более компактных машинах, задушенных требованиями к охлаждению и автономной работе.
ASUS ZenBook Pro Duo UX581GV | |
---|---|
Дисплей | 15,6'', 3840 × 2160, OLED + 14'', 2840 × 1100, IPS |
Центральный процессор | Intel Core i9-9980HK Intel Core i7-9750H |
Видеокарта | NVIDIA GeForce RTX 2060 (6 Гбайт GDDR6) |
Оперативная память | До 32 Гбайт, DDR4-2666 |
Установка накопителей | 1 × M.2 (PCI Express x4 3.0), 256 Гбайт — 1 Тбайт |
Оптический привод | Нет |
Интерфейсы | 1 × Thunderbolt 3 (USB 3.1 Gen2 Type-C) 2 × USB 3.1 Gen2 Type-A 1 × 3,5 мм mini-jack 1 × HDMI |
Встроенный аккумулятор | Нет данных |
Внешний блок питания | 230 Вт |
Размеры | 359 × 246 × 24 мм |
Масса ноутбука | 2,5 кг |
Операционная система | Windows 10 x64 |
Гарантия | 2 года |
Цена в России | 237 590 рублей за тестовую модель с Core i7, 16 Гбайт RAM и 1 Тбайт SSD |
Но главная гордость ноутбука ASUS — это, разумеется, дисплей, а если точнее, сразу два. Основной экран компьютера представляет собой роскошную сенсорную OLED-панель размером 15,6 дюймов с разрешением 3840 × 2160 пикселов. Как и положено панелям на основе органических светодиодов, она отличается даже от эталонных жидкокристаллических аналогов «бесконечной» контрастностью и углами обзора. Кроме того, в отдельном обзоре ZenBook Pro Duo мы убедились, что дисплей весьма неплохо откалиброван по меркам массовых устройств и характеризуется чрезвычайно широким цветовым охватом. Площадку напротив основного экрана, сместив клавиатуру вниз, занимает дополнительный, тоже сенсорный, с разрешением 3840 × 1100. Для этой роли производитель выбрал IPS-панель, и даже на фоне соседнего OLED изображение на ней отлично выглядит и явно не обошлось без калибровки.
Это хороший знак, что первый образец семейства RTX Studio, который нам предстоит испытать в рабочих приложениях, оказался настолько добротным продуктом, как ASUS ZenBook Pro Duo. И все же не будем упускать из виду, что перед нами чрезвычайно дорогой компьютер: подопытную конфигурацию с процессором Intel Core i9-9750H и 16 Гбайт оперативки в России не найти за сумму меньше 237 590 руб. — по воле рынка она сейчас даже дороже, чем топовая версия, которую мы тестировали в прошлом месяце. Кроме того, есть два нюанса, которые не так важны для игр, но требуют внимания в контексте профессиональных приложений. Во-первых, графический адаптер GeForce RTX 2060 сам по себе имеет солидный запас быстродействия даже с поправкой на пониженные частоты по сравнению с десктопной видеокартой, но объем его оперативной памяти в 6 Гбайт может стать препятствием в задачах, требовательных к этому параметру — особенно в 3D-рендеринге сложных сцен.
А во-вторых, несмотря на то, что основной экран ZenBook Pro Duo прошел тесты цветопередачи с развевающимся флагом, у OLED есть известные недостатки. Для того, чтобы сдержать энергопотребление матрицы в необходимых рамках, управляющая ею логика ограничивает общий световой поток всех элементов, поэтому отдельно взятый пиксел на экране, залитом белым, не будет столь же ярким, как белая точка на черном фоне. В контексте ответственной работы с цветокоррекцией это также проблематично. Кроме того, ни один OLED-экран не застрахован от выгорания, и в результате может навечно сохранить для потомков отпечаток интерфейса ОС. Наконец, легко заметить, что в дизайне ZenBook Pro Duo основные органы управления явно остались на вторых ролях. Клавиатура, смещенная поближе к краю, — это, пожалуй, плюс, когда пользователь работает за столом, а вот к размеру некоторых клавиш, и, в первую очередь, расположению и скромной площади тачпада нужно будет приноровиться.
Для более тесного ознакомления с ZenBook Pro Duo UX581GV и результатами его тестирования в играх и повседневных задачах советуем читателям вернуться к полному обзору этого экспериментального и во многих отношениях чрезвычайно любопытного детища ASUS. А теперь настало время основного блюда — сравнения нескольких лэптопов (включая, разумеется, и этот) в профессиональных приложениях для обработки цифрового контента.
Методика тестирования
Для оценки производительности ZenBook Pro Duo и других устройств, против которых ноутбуку RTX Studio предстоит выступить в бенчмарках, мы сформировали подборку из десяти рабочих приложений. Некоторые из них в том или ином виде уже не раз послужили 3DNews в обзорах CPU, графических карт и готовых компьютеров. К другим мы, напротив, еще не прикасались, пока не приступили к работе над статьей, которую вы читаете в данный момент. Все программы тестовой методики предназначены для создания того или иного типа визуального контента, охватывают достаточно широкий круг задач и широкий диапазон вычислительной нагрузки. Двумя из них пользуются фотографы и графические дизайнеры — Adobe Photoshop и Lightroom. Второй блок приложений составляет ПО для конвертации и редактирования видео — Premiere Pro, DaVinci Resolve и REDCINE-X Pro. Последняя, и самая значительная доля тестов принадлежит инструментам 3D-рендеринга с применением трассировки лучей — пакетам Blender, Cinema 4D, Maya и рендереру OctaneRender.
Программа | Тест | Операционная система | Настройки | API | |
---|---|---|---|---|---|
Intel/macOS | NVIDIA/Windows | ||||
Adobe Photoshop CC 2019 | Puget Systems Adobe Photoshop CC Benchmark | Windows 10 Pro x64 / mac OS 10.14.6 | Basic Benchmark | OpenGL + OpenCL + Metal | CUDA |
Adobe Photoshop Lightroom Classic CC 2019 | Функция Enhance Details | — | Metal | DirectX 12 | |
Adobe Premiere Pro CC 2019 | Puget Systems Adobe Premiere Pro CC Benchmark | Standard Benchmark | Metal | CUDA | |
Blender 2.8 | Демо Classroom | Рендерер Cycles | Н/Д (рендеринг на CPU) | CUDA | |
MAXON Cinema 4D Studio R20 | Демо Bamboo из дистрибутива Cinema 4D Studio R20 | Рендерер Radeon ProRender | Н/Д (рендеринг на CPU) | OpenCL | |
Демо Coffee Beans из дистрибутива Cinema 4D Studio R20 | |||||
Blackmagic Design DaVinci Resolve Studio 16 | Эффекты цветоворрекции (исходник 4K Blackmagic RAW) | Профиль экспорта H.264 Master (4K@23,976 FPS) | Metal | CUDA | |
Speed Warp (исходник H.264 1080p) | |||||
Autodesk Maya 2019 | Демо Sol от NVIDIA | Рендерер Arnold | Н/Д (рендеринг на CPU) | CUDA | |
OTOY RTX Octanebench 2019 | — | Windows 10 Pro x64 | — | — | CUDA |
REDCINE-X PRO | Декодирование файлов RED R3D с разрешением 4К, 6К и 8К | — | Н/Д (декодирование на CPU) | CUDA |
В отличие от игр, которые доминируют в обзорах мобильных компьютеров на 3DNews, профессиональное ПО лишено встроенных средств измерения быстродействия. По этой причине тестовая процедура в большинстве избранных нами программ построена вокруг ресурсоемкого (преимущественно в отношении GPU) проекта, созданного специально для этой цели. Только у рендерера Octane есть собственный бенчмарк. И наконец, для тестирования продуктов Adobe — Photoshop и Premiere Pro — мы воспользовались комплексными скриптами Puget Systems, которые дают возможность оценить производительность железа на нескольких этапах обработки контента. В комментариях к каждому бенчмарку мы расскажем более подробно о его устройстве и о том, как следует интерпретировать результаты.
Поскольку в сравнении устройств приняли участие ноутбуки ASUS и Apple, большинство тестов выполнено в родной для каждого из них среде — Windows 10 Pro x64 или macOS 10.14.6. Только REDCINE-X PRO в связи с особенностями тестовых скриптов пришлось запускать под Windows даже на «Маках», а нужной версии Octanebench для Mac просто не существует. Компьютеры с графическими процессорами NVIDIA прошли тестирование под управлением драйвера Studio версии 431.86, актуальной в период работы над обзором.
Выбирая системы для сравнения в рабочих приложениях, мы остановились на четыре лэптопах, принадлежащих к широкому диапазону производительности по совокупности главных характеристик — параметрам центрального процессора (от двух до шести ядер с SMT) и GPU (интегрированная графика, дискретный игровой чип начального уровня GeForce GTX 1050 или достаточно мощный RTX 2060) и оперативной памяти (8–16 Гбайт). Вместе с тем, мы не стали брать в расчет конфигурации, ограниченные скоростью ПЗУ (все ноутбуки оборудованы твердотельными накопителями для шины PCI Express), ультракомпактные машины наподобие снятых с производства 12-дюймовых «Макбуков» и, с другой стороны, многокилограммовые рабочие станции, по мощности компонентов смыкающиеся с десктопными ПК.
Устройство | CPU | Оперативная память | Интегрированный GPU | Дискретный GPU | Основной накопитель |
---|---|---|---|---|---|
ASUS ZenBook Pro Duo UX581GV | Intel Core i7-9750H (6/12 ядер/потоков, 2,6–4,5 ГГц) | DDR4 SDRAM, 2666 МГц, 16 Гбайт | Intel UHD Graphics 630 | NVIDIA GeForce RTX 2060 | Samsung MZVLB1T0HALR (PCIe 3.0 x4) 1024 Гбайт |
ASUS TUF Gaming FX705G | Intel Core i5-8300H (4/8 ядер/потоков, 2,3–4,0 ГГц) | DDR4 SDRAM, 2666 МГц, 8 Гбайт | Intel UHD Graphics 630 | NVIDIA GeForce GTX 1050 (4 Гбайт) | Kingston RBUSNS8154P3128GJ (PCIe 3.0 x2) 128 Гбайт |
Apple MacBook Pro 13.3", Mid 2019 (A2159) | Intel Core i5-8257U (4/8 ядер/потоков, 1,4–3,9 ГГц) | LPDDR3 SDRAM, 2133 МГц, 16 Гбайт | Intel Iris Plus Graphics 645 | — | Apple AP1024N (PCIe 3.0 x4) 1024 Гбайт |
Apple MacBook Air 13.3", Mid 2019 (A1932) | Intel Core i5-8210Y (2/4 ядра/потока, 1,6–3,6 ГГц) | LPDDR3 SDRAM, 2133 МГц, 16 Гбайт | Intel UHD Graphics 617 | — | Apple AP1024N (PCIe 3.0 x4) 1024 Гбайт |
⇡#Adobe Photoshop Lightroom Classic CC 2019
Список тестовых задач открывает, пожалуй, самый легковесный из сегодняшних бенчмарков в доступном и простом для освоения, но от того отнюдь не ограниченном в возможностях пакете обработки фотографий Photoshop Lightroom. Ускорение расчетов силами графического процессора — совсем не новость для программ Adobe. Как «большой» Photoshop, так и Lightroom применяют GPU для рендеринга и редактирования изображений, но в актуальной версии пакета видеокарта помогает решать еще одну задачу, неразрывно связанную с обработкой фотографий в RAW-формате — т. н. «дебайеринг».
Матрица цифровой фотокамеры представляет собой мозаику фоточувствительных элементов, каждый из которых накрыт светофильтром одного из основных цветов (красного, зеленого или синего), а распределение светофильтров по поверхности матрицы и пропорция площади, принадлежащей основным цветам, подчиняется алгоритму Байера, соответствующему особенностям человеческого восприятия. В связи с этим отдельный элемент получает лишь, условно, одну треть всей информации о цвете проецируемого оптикой участка изображения, а фотография в RAW-формате является, по сути, черно-белым изображением сверхвысокого разрешения. Для того, чтобы превратить картинку в цветную, и требуется процедура «дебайеринга» (или demosaicing), в основе которой лежит интерполяция яркости группы соседних субпикселов.
Хотя интерполяцию способен выполнить процессор цифровой камеры, а вычислительная мощность чипов и ПО непрерывно совершенствуются, настольный компьютер или ноутбук с Lightroom вооружен для этой цели намного лучше. Последним дополнением к процедуре «дебайеринга» стали нейронные сети, а в результате — возможность извлечь из сырого кадра больше деталей, чем позволяет прямая интерполяция субпикселов. Функция Enhance Details в Lightroom использует для этого шейдерные ALU графического процессора, а в случае видеокарт NVIDIA на старших чипах Turing — тензорные ядра. Примечательно, что в качестве API для связи с графическим процессором Adobe выбрала библиотеки машинного обучения, встроенные в свежие издания Windows 10 и macOS — WinML и CoreML соответственно. Это едва ли не первый пример внедрения WinML и CoreML в программу столь высокого калибра, как Lightroom, и мы рассчитываем, что коллеги Adobe по индустрии последуют ее примеру. Ведь, в отличие от CUDA, эти API не привязаны к GPU определенной архитектуры и совместимы в равной мере с чипами NVDIA, AMD, а также интегрированной графикой Intel.
Заданием для теста в Lightroom является обработка фильтром Enhance Details шести RAW-кадров, а оценкой быстродействия — общее время операции. В связи с тем, что пакет фотографий очень небольшой, все участвующие в сравнении лэптопы выполнили работу быстро, за несколько минут. Но относительные результаты могут сказать о быстродействии систем намного больше. Так, между разными модификациями встроенной графики Intel возник практически двухкратный разрыв по быстродействию, а дискретный игровой видеоадаптер начального уровня — GeForce GTX 1050 — на поверку оказался не лучше, чем Intel Iris Plus Graphics 645 с кешем eDRAM. Хотя, разумеется, дело тут не только в графике, но и в количестве ядер центрального процессора, которое гораздо лучше коррелирует с полученными результатами.
А вот настолько крупный отрыв по времени от догоняющих участников, тестирования, который показал GeForce RTX 2060, на CPU не спишешь. Тензорные ядра все-таки чрезвычайно эффективно действуют в обработке данных нейросетями.
В поиске более широких тестов быстродействия при обработке фотографий мы переходим от Lightroom к его большому брату. Photoshop является слишком разносторонним инструментом, чтобы вынести справедливую оценку производительности ПК на основании изолированной задачи — такой, как популярные тесты пакетной конвертации изображений. Вместо этого мы воспользовались набором скриптов Puget Systems, воспроизводящих ряд последовательных операций: декодирование RAW-файлов, масштабирование, ретушь и корректировка геометрии, применение фильтров, комбинация панорамы и т. д.
Бенчмарк Puget Systems позволяет сравнивать устройства в каждом из перечисленных аспектов быстродействия, но абсолютные числа отдельных тестов (в виде длительности операций) сами по себе не слишком информативны по сравнению с тремя интегральными оценками: скорость фильтров, скорость сборки панорамных снимков и отдельный балл для операций, зависимых от быстродействия GPU. Результаты получены на материале с цветовым разрешением 8 бит/канал: скрипты могут работать и с 48-битными снимками, но для этого рекомендуется иметь в системе от 32 Гбайт оперативной памяти, чем ни один участник тестирования похвастаться не может. На интегрированной графике Intel тесты прошли под управлением API OpenCL, на чипах NVIDIA — CUDA.
Но Photoshop, как ни крути, завязан на производительность центрального процессора: системы выстроились на графиках в общем соответствии с количеством ядер CPU, и даже в тестах пакета Puget Systems, целенаправленно загружающих графический процессор, размах результатов не настолько велик, как можно предположить исходя из характеристик сравниваемых чипов. Складывается впечатление, что дискретная графика здесь, безусловно, идет на пользу рабочему процессу, но определяющего значения в Photoshop производительность GPU не имеет — в отличие от центрального процессора.
Хотя программы для видеомонтажа любят мощные многоядерные CPU, это одна из тех задач в сфере обработки цифрового контента, которые могут превратить слабый графический процессор в узкое бутылочное горлышко всей системы, невзирая на производительность остальных компонентов. Причем проблема заключается не только и не столько в продолжительности экспорта файлов, сколько в отзывчивости программы при живом воспроизведении и перемотке материала. Выброшенные кадры и в целом низкий FPS в процессе монтажа — вот сигнал к апгрейду видеокарты.
К счастью, еще один пакет скриптов Puget Systems дает возможность оценить производительность системы в обоих ключевых измерениях — живом воспроизведении и чистовом рендеринге. Бенчмарк содержит множество разновидностей сырого тестового материала — по разрешению, частоте кадров и кодеку, — но для оценки быстродействия ноутбучной графики и CPU мы ограничились базовым составом тестов, включающим исходники стандартов H.264 10 бит, RED и ProRes 422. Весь видеоматериал имеет разрешение 4К и кадровую частоту 59,94 FPS. Premiere Pro, как и другие основные приложения Adobe, поддерживает два API для связи с графическим процессором в среде Windows и macOS: CUDA для чипов NVIDIA и OpenCL для Intel и AMD.
Для приблизительного сравнения устройств между собой достаточно двух интегральных показателей бенчмарка в баллах — рейтинг живого воспроизведения и рейтинг экспорта, — однако результаты отдельных тестов и сами по себе наглядно демонстрируют, насколько хорошо подходит та или иная сборка для обработки тяжелых видеофайлов.
Premiere Pro (как и другие инструменты обработки видео в тестовой обойме) более чутко реагирует на различия в конфигурации железа, чем Photoshop, и это особенно заметно по отзывчивости программы в процессе монтажа. Пока выполняется чистовой рендеринг видео, можно подождать и заняться чем-нибудь еще, но если частота смены кадров при живом воспроизведении 4K-исходников составляет единицы FPS — как получилось в тестах с интегрированным интеловским GPU — то на работе можно ставить крест.
К сожалению, даже ноутбук RTX Studio с графикой GeForce RTX 2060 не позволит без заеданий монтировать 4К в полном разрешении, но в таком случае половинное разрешение выглядит как более чем приемлемый компромисс между быстродействием и точностью.
⇡#Blackmagic Design DaVinci Resolve 16
DaVinci Resolve является прямым конкурентом Premiere Pro среди программ для обработки видео, но имеет ряд отличий от последнего в интересующей нас сфере быстродействия железа. В частности, для тестов GPU нам пригодятся специфические функции 16-й версии пакета, связанные с машинным обучением, у которых пока нет аналогов в Premiere Pro. DaVinci Resolve 16 использует нейросети для таких операций, как распознавание и отслеживание лиц, имитация замедленной съемки, масштабирование и автоматическая цветокоррекция.
Мы использовали два проекта DaVinci Resolve на основе исходных материалов в формате Blackmagic RAW и H.264. Первый представляет собой тест цветокоррекции и задействует опцию отслеживания лиц для наложения изолированных эффектов. Задача второго — выполнить замедление исходника с интерполяцией промежуточных кадров. Для оценки быстродействия оба тестовых проекта были экспортированы в формате H.264 с разрешением 4К и кадровой частотой ~24 FPS, а результаты на диаграммах отражают время чистового рендеринга видеороликов продолжительностью 1 мин. Отметим еще один нюанс тестовой методики: DaVinci Resolve совместим с API CUDA и OpenCL в среде Windows, а в macOS поддерживает «родной» низкоуровневый интерфейс Metal — как для дискретной, так и для интегрированной графики. Apple намерена со временем полностью отказаться от OpenCL в пользу собственного API, и можно только порадоваться, что некоторые разработчики заранее готовы к этому повороту.
Из результатов бенчмарков DaVinci Resolve можно сделать один безошибочный вывод: экспорт видео со множественными эффектами силами встроенной интеловской графики — весьма неблагодарное занятие, даже при том, что тест обходит стороной не менее важный аспект рабочего процесса, живое воспроизведение и отзывчивость системы в ходе монтажа. Количество ядер CPU в таких условиях не имеет решающего значения. Как выяснилось, некоторые операции и вовсе невозможно выполнить без дискретной графики (по крайней мере, в данной комбинации железа и ПО): рендеринг второй последовательности, с замедлением исходника, просто не дошел до конца ни на одном из чипов Intel.
В то же время даже игровой ускоритель начального уровня существенно облегчает задачу, пусть экспорт все равно требует в два-шесть раз больше времени, чем длительность финального ролика. Конкретный результат зависит от сложности эффектов, и среди двух тестовых последовательностей замедление исходника дается слабому GPU труднее всего. Только существенно более производительная видеокарта смогла преодолеть эту тенденцию, а первый тест она и вовсе завершила быстрее воспроизведения в реальном времени. Причем разрыв между с системами с GeForce GTX 1050 и RTX 2060 в данном случае слишком велик, чтобы можно было объяснить его конфигурацией центрального процессора.
Последний тест в списке приложений для обработки видео, представляет собой пакетное декодирование RAW-файлов формата R3D, записанных на камеру RED высокого разрешения. Работа с исходниками в RAW дает такие же преимущества в процессе видеомонтажа, как и в статичной фотографии, но требования к вычислительной мощности компьютера оказываются несопоставимо более высокими, особенно когда речь идет о файлах с разрешением от 4К и выше. Процедура интерполяции субпикселов, которой мы коснулись в разделе Adobe Lightroom, с частотой 24 FPS вызывает серьезную нагрузку и едва ли может обойтись без достаточно производительного GPU.
Как «родной» видеоредактор RED — REDCINE-X PRO, — так и компоненты SDK, интегрированные в Premiere Pro и DaVinci Resolve, поддерживают «дебайеринг» на чипах NVIDIA посредством API CUDA, однако в дополнение к интерполяции обработка сырых видеозаписей ставит перед компьютером еще одну ресурсоемкую задачу. R3D является форматом с компрессией, и в предыдущих итерациях программных инструментов RED распаковкой данных на лету приходилось заниматься центральному процессору. Это фактически исключает возможность монтажа R3D в полном разрешении с приемлемой кадровой частотой на большинстве мобильных компьютеров. К счастью, актуальная версия редактора REDCINE-X PRO научилась декодировать файлы силами графических процессоров NVIDIA, пусть на компоненты SDK в сторонних приложениях эта функция еще не распространяется.
Наш бенчмарк REDCINE-X PRO включает пакетное декодирование нескольких файлов R3D с разрешением 4К, 6К и 8К, а результат отражает среднюю частоту смены кадров в каждом случае.
Хотя помимо CUDA, REDCINE-X знаком с универсальным графическими API OpenCL, компьютерам без дискретного GPU все равно пришлось выполнить работу силами центрального процессора (графикой Intel редактор пользоваться не умеет). Когда речь идет о ноутбучных CPU с двумя и четырьмя ядрами, отсутствие аппаратного ускорения сильно бьет по быстродействию, и это хорошо заметно в результатах теста. Причем если сменить четырехъядерник на двухъядерный процессор, скорость падает лавинообразно, а абсолютные значения кадровой частоты уже лишаются практического смысла. Другой неутешительный факт заключается в том, что игровой ускоритель начального уровня GeForce GTX 1050 не имеет никаких ощутимых преимуществ в декодировании R3D перед четырехъядерным мобильным CPU: ни то, ни другое не годится для монтажа исходников в полном разрешении. А вот GeForce RTX 2060 в работе с 4К-материалами почти достиг кадровой частоты 60 FPS, а в 8К остановился на 25. Если учесть, какую дорогую технику выпускает RED, это, пожалуй, одно из самых ярких достижений мобильной рабочей станции RTX Studio, которая в сравнении с иными «красными» видеокамерами стоит сущие копейки.
Следующий блок тестов посвящен инструментам трехмерного моделирования и оценивает быстродействие системы в нескольких популярных средах разработки и графических движках — начиная с бесплатного пакета Blender и встроенного в него рендерера Cycles. Демо Classroom, доступное на сайте Blender, содержит сцену достаточно высокой сложности для CPU и GPU мобильных компьютеров.
На чипах NVIDIA рендеринг был выполнен посредством API CUDA. В свою очередь, интегрированная графика Intel в Cycles работает под OpenCL, но особенности определенных комбинаций приложения, операционной системы и железа вновь дали о себе знать. Из актуальной версии Blender (2.8) пропала поддержка OpenCL в Cycles на платформе macOS (так Blender Foundation решила сэкономить силы разработчиков в свете грядущего отказа Apple от OpenCL), а совместимость с Metal еще даже не планируется. Ну а официальной поддержки встроенной интеловской графики в Cycles не было изначально.
Последняя причина вынудила оба «Мака» приступить к рендерингу сцены на CPU без помощи графического чипа, и на оценке быстродействия это сказалось самым плачевным образом. Четырехъядерный ноутбучный процессор потратил на работу больше 20 минут, а двухъядерный — целый час, в то время как GeForce RTX 2060 хватило около шести минут. Но это, согласитесь, слишком очевидный и довольно бесполезный вывод. Более информативный результат происходит из сравнения RTX 2060 не только с CPU, но и с дискретной графикой прошлого поколения. Оказалось, что мобильная версия GeForce GTX 1050 не так уж сильно превосходит четырехъядерный процессор по производительности в Blender и в то же время оказалась в 4–5 раз слабее по сравнению с RTX 2060. Разумеется, свой вклад в разброс показателей между GTX 1050 и RTX 2060 внесла и конфигурация оперативной памяти, доступной GPU. 6 Гбайт у нового ускорители — это уже довольно ограниченный объем, а 4 Гбайт тем более.
⇡#MAXON Cinema 4D Studio R20 (Radeon ProRender)
В MAXON Cinema 4D интегрирован open source-движок Radeon ProRender на основе OpenCL. Этот пакет, причем именно версия R20 вместо свежей R21, лучше всего подходит для тестов ProRender, нежели, к примеру, Blender с соответствующим плагином — все благодаря щедрой библиотеке обучающих проектов, доступной для R20. Из нее мы выбрали две сцены различной сложности — простая Bamboo и весьма ресурсоемкая Coffee Beans.
К сожалению, движок ProRender, хоть и пользуется универсальным API OpenCL, не поддерживает аппаратное ускорение силами интегрированной графики Intel, и это хорошо заметно по длительности рендеринга на компактных ноутбуках без дискретных GPU. Даже на легкую сцену Bamboo двухъядерный и четырехъядерный процессоры затратили по 10–25 минут, а на сложную Coffee Beans — уже не меньше 1,5 часов. Дискретная графика, пусть и довольно неповоротливая, как, например, GeForce GTX 1050, снижает время рендеринга в несколько, а то и несколько десятков раз, а RTX 2060, в свою очередь, еще раз повторяет эту операцию. Заметим, что в бенчмарках Cinema 4D соотношение результатов между GTX 1050 и RTX 2060 вполне соответствует разнице в их вычислительной мощности, а значит объем оперативной памяти видеокарты не так сильно ограничивает младший ускоритель, как в тесте Blender.
Уже тогда, когда NVIDIA представила первые GPU с выделенными блоками трассировки лучей, не было ни малейших сомнений в том, что эта функция будет оценена под достоинству в профессиональных приложениях для 3D-рендеринга. В данный момент RT-ядра чипов Turing может задействовать бета-версия рендерера Arnold. Этот движок широко используется в киноиндустрии для чистового рендеринга анимаций и распространяется в виде плагинов для графических пакетов Maya, 3ds Max, Cinema 4D, Katana и Houdini. Кроме того, в среде Maya и 3ds Max он служит в качестве встроенного интерактивного рендерера для отрисовки viewport’а — именно так мы и проверили быстродействие Arnold на различных системах.
К сожалению, поддержка потребительского железа мало волнует разработчиков движка: даже функция рендеринга на GPU как таковая появилась в Arnold сравнительно недавно, и пока только через CUDA. Как следствие, чипы AMD и встроенная графика Intel остались в тесте Maya не у дел вне зависимости от операционной системы, а двух- и четырехъядерные ноутбучные CPU вынуждены вновь тратить на черновую отрисовку сцены время, сравнимое с высококачественным финальным рендерингом на GPU. Тем не менее, не всякий дискретный ускоритель решает задачу эффективно. Даже при том, что речь идет об упрощенном интерактивном рендеринге, GeForce RTX 1050 в итоге потребовалось ненамного меньше времени, нежели четырехъядерному CPU. Все дело, разумеется, в скромном объеме видеопамяти, ну и, к тому же, поддержка GPU в Arnold еще не вышла из статуса бета-версии, так что о безупречной оптимизации рендерера говорить преждевременно. Ну а GeForce RTX 2060, как и следовало ожидать, продемонстрировал эталонный результат, уложившись в одну минуту — все благодаря аппаратной трассировке лучей. Что и говорить, без специализированных RT-блоков такое быстродействие требует намного более мощного железа.
OctaneRender, еще один движок трассировки лучей, поставляется в виде отдельного приложения или расширений для распространенных графических пакетов. Однако у OctaneRender есть и собственный бенчмарк, существенно упрощающий тестирование железа. В отличие от тех инструментов 3D-моделирования, которые мы изучили выше, OctaneRender не работает на CPU без помощи графического процессора, причем процессора NVIDIA, т. к. интеграции OpenCL в нем отродясь не было, а совместимость с Vulkan OTOY только планирует ввести в грядущих выпусках.
Зато актуальная версия рендерера, как и Arnold, обзавелась поддержкой RT-блоков чипов Turing, а бенчмарк позволяет оценить не только разные чипы NVIDIA, но один и тот же GPU при работе с активированными RT-ядрами и без них. Как выяснилось, GeForce RTX 2060 сам по себе в разы быстрее по сравнению с GeForce GTX 1050, но аппаратное ускорение трассировки лучей способно радикально увеличить его производительность. RT-блоки наиболее эффективны при построении инфо-каналов, свободных от тяжелых шейдерных расчетов, а в ключевых метриках теста — прямом и непрямом освещении — оценка Octanebench возросла втрое.
Результаты, которые нам удалось получить, сравнив мобильные компьютеры в десятке требовательных профессиональных приложений, на первый взгляд могут показаться тривиальными: шесть ядер центрального процессора лучше, чем четыре, а дискретная графика быстрее интегрированной, и что с того? Но в данном случае не менее, а подчас и более важно обратить внимание на абсолютные показатели тестов, тем более что большинство бенчмарков измеряет быстродействие системы не в абстрактных баллах, а в практически существенных и интуитивно понятных величинах — времени рендеринга и частоте смены кадров. Для столь обобщенных вопросов, на которые должно ответить это исследование, необходим именно такой подход. Ведь мы собирались узнать, какие рабочие задачи современные лэптопы научились выполнять играючи, какие им по-прежнему даются с трудом, и какая часть системы становится бутылочным горлышком в том или ином случае. Это нам вполне удалось, и вот вердикт.
Можно с уверенностью утверждать, что когда речь идет о приложениях для создания визуального контента, главным фактором, сдерживающим производительность компьютера, является не центральный процессор (при условии, что это хотя бы четырехъядерник с SMT), а видеокарта. Только софт для редактирования фотографий по-прежнему упирается в CPU и следует обратному правилу: неплохой интегрированной графики или дискретного GPU начального уровня хватит, чтобы с комфортом работать в Photoshop. Это, в действительности, серьезное достижение для компактных ультрабуков, будь то «Маки» или PC, но на этом их достоинства в контексте профессионального ПО заканчиваются.
Другие задачи — видеомонтаж или, тем более, 3D-моделирование, перекладывают львиную долю нагрузки на GPU, и что самое интересное, в них очень легко провести границу между чипами, которые либо обеспечивают приемлемый уровень быстродействия для работы на результат, либо попросту никуда не годятся. Например, в видеоредакторах ключевым показателем является кадровая частота при живом воспроизведении, а в 3D-моделировании — отзывчивость viewport’а и время чернового рендеринга, чтобы можно было оперативно оценить результаты изменений сцены. Как выяснилось, игровые ускорители бюджетной категории для этих целей совершенно не подходят (иной раз даже софтверный рендеринг на четырехъядерном CPU занимает сопоставимое время), а вот те системы, которые получили от NVIDIA сертификат RTX Studio, в самом деле оправдывают свои амбиции.
Для тестов в рабочих приложениях нам достался лэптоп ASUS ZenBook Pro Duo, по всем признакам принадлежащий к начальному уровню в программе Studio, и его производительности аккурат достаточно для таких сценариев использования. Но главное — это потенциал на будущее, который заложен в чипах Turing. Пусть сегодня далеко не каждая рабочая программа может задействовать аппаратную трассировку лучей и нейросети, но первые видеоредакторы и пакеты 3D-ренедринга, в которых появились эти функции, уже добились действительно впечатляющего, многократного увеличения производительности. Однако нет предела совершенству. В каталоге RTX Studio есть значительно более мощные системы — насколько велико их преимущество, и в каких сценариях использования, нам еще предстоит выяснить в будущем, ведь мы рано или поздно доберемся и до более высоких этажей этой программы.