Intel научила ИИ оценивать, как апскейлинг и генерация кадров влияют на качество графики в играх

Intel представила ИИ-инструмент CGVQM, который позволяет объективно оценивать качество изображений в современных играх. Модель анализирует искажения, возникающие при использовании технологий масштабирования и улучшения графики, таких как апскейлинг (DLSS, FSR, XeSS), генерация кадров и другие методы рендеринга.

HUAWEI Pura 80 Ultra глазами фотографа

Первый взгляд на смартфон HUAWEI Pura 80 Ultra

Пять причин полюбить HONOR 400

Обзор смартфона HONOR 400: реаниматор

HUAWEI nova Y73: самый недорогой смартфон с кремний-углеродной батареей

Обзор HUAWEI MatePad Pro 12.2’’ (2025): обновление планшета с лучшим экраном

Обзор смартфона HUAWEI nova Y63: еще раз в ту же реку

Обзор ноутбука HONOR MagicBook Pro 14 (FMB-P) на платформе Core Ultra второго поколения

Пять причин полюбить ноутбук HONOR MagicBook Pro 14

Источник изображения: Intel

Традиционные метрики, например PSNR, не всегда подходят для оценки игровой графики, поскольку изначально были созданы для анализа сжатого видео. Они не учитывают специфические артефакты, возникающие при использовании апскейлеров, трассировки лучей или динамического затенения. Например, в процессе обработки могут появляться мерцание, гостинг (ghosting), ступенчатость, разрывы объектов и другие. Новая метрика под названием Computer Graphics Visual Quality Metric (CGVQM) использует искусственный интеллект для анализа видеоряда и выявления дефектов, вызванных современными методами обработки изображений.

Команда исследователей из Intel — Акшай Джиндал (Akshay Jindal), Набиль Садака (Nabil Sadaka), Антон Соченов (Anton Sochenov) и другие, предложила двухэтапный подход. Сначала они собрали датасет CGVQD, который включает нейросетевое шумоподавление, апскейлинг, интерполяцию кадров и адаптивное затенение, а затем на его основе обучили нейросеть CGVQM, способную оценивать качество изображения так же, как это делает человек.

Для калибровки модели группе добровольцев показали видеоролики из набора данных и попросили оценить артефакты по шкале от «незаметных» до «сильно раздражающих». Эти данные и стали основой для обучения 3D-свёрточной нейросети (3D-CNN) на базе архитектуры ResNet-18, которая позволяет анализировать не только пространственные, но и временные искажения, что критически важно для видео.

В итоге, в тестах CGVQM превзошла большинство существующих метрик, особенно при работе с собственным набором данных. Модель версии CGVQM-5 показала результат, близкий к человеческой оценке, а более простая CGVQM-2 заняла третье место среди протестированных систем. При этом CGVQM способна анализировать и сторонний контент, не входящий в обучающую выборку, что делает её универсальным инструментом.

В будущем, как пишет Tom's Hardware, исследователи рассматривают переход на архитектуру трансформеров для повышения производительности. Также в метрику могут добавить анализ оптического потока для более детальной оценки.

Источник: