Сегодня 21 февраля 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Теги → производительность
Быстрый переход

Вышли обзоры GeForce RTX 5070 Ti — аналог GeForce RTX 4080 Super с более мощным ИИ-генератором кадров

Продажи GeForce RTX 5070 Ti начнутся завтра, 20 февраля. А сегодня профильные СМИ и блогеры опубликовали обзоры моделей, которые будут предлагаться по рекомендованной цене в $749. Учитывая высокий спрос и тот факт, что новинка не будет выпускаться в эталонном исполнении Founders Edition, карта вряд ли долго будет доступна по рекомендованной цене. В западных магазинах её стоимость в зависимости от производителя достигает $1000.

 Источник изображения: TechPowerUp

Источник изображения: TechPowerUp

В основе GeForce RTX 5070 Ti используется графический процессор GB203-200. Чип содержит 45,6 млрд транзисторов и производится с использованием 5-нм техпроцесса TSMC. В его составе присутствуют 8960 ядер CUDA, 280 текстурных блоков, 128 блоков растеризации, 70 SM-блоков, 280 тензорных ядер и 70 RT-ядер. Заявленная базовая частота GPU составляет 2300 МГц, а Boost-частота чипа равна 2452 МГц. Карта получила 16 Гбайт памяти GDDR7 со скоростью 28 Гбит/с на контакт, поддержкой 256-битной шины и пропускной способностью 896 Гбайт/с. Заявленный показатель энергопотребления новинки составляет 300 Вт, однако кастомные модели могут потреблять больше.

 Печатная плата MSI GeForce RTX 5070 Ti Ventus 3X OC. Источник изображений: TechPowerUp

Печатная плата MSI GeForce RTX 5070 Ti Ventus 3X OC. Источник изображений: TechPowerUp

Тесты портала TechSpot показали, что GeForce RTX 5070 Ti в среднем примерно на 6,4 % быстрее RTX 4070 Ti в играх в разрешении Full HD (1920 × 1080 пикселей) без трассировки лучей и технологий масштабирования и всего на 3,1 % быстрее модели RTX 4070 Ti Super в тех же условиях. При этом новинка на 3,6 % медленнее Radeon RX 7900 XTX и примерно на 6–8 % медленнее RTX 4080 Super и RTX 4080.

При традиционном рендеринге, без трассировки лучей, в разрешении 1440p (2560 × 1440 пикселей) новая RTX 5070 Ti оказалась всего на 7 % быстрее RTX 4070 Ti Super и на 8 % быстрее Radeon RX 7900 XT, но при этом была на 12 % медленнее RTX 5080, согласно данным TechSpot.

При использовании разрешения 4K (3840 × 2160 пикселей) GeForce RTX 5070 Ti оказалась на 11 % быстрее модели RTX 4070 Ti Super, на 14 % быстрее Radeon RX 7900 XT и на 13 % медленнее RTX 5080.

Тесты портала TechPowerUp в целом подтвердили результаты TechSpot, хотя и показали чуть лучшую для RTX 5070 Ti картину. Новинка продемонстрировала производительность на уровне Radeon RX 7900 XTX, оказавшись до 13 % быстрее RTX 4070 Ti в 1080p, до 24 % в 1440p и до 22 % в 4K. Оба обозревателя использовали в своих тестовых системах процессоры Ryzen 7 9800X3D и 32 Гбайт ОЗУ (DDR5-6000 у TechSpot, DDR5-6200 у TechPowerUp). В качестве испытуемой в обоих случаях использовалась видеокарта MSI GeForce RTX 5070 Ti Ventus 3X OC с дополнительным заводским разгоном GPU.

Одним из ключевых преимуществ GeForce RTX 5070 Ti, как и всей серии видеокарт GeForce RTX 5000, является поддержка мультикадрового генератора (MFG), который с помощью ИИ может генерировать до трёх дополнительных кадров на каждый отрисованный кадр. В свою очередь, карты прошлого поколения могут предложить генерацию лишь одного дополнительного кадра. MFG значительно повышает FPS, однако его работа зависит от разработчиков игр — поддержка MFG требует интеграции непосредственно в саму игру.

 Работа мультикадрового генератора

Работа мультикадрового генератора

Согласно данным TechPowerUp, RTX 5070 Ti обеспечивает до 49 % прироста производительности в трассировке лучей по сравнению с RTX 4070 Ti. С одной стороны, это можно объяснить увеличением количества RT-ядер в составе новой видеокарты. Другая причина — использование 16 Гбайт более скоростной памяти GDDR7, тогда как RTX 4070 Ti имеет только 12 Гбайт GDDR6X.

Разница в производительности трассировки лучей между RTX 5070 Ti и RTX 4070 Ti Super (16 Гбайт GDDR6X) уже не такая значительная — она составляет около 15 % в пользу карты нового поколения. Radeon RX 7900 XTX в трассировке лучей до 42 % медленнее RTX 5070 Ti.

Как уже говорилось выше, GeForce RTX 5070 Ti не имеет эталонного исполнения Founders Edition. Однако заявленное энергопотребление новинки составляет 300 Вт. Тесты TechPowerUp показали, что в играх карта потребляет в среднем около 287 Вт (по крайней мере, в исполнении MSI Ventus). Максимальное энергопотребление составило 308 Вт (307 Вт с трассировкой лучей). При этом кратковременные всплески энергопотребления (20 мс) доходили до 348 Вт. Энергопотребление в простое составляет 18 Вт. Система охлаждения от MSI обозревателю не понравилась — она показалась ему громкой.

 Температуры и шум

Температуры и шум

В выводах TechPowerUp отмечает, что при рекомендованной цене $750 видеокарта GeForce RTX 5070 Ti представляет собой отличный выбор с учётом её производительности. Фактически рекомендованная цена у RTX 5070 Ti на $50 ниже, чем у RTX 4070 Ti и RTX 4070 Ti Super на старте их продаж. По мнению TechSpot, RTX 5070 Ti становится значительно менее интересной при цене выше $800, а именно такие ценники на эти карты в ближайшие месяцы ожидают покупателей.

Встроенная графика AMD догнала GeForce RTX 4070 — вышли обзоры Ryzen AI Max+ 395 с мощнейшим iGPU Radeon 8060S

Компания AMD разрешила публикацию обзоров новых мобильных процессоров Ryzen AI 300 Max с кодовым названием Strix Halo. Поскольку решений на базе этих чипов пока выпущено не так много, большинство обозревателей оценили производительность Ryzen AI 300 Max в составе 13-дюймового игрового планшета Asus ROG Flow Z13.

 Источник изображения: AMD

Источник изображения: AMD

Ryzen AI 300 Max представляют собой большие APU с двумя чиплетами с вычислительными ядрами (CCD), а также огромным кристаллом ввода-вывода (I/O Die). В последнем размещена мощная встроенная графика, насчитывающая до 40 вычислительных блоков (CU), а также ИИ-ускоритель (NPU) XDNA2 с производительностью 50 TOPS (триллионов операций в секунду).

В отличие от мобильных процессоров Ryzen 9000HX (Fire Range), некоторые модели которых оснащены дополнительной кеш-памятью 3D V-Cache, чипы Ryzen AI 300 Max не получили дополнительный кеш. Однако по информации главы китайского отдела Asus Тони Ю (Tony Yu), блоки CCD процессоров Ryzen AI 300 Max имеют ряды TSV (сквозных кремниевых переходных отверстий), что технически открывает возможность оснащения этих чипов слоем кеш-памяти 3D V-Cache. Ходят слухи, что серия X3D запланирована для преемника Ryzen AI 300 Max. Тем не менее, наличие TSV у Ryzen AI 300 Max говорит о том, что их кремний уже готов к такой конфигурации кеша.

В серию Ryzen AI 300 Max входят три модели процессоров, предлагающие 8, 12 или 16 ядер Zen 5 и поддержку от 16 до 32 потоков. Тактовая частота этих чипов достигает 5,1 ГГц. Процессоры Ryzen AI 300 Max не ограничиваются низким уровнем TDP, характерным для мобильных чипов. Уровень энергопотребления может быть настроен производителем в диапазоне от 45 до 120 Вт, что делает их подходящими как для мощных ноутбуков, так и для компактных, но производительных настольных компьютеров.

Наиболее примечательной особенностью Ryzen AI 300 Max является мощная встроенная графика. Флагманский 16-ядерный Ryzen AI Max+ 395, который используется в составе игрового планшета Asus ROG Flow Z13, оснащён графикой Radeon 8060S на базе 40 CU с архитектурой RDNA 3.5.

Как показывают тесты, iGPU обеспечивает производительность на уровне дискретной мобильной видеокарты GeForce RTX 4070 и оставляет далеко позади встроенную графику Radeon 890M чипов AMD Strix Point (Ryzen AI 300) и Arc 140V в составе Intel Lunar Lake (Core Ultra 200). В то же время Radeon 8060S в некоторых тестах оказалась значительно медленнее встроенной графики процессоров Apple M4 Max.

Согласно данным портала Notebookcheck, графика Radeon 8060S с 40 CU в составе планшета Asus ROG Flow Z13 продемонстрировала результат 10 200 баллов в тесте 3DMark Time Spy. Это ставит Radeon 8060S в один ряд с мобильной GeForce RTX 4070 в составе 14-дюймовых ноутбуков, таких как ROG Zephyrus G14, — её результат составляет 10 300 баллов. По сравнению с предыдущим поколением Asus ROG Flow Z13, предлагающим видеокарту RTX 4070 с TDP 65 Вт, преимущество Radeon 8060S составляет около 5 %.

Ноутбуки с RTX 4070 для которой производитель выделил значительно больший запас TDP, графика GeForce оказывается быстрее новичка от AMD. Например, Razer Blade 14 с RTX 4070 с TDP 140 Вт демонстрирует в том же тесте 3DMark Time Spy результат выше 13 000 баллов.

В тесте Steel Nomad Radeon 8060S показывает менее впечатляющие результаты. Она всё ещё быстрее других встроенных графических решений AMD и Intel, но уступает не только ноутбукам с RTX 4070, но и системам с RTX 4060 с увеличенным TDP (110 Вт).

Radeon 8060S уверенно противостоит 20-ядерному iGPU процессора Apple M4 Pro в тесте 3DMark Wild Life, но значительно уступает 40-ядерному iGPU в составе Apple M4 Max и 38-ядерному iGPU в составе Apple M3 Max. Оба чипа Apple обгоняют решение AMD на 64 % и 94 % соответственно.

Игровая производительность Radeon 8060S впечатляет. Хотя в сравнении с 65-Вт RTX 4070 решение AMD уступает, iGPU Radeon оказывается быстрее дискретных RTX 4050 и маломощных вариантов RTX 4060. Как отмечает Notebookcheck, производительность Radeon 8060S находится на уровне Radeon RX 7600M XT с 32 вычислительными блоками архитектуры RDNA 3.

Radeon RX 7650 GRE оказалась в среднем на 7 % быстрее GeForce RTX 4060 в играх, но не в трассировке лучей

Китайские медиа начали публиковать обзоры новой видеокарты Radeon RX 7650 GRE, выпущенной эксклюзивно для Поднебесной. Тесты новинки показывают, что карта быстрее GeForce RTX 4060 — своего основного конкурента. По данным издания Expreview, она в среднем примерно на 7 % производительнее RTX 4060. Правда, преимущество карты Radeon наблюдается не во всех играх. В некоторых новинка отстаёт от конкурента.

 Источник изображения: AMD

Источник изображения: AMD

Следует напомнить, что в составе Radeon RX 7650 GRE используется графический процессор Navi 33 на архитектуре RDNA 3, содержащий 32 исполнительных блока и 2048 потоковых процессоров. Для чипа заявлена частота 2695 МГц в режиме Boost. Карта получила 8 Гбайт памяти GDDR6 со скоростью 18 Гбит/с на контакт и 128-битной шиной. Пропускная способность памяти составляет 288 Гбайт/с. Заявленный уровень энергопотребления — 170 Вт, что больше, чем у Radeon RX 7600 (165 Вт) с таким же объёмом памяти, но меньше, чем у RX 7600 XT (190 Вт) с 16 Гбайт памяти.

 Источник изображения: Expreview

Источник изображения: Expreview

На руках у Expreview оказалась модель Sapphire RX 7650 GRE Black Diamond Edition с дополнительным заводским разгоном GPU до частоты 2810 МГц. Однако перед началом тестов обозреватель сбросил частоту графического чипа новинки до эталонного значения и сравнил карту с RTX 4060. В игровую выборку попали: Eternal Damnation, Rainbow Six Siege, Call of Duty: Modern Warfare 3, Red Dead Redemption 2, Far Cry 6, Cyberpunk 2077, Borderlands 3 и Shadow of the Tomb Raider.

 Источник изображения: Tom's Hardware по данным Expreview

Источник изображения: Tom's Hardware по данным Expreview

Целевое игровое разрешение видеокарты — 1080p. В среднем RX 7650 GRE оказалась чуть быстрее RTX 4060 в большинстве запущенных игр. Наибольший отрыв от конкурента новинка показала в Eternal Damnation и Borderlands 3. В первой её преимущество составило до 42 %, во второй — до 26 %.

Однако ситуация привычно изменилась с запуском игр с трассировкой лучей, где RTX 4060 показала более высокие результаты. В RT-тестах Far Cry 6 и Cyberpunk 2077 модель GeForce RTX 4060 была значительно быстрее новичка. Обозреватель Expreview также протестировал обе карты в разрешении 1440p (там тоже преимущество за картой AMD) и бенчмарке 3DMark. С более подробными результатами тестов можно ознакомиться по этой ссылке.

Тесты Expreview показали, что RX 7650 GRE обеспечивает производительность, практически не отличающуюся от обычной модели RX 7600. Последняя, в свою очередь, в растровой графике демонстрирует практически одинаковые результаты с RTX 4060 в играх с разрешением 1080p.

Dimensity 9400 обогнал Snapdragon 8 Elite в январском рейтинге AnTuTu

Разработчики мобильного бенчмарка AnTuTu опубликовали январский рейтинг самых производительных флагманских Android-смартфонов. Верхнюю строчку списка по итогам прошлого месяца занял смартфон Vivo X200 Pro Satellite Edition на процессоре MediaTek Dimensity 9400.

 Источник изображения: MediaTek

Источник изображения: MediaTek

Лидер рейтинга показал средний результат производительности — 2 896 624 балла в бенчмарке AnTuTu. На втором месте расположился OnePlus Ace 5 Pro на базе Qualcomm Snapdragon 8 Elite со средним счётом 2 888 193 балла. Как можно заметить, разница в результатах минимальна. В последние месяцы между платформами Qualcomm и MediaTek наблюдается активная конкуренция. Ещё в ноябре прошлого года ROG Phone 9 Pro на базе Snapdragon 8 Elite занимал первую строчку рейтинга самых производительных смартфонов по версии AnTuTu, обогнав Vivo X200 Pro на базе Dimensity 9400.

 Источник изображения: AnTuTu

Источник изображения: AnTuTu

В остальном рейтинг в значительной степени не изменился по сравнению с декабрём 2024 года. Третье место в списке самых производительных смартфонов по данным AnTuTu занимает RedMagic 10 Pro+ на базе Snapdragon 8 Elite (2 868 701 балл), на четвёртом расположился iQOO 13 на базе Snapdragon 8 Elite (2 853 651 балл), iQOO Neo10 Pro с Dimensity 9400 оказался на пятом месте (2 836 633 балла), Vivo X200 с Dimensity 9400 расположился на шестом (2 816 213 баллов), модель Vivo X200 Pro Mini на том же чипе находится на седьмом месте (2 799 774 балла). На восьмом, девятом и десятом местах расположились OnePlus 13 (Snapdragon 8 Elite), Oppo Find X8 Pro Satellite Edition (Dimensity 9400) и Honor Magic 7 Pro (Snapdragon 8 Elite) с результатами 2 752 630, 2 706 662 и 2 684 156 баллов соответственно.

Следует напомнить, что ежемесячный рейтинг производительности смартфонов по версии AnTuTu формируется с учётом нескольких факторов. Одно из требований заключается в том, что устройство должно пройти как минимум 1000 тестов за месяц. Именно поэтому список лидеров обновляется ежемесячно.

AMD похвасталась, что её мощнейшая встроенная графика в чипах Strix Halo быстрее GeForce RTX 4070 в играх

Компания AMD поделилась свежими результатами тестирования флагманского мобильного процессора Ryzen AI Max+ 395 и его встроенной графики Radeon 8060S в различных играх. Чип был представлен на выставке CES 2025 в рамках новой серии мобильных чипов Strix Halo, которые выделяются производительной встроенной графикой.

 Источник изображений: AMD

Источник изображений: AMD

Напомним, что процессоры серии AMD Strix Halo используют комбинацию вычислительных ядер Zen 5 и графической архитектуры RDNA 3.5. Процессоры состоят из трёх чиплетов: двух блоков CCD с вычислительными ядрами и IOD-чиплета со встроенной графикой. Кристаллы объединяет шина Infinity Fabric нового поколения. Strix Halo получили новый контроллер памяти с пропускной способностью до 256 Гбайт/с. Кроме того, они оснащены новым нейропроцессором на архитектуре XDNA 2, обеспечивающим ИИ-производительность на уровне 50 TOPS (триллионов операций в секунду).

В составе Ryzen AI Max+ 395, который AMD использовала для сравнительных игровых тестов, присутствуют 16 ядер с поддержкой 32 виртуальных потоков. Чип работает в диапазоне частот от 3,0 до 5,1 ГГц, получил 16 Мбайт кеш-памяти L2, 64 Мбайт кеша L3 и конфигурируемый TDP от 42 до 120 Вт. Встроенная графика Radeon 8060S процессора содержит 40 исполнительных блоков на архитектуре RDNA 3.5 и работает на частоте до 2900 МГц.

AMD делилась некоторыми бенчмарками Ryzen AI Max+ 395 ещё во время выставки CES 2025, однако в новых рекламных материалах компания сравнивает производительность процессора и его встроенной графики с дискретной мобильной видеокартой GeForce RTX 4070. Последняя тестировалась в составе игрового планшета Asus ROG Flow Z13 на базе Intel Core i9-13900H. Игры запускались в родном разрешении экрана 1080p при высоких настройках качества. В тестах не использовались технологии масштабирования или генераторы кадров. Чип AMD работал с зафиксированным TDP на уровне 55 Вт.

Во всех 17 игровых тестах Ryzen AI Max+ 395 превзошёл связку из Core i9-13900H и GeForce RTX 4070. Из опубликованной диаграммы следует, что Ryzen AI Max+ 395 и его «встройка» Radeon 8060 обеспечили в некоторых тестах производительность на 50 % выше, чем у конкурента. Отрыв в Borderlands 3 составил целых 68 % в пользу системы AMD.

В среднем Radeon 8060 оказалась на 23,2 % быстрее дискретной RTX 4070. Это впечатляет и одновременно указывает на то, что встроенная графика AMD достигла производительности, которая может соперничать с дискретной мобильной графикой конкурентов.

GeForce RTX 5090 теряет всего 1 % производительности при использовании интерфейса PCIe 4.0 x16, но проблемы могут создать переходники

Видеокарты GeForce RTX 50-й серии от Nvidia получили поддержку PCIe 5.0. Это означает, что новая графика имеет доступ к интерфейсу, обеспечивающему вдвое большую скорость взаимодействия с CPU по сравнению с PCIe 4.0. Портал TechPowerUp, а также YouTube-канал HardwareCanucks провели тесты новой флагманской карты GeForce RTX 5090 и выяснили, сколько производительности потеряет карта в случае её использования на материнских платах, не поддерживающих интерфейс PCIe 5.0.

 Источник изображений: TechPowerUp

Источник изображений: TechPowerUp

Как показывает практика, разница в производительности будет едва заметной, если только карта не будет работать в режиме линий x8, x4 или x1. При использовании RTX 5090 с поддержкой PCIe 5.0 в слоте материнской платы PCIe 4.0 x16 разница в быстродействии составит всего 1 процент. Владельцам старых материнских плат с поддержкой только PCIe 3.0 тоже не следует сильно волноваться. Средняя потеря производительности в разрешении 1080p/1440p составляет 4 %, а при использовании разрешения 4K потеря составит 3 %.

Если по какой-то причине в ПК для видеокарты отведено меньше свободных линий PCIe, например, из-за ошибки самого пользователя, ограничений материнской платы или из-за использования видеокарты в качестве внешней, то к графикам ниже следует присмотреться более внимательно.

Например, при использовании конфигурации PCIe 4.0 x4, что соответствует спецификациям интерфейса OCuLink для внешних видеокарт, в разрешении 1080p карта GeForce RTX 5090 обеспечит только 89 % своей производительности (потеря 11 %), в разрешении 1440p производительность карты составит 90 % (потеря 10 %), а в разрешении 4K — 94 % (потеря 6 %). Следует отметить, что карта стоимостью от $2000 и оснащённая 32 Гбайт видеопамяти явно предназначена не только для игр. Энтузиасты технологий ИИ и машинного обучения, решившие использовать её в качестве внешнего ускорителя через интерфейс OCuLink, вряд ли почувствуют значительную просадку в производительности, но для подтверждения этого заявления всё же необходимы более тщательные тесты с использованием AI/LLM-нагрузок.

«В общем и целом, если вы используете платформу с поддержкой интерфейса Gen 4 x16, то можете расслабиться, поскольку вы почти ничего не потеряете с GeForce RTX 5090. А любое отличие от наших графиков и вашими результатами может быть связано с тем, что вы используете более медленный процессор по сравнению с нашим тестовым Ryzen 7 9800X3D. Это же относится к пользователям платформ Alder Lake и Raptor Lake, которые планируют использовать GeForce RTX 5090 в слоте Gen 5 x16, который будет работать только в режиме x8 в случае установки NVMe-накопителя стандарта PCIe 5.0, который съест оставшиеся линии PCIe 5.0. Если вы используете более старые интерфейсы Gen 3 x16 или Gen 4 x4 (или по ошибке установили видеокарту не в тот слот на материнской плате), значительную просадку в производительности вы не увидите, но разница будет», — пишет TechPowerUp.

TechPowerUp также напоминает, что утилита GPU-Z позволяет проверить, какую спецификацию интерфейса PCIe использует ваша видеокарта. В утилиту также встроен тест для принудительного использования полной пропускной способности интерфейса.

Ещё одна вещь, которую следует упомянуть в контексте данной темы, связана с проблемой совместимости специальных переходников-райзеров PCIe с современными материнскими платами. Согласно HardwareCanucks, чей обзор в значительной степени фокусируется на совместимости интерфейсов PCIe, некоторые материнские платы, при подключении райзера не стандарта PCIe 5.0 к разъёму PCIe 5.0 на материнской плате, могут потребовать ручного переключения в BIOS материнской платы настроек PCIe в режим PCIe 4.0 или даже 3.0.

 Источник изображения: YouTube / Hardware Canucks

Источник изображения: YouTube / Hardware Canucks

Обозреватели обнаружили, что пользователи могут столкнуться с «синими экранами смерти», ошибками загрузки игр или даже с проблемами загрузки ПК, если в работе райзера имеются какие-либо проблемы. Это может стать действительно серьёзной проблемой, поскольку в продаже практически нет переходников-райзеров стандарта PCIe 5.0, а те, что есть, стоят весьма дорого. Как результат, те, кто использует райзеры стандарта PCIe 4.0 и PCIe 3.0, могут столкнуться с проблемами совместимости.

Вышли обзоры GeForce RTX 5090 — наконец-то высокий FPS в 4K, но придётся раскошелиться

Новая флагманская видеокарта GeForce RTX 5090 появится в продаже 30 января. Компания Nvidia разрешила профильным СМИ и блогерам опубликовать сегодня свои обзоры новинки в эталонном исполнении Founders Edition, рекомендованная цена которой составляет $2000.

 Источник изображения: TechPowerUp

Источник изображения: TechPowerUp

В основе GeForce RTX 5090 используется графический процессор GB202, построенный на архитектуре Blackwell. В составе GPU присутствуют 92,2 млрд транзисторов. Это больше, чем у AD102, являющегося основой GeForce RTX 4090, с 76,3 млрд транзисторами. Однако количественный прирост последних в составе GB202 объясняется не переходом на новый техпроцесс — для производства GB202, как и других процессоров игровых видеокарт линейки Blackwell, используется всё тот же 5-нм техпроцесс TSMC, что и для производства видеокарт GeForce RTX 40-й серии.

 Источник изображения: TechPowerUp

Источник изображения: TechPowerUp

Прирост количества транзисторов можно объяснить скорее простым увеличением площади самого GPU. Если у AD102 (Ada Lovelace) она составляет 609 мм², то у GB202 она равна 744 мм², что делает его вторым по размерам GPU для потребительских видеокарт после TU102 поколения Turing с площадью 754 мм². В то же время плотность транзисторов у нового графического процессора GB202 даже ниже, чем у предшественника — 123,9 млн/мм² против 125,3 млн/мм² у AD102.

 Источник изображения: TechPowerUp

Источник изображения: TechPowerUp

Графический процессор GB202 содержит 21 760 ядер CUDA (на 33 % больше, чем у RTX 4090), 680 текстурных блоков, 192 блока растеризации, 170 SM-блоков, 680 тензорных ядер пятого поколения и 170 RT-ядер четвёртого поколения. Базовая частота GPU составляет 2017 МГц, максимальная заявлена на уровне 2407 МГц. Но, как показывает практика, в играх новинка обеспечивает более высокую частоту. GeForce RTX 4090 выдаёт 2750 МГц, несмотря на заявленные 2520 МГц. Флагман серии Blackwell получил 32 Гбайт новой памяти GDDR7 со скоростью 28 Гбит/с на контакт и поддержкой 512-битного интерфейса. Благодаря этому пропускная способность памяти у RTX 5090 на 78 % выше, чем у предшественника, и составляет 1,79 Тбайт/с.

Заявленный показатель энергопотребления карты составляет 575 Вт, что на 27 % (125 Вт) выше, чем у RTX 4090. Nvidia рекомендует использовать с новинкой блок питания мощностью не менее 1000 Вт. GeForce RTX 5090 оснащена одним 16-контактным разъёмом дополнительного питания, интерфейсом PCI Express 5.0 x16, а также внешними разъёмами DisplayPort 2.1b и HDMI 2.1a.

Одной из ключевых особенностей видеокарт GeForce RTX 50-й серии является эксклюзивная поддержка мультикадрового генератора (Multi Frame Generation, MFG). В отличие от генератора кадров первого поколения, появившегося с выходом видеокарт GeForce RTX 40-й серии, новый генератор создаёт не один, а три дополнительных кадра на каждый традиционно отрисованный кадр для повышения FPS. Но об этом ниже.

 Относительная производительность GeForce RTX 5090 в 1080p, 1440p и 4K

Относительная производительность GeForce RTX 5090 в 1080p, 1440p и 4K

GeForce RTX 5090 безусловно является картой, предназначенной для игр в разрешении 4K с максимальными настройками качества и трассировки лучей. Поэтому большинство обзоров этой видеокарты в большей степени сосредоточены именно на этом разрешении. Так, игровые тесты портала TechPowerUp показывают, что по чистой растровой производительности (без RT и DLSS), GeForce RTX 5090 обеспечивает до 35 % больше производительности в сравнении с GeForce RTX 4090. Безусловно это впечатляет, поскольку традиционно прибавка производительности между флагманами Nvidia разных поколений составляла порядка 25 %. И всё же эта прибавка меньше, чем была при переходе от GeForce RTX 3090 Ti к GeForce RTX 4090. Согласно тестам TechPowerUp, разница в производительности между поколениями тогда составила порядка 51 %, а согласно другим обозревателям — ещё больше. Новая GeForce RTX 5090 вдвое быстрее RTX 3090 Ti. Конкурентов у видеокарты нет и не предвидится. Ближайший в лице Radeon RX 7900 XTX отстаёт от неё до 75 %. Только вдумайтесь.

Поскольку от карт AMD новой серии Radeon RX 9070 на архитектуре RDNA 4 ожидается производительность где-то между Radeon RX 7900 XT и RX 7900 GRE, новая RTX 5090 будет как минимум вдвое быстрее самой производительной карты AMD нового поколения. По сравнению со второй самой быстрой видеокартой Nvidia поколения Ada Lovelace, GeForce RTX 4080, преимущество RTX 5090 достигает 72 %. И всё это растровая производительность.

Ниже будут представлены результаты игровых тестов в разрешениях 1440p и 1080p, в которых новая карта также является безоговорочным лидером. Но стоит повторить, GeForce RTX 5090 не нужна тем, кто использует мониторы с разрешением ниже 4K. В этом случае лучшим решением будет сначала обновить монитор, а ещё лучше — ПК целиком, и уже затем присматриваться к новому флагману Nvidia.

Nvidia значительно поработала над трассировкой лучей у Blackwell. Уровень потери производительности при включении данной технологии ниже, чем у видеокарт Ada Lovelace.

Также компания добавила несколько новых методов оптимизации, которые могут использоваться разработчиками игр. Самым интересным из них является нейронный рендеринг, реализованный через API Microsoft DirectX (Cooperative Vectors). Это гарантирует, что функция будет доступна всем производителям видеокарт и её использование будет зависеть только от мотивации разработчиков игр. Производительность трассировки лучей в разрешении 4K у RTX 5090 на 32 % выше, чем у RTX 4090. Самая быстрая видеокарта AMD, Radeon RX 7900 XTX в 2,5 раза медленнее в этом вопросе.

С момента своего дебюта в 2018 году технология масштабирования с глубоким обучением (DLSS) от Nvidia эволюционировала уже до четвёртой версии. Её последняя итерация перешла на ИИ-модель типа трансформер, что позволило реализовать ряд новых функций, включая мультикадровую генерацию (Multi Frame Generation, MFG). Последняя позволяет создавать до трёх дополнительных кадров на каждый традиционно отрисованный кадр для повышения FPS. MFG является эксклюзивом видеокарт поколения Blackwell, каким был генератор кадров первого поколения для видеокарт GeForce RTX 40-й серии. Более подробно рассказать об этой технологии — потребуется отдельная статья. Здесь лишь отметим, что на данный момент родная поддержка данной функции реализована только в пяти играх. Одной из них является Cyberpunk 2077.

 Работа трассировки лучей, масштабирования, генератора кадров (только Nvidia) на разных видеокартах и объём потребляемой видеопамяти в Cyberpunk 2077

Работа трассировки лучей, масштабирования, генератора кадров (только Nvidia) на разных видеокартах и объём потребляемой видеопамяти в Cyberpunk 2077

На старте продаж RTX 5090 Nvidia обещает 75 игр с поддержкой этой технологии. Здесь важно отметить, что Multi Frame Generation не является каким-то чудом. Да, она значительно повышает FPS в играх (функция предлагает несколько уровней количества отрисовки дополнительных кадров), но вместе с этим повышается и задержка ввода, поскольку на один реально отрисованный видеокартой кадр игра, поддерживающая MFG, дорисовывает до трёх дополнительных кадров. Как результат, если видеокарта выдаёт свои родные 60 кадров в секунду, но на экране игра демонстрирует 200 кадров в секунду, задержка ввода будет ощущаться как при 60 кадрах в секунду, а не как при 200. Эта функция, скорее всего, не появится на видеокартах прошлых поколений, в отличие от других функций DLSS 4.

 Работа мультикадрового генератора в игре Cyberpunk 2077. Источник изображения: YouTube / Jayztwocents

Работа мультикадрового генератора в игре Cyberpunk 2077. Источник изображения: YouTube / Jayztwocents

Переход от свёрточной нейронной сети (Convolutional Neural Network, CNN) в DLSS 3 к ИИ-модели типа трансформер в составе DLSS 4 также оказал влияние на работу функции масштабирования изображения. Самое важное, что здесь необходимо знать, ИИ-модель типа трансформер обеспечивает значительно более высокое качество выходного изображения при масштабировании по сравнению с CNN. По словам обозревателя TechPowerUp, это действительно видно невооружённым глазом. Качество изображения в режиме DLSS «Качество» становится настолько чётким, что в некоторых случаях превосходит качество родного разрешения. Больше никаких мерцаний или размытых текстур низкого разрешения на горизонте. Тонкие провода на изображении становятся кристально чёткими, даже при исходном разрешении ниже 4K. Однако у этого всего есть своя цена — производительность DLSS с ИИ-моделью типа трансформер примерно на 10 % ниже, чем при использовании CNN. Но конечный результат масштабирования этого стоит.

 Энергопотребление

Энергопотребление

Имеет ли смысл говорить об энергопотреблении видеокарты стоимостью от $2000 и с заявленным TDP 575 Вт? Целевая аудитория этого продукта вряд ли обратит внимание на такую «мелочь». Тем не менее карта в играх потребляет всю заявленную мощность. В некоторых случаях энергопотребление оказывается даже выше, а пики достигают 644 Вт (данные TechPowerUp). В режиме простоя энергопотребление карты составляет 30 Вт с одним монитором и 39 Вт с двумя мониторами. Воспроизведение видео требует 54 Вт. В играх энергопотребление составляет около 587 Вт (561 Вт с включённым RT). Максимальное энергопотребление по данным тестов TechPowerUp составило 601 Вт. Речь только о видеокарте, без учёта потребления процессора, материнской платы и других элементов ПК.

 Температуры и шум эталонной GeForce RTX 5090 Founders Edition

Температуры и шум эталонной GeForce RTX 5090 Founders Edition

В эталонном исполнении температура GPU GeForce RTX 5090, согласно тестам, составила 77 градусов Цельсия, а память GDDR7 прогрелась до 94 градусов. При этом шум вентиляторов составил 40,1 дБА — она громче эталонных GeForce RTX 4090 (35,1 дБА) и Radeon RX 7900 XTX (39,2 дБА). Вероятно, кастомные версии RTX 5090 от партнёров Nvidia, оснащённые фирменными кулерами, предложат более низкие температуры и шум. Напомним, толщина эталонной версии RTX 5090 составляет всего два слота расширения, при этом карта оснащена только двумя вентиляторами охлаждения. В составе системы охлаждения также используется новая трёхмерная испарительная камера и термоинтерфейс в виде жидкого металла. Подробнее об этом можно почитать здесь.

 Источник изображения: Nvidia

Источник изображения: Nvidia

Для GeForce RTX 5090 действительно нет альтернатив. AMD в рамках нового поколения видеокарт решила даже не пытаться догнать конкурента и фактически полностью уступила старший сегмент игровых ускорителей для решений Nvidia. Картам AMD не хватает чистой производительности и им нечего противопоставить таким функциям, как мультикадровая генерация DLSS и ИИ-модель масштабирования типа трансформер. Об AMD FSR 4 и её особенностях на данный момент ничего неизвестно. С другой стороны, цена в $2000 за RTX 5090 чрезвычайно высока. Это на $400 больше по сравнению с рекомендованной ценой RTX 4090. Несмотря на это, можно не сомневаться, что весь запас этих карт будет полностью распродан — ничего лучшего просто нет.

AMD рассказала, какой будет игровая производительность Ryzen 9 9950X3D и 9900X3D

Будущий флагманский процессор Ryzen 9 9950X3D предложит «сопоставимый» уровень игровой производительности с Ryzen 7 9800X3D, считающимся лучшим игровым игровым процессором на рынке. Об этом в разговоре с порталом VideoGamer заявил менеджер по развитию продуктов и бизнеса AMD Мартейн Бунстра (Martijn Boonstra).

 Источник изображения: AMD

Источник изображения: AMD

По словам Бунстры, AMD ожидает, что Ryzen 9 9950X3D и Ryzen 9 9900X3D «обеспечат в общем смысле аналогичную модели Ryzen 7 9800X3D игровую производительность».

«Некоторые игры будут работать лучше (если игровой движок использует больше ядер и потоков), некоторые игры будут работать чуть хуже (если игровой движок лучше работает с конфигурациями из одного кристалла CCD), но в целом опыт будет сопоставимым», — заявил Бунстра.

Модель Ryzen 7 9800X3D в значительной степени адаптирована для игрового рынка и завоевала значительную популярность благодаря своей поддержке дополнительного разгона. С момента выпуска Ryzen 7 9800X3D в продажу энтузиасты и оверклокеры смогли разогнать процессор до впечатляющих 7,4 ГГц и добились его стабильной работы на частоте 6,9 ГГц при заявленной AMD максимальной частоте 5,2 ГГц для данного чипа.

Если исходить исключительно из заявленных характеристик, то модели Ryzen 9 9950X3D и Ryzen 9 9900X3D выглядят значительно производительнее Ryzen 7 9800X3D. Первый имеет 16 ядер и заявленную частоту до 5,7 ГГц, второй оснащён 12 ядрами и работает на частоте до 5,5 ГГц. Также у старших моделей больше кеш-памяти: у Ryzen 9 9950X3D её 144 Мбайт (L2 + L3), а у Ryzen 9 9900X3D — 140 Мбайт (L2 + L3). Общий объём кеш-памяти у того же Ryzen 7 9800X3D составляет 104 Мбайт.

Несмотря на состоявшийся анонс Ryzen 9 9950X3D и Ryzen 9 9900X3D, компания AMD пока не объявляла цены этих процессоров. Производитель пообещал их назвать ближе к выпуску чипов. В продаже новые процессоры должны появиться в первом квартале 2025 года, то есть до конца марта.

Arm пообещала разобраться с Qualcomm и существенно ускорить чипы для ПК в 2025 году

Процессоры для ПК с архитектурой Arm демонстрируют высокую энергоэффективность, но уступают конкурентам в тяжёлых рабочих нагрузках. Старший вице-президент Arm Крис Берджи (Chris Bergey) рассказал PC World на выставке CES 2025 о планах компании по существенному увеличению тактовых частот своих процессорных ядер для повышения производительности. Он также заявил, что иск к Qualcomm о нарушении лицензирования — «всё ещё открытый вопрос, который необходимо решить».

 Источник изображений: Arm

Источник изображений: Arm

Два наиболее распространённых типа лицензий Arm — на ядро и на архитектуру. В первом случае клиент покупает право на производство уже разработанного изделия, такого как ЦП Cortex или ГП Mali. Во втором случае лицензия даёт свободу разрабатывать собственные ядра с нуля, лишь сохраняя совместимость с архитектурой Arm.

Архитектура Arm RISC обычно считается более энергоэффективной, чем архитектура x86, используемая AMD и Intel, хотя для неё требуется либо создание нативных программ, либо использование эмулятора для запуска приложений x86. Хотя чипы Arm часто более эффективны — с точки зрения работы, выполняемой за такт (инструкций за такт, IPC) или за ватт — они все равно могут отставать по общей производительности. Исключением стал специальный чип Apple M4, продемонстрировавший весьма конкурентоспособную однопоточную производительность.

«Мы лидируем в IPC в некоторых продуктах на рынке, — сказал Берджи. — Но мы работаем на более низкой частоте, чем некоторые из этих продуктов. И поэтому я просто предлагаю — вы знаете, IPC, умноженное на частоту, правильно, даёт вам [более высокую] производительность. Мы хотим продолжать предоставлять ядра Arm с самой высокой производительностью, поэтому мы продолжим делать эти инвестиции».

Вторым приоритетом для Arm является ускорение рабочих нагрузок ИИ в собственных разработках, в частности в ЦП и ГП. В будущих процессорах, Arm планирует добавить новые масштабируемые векторные расширения. В графических процессорах Arm будет использовать ИИ для улучшения графики. «В мобильном телефоне вы можете выполнять рендеринг в 1080p, 60 Гц, верно? Но вы также можете выполнять рендеринг в 540p, 30 Гц и использовать ИИ для интерполяции», — уверен Берджи. Он утверждает, что использование ИИ для интерполяции или рендеринга изображения более энергоэффективно, чем прямой рендеринг изображения.

По словам Берджи, Arm собирается стать лидером в попытках перенести полную обработку на GPU в мобильной среде. Это станет частью Arm CSS for Client — вычислительной платформы Arm следующего поколения. «По сути, мы упрощаем для людей задачу объединения технологий и делаем это для максимизации производительности, — сказал Берджи. — Так что, если вам нужно максимизировать эту частоту и получить конструкцию на четыре гигагерца, мы сможем предоставить вам этот рецепт для некоторых из последних [производственных] узлов».

Arm традиционно поддерживает стабильные отношения со своими партнёрами по лицензированию. Исключением стало продолжающееся с 2022 года судебное разбирательство с Qualcomm. В октябре прошлого года Arm попыталась аннулировать архитектурное лицензионное соглашение с Qualcomm. Но суд по двум из трёх вопросов вынес решение в пользу Qualcomm. По мнению суда, Qualcomm не нарушила лицензии Arm, получив доступ к архитектуре процессоров поглощённой ею компании Nuvia.

Однако присяжные не смогли прийти к выводу о том, нарушила ли сама Nuvia условия своей архитектурной лицензии. По словам Берджи, это оставляет дело между двумя компаниями «неразрешённым». «Это всё ещё открытый вопрос, который необходимо решить между двумя сторонами», — заявил он, отказавшись от дальнейших комментариев.

GeForce RTX 5090 показала очень скромную производительность в Cyberpunk 2077 в 4К без DLSS 4 и генератора кадров

Не секрет, что анонс видеокарт GeForce RTX 50-й серии вызвал смешанные отзывы игрового сообщества. С одной стороны, новая технология масштабирования DLSS 4 с мультикадровым генератором (MFG), который работает только на этих картах, позволяют значительно повысить FPS. С другой стороны, не все оказались довольны тем, что прирост достигается в большей степени не за счёт чистой производительности, а благодаря кадрам, отрисованным с использованием различных технологий ИИ.

 Источник изображения: Nvidia

Источник изображения: Nvidia

YouTube-канал PC Centric опубликовал видео, демонстрирующее работу новой флагманской видеокарты GeForce RTX 5090 в игре Cyberpunk 2077 с технологией трассировки путей (Path Tracing) в разрешении 4K, с включёнными и выключенными спорными ИИ-функциями. При включении DLSS 4 в режиме «Производительность» новый генератор кадров MFG увеличивает количество кадров в секунду в четыре раза, создавая три дополнительных кадра. Благодаря этому RTX 5090 выдаёт в игре порядка 280 FPS. Это весьма впечатляющий результат, особенно если учитывать приемлемую задержку около 52 мс с редкими всплесками.

 Источник изображений здесь и ниже :YouTube / PC Centric

Источник изображений здесь и ниже :YouTube / PC Centric

Переключение DLSS на режим «Качество» снизило кадровую частоту до 230 FPS, однако задержка осталась на прежнем уровне — около 50 мс. Примечательно, что при использовании генератора кадров в режиме 3x или даже 2x разница в задержке между ними была незначительной и составляла около 44 мс.

Значительная просадка FPS наблюдалась при полном отключении генератора кадров. При включённом DLSS в режиме «Качество» и отключённом генераторе GeForce RTX 5090 едва смогла выдать 70 FPS. После отключения DLSS новый игровой флагман Nvidia упёрся в 34 кадра в секунду, а задержка при этом выросла до 70 мс.

Этот тест показал, что DLSS 4 и MFG действительно обеспечивают невероятную прибавку производительности за счёт отрисовки дополнительных кадров. Как показал пример Cyberpunk 2077, эта прибавка достигается с минимальной деградацией изображения (артефактами).

GeForce RTX 5090 также впервые отметилась в графических бенчмарках Geekbench OpenCL и Vulkan. Здесь технология DLSS не играет никакой роли. Если вы хотите понять, какие улучшения в чистой производительности предлагает RTX 5090 по сравнению с RTX 4090, то некоторые сведения можно почерпнуть из этих тестов.

 Источник изображения: Geekbench

Источник изображения: Geekbench

Один из обозревателей протестировал RTX 5090 в сочетании с процессором Core i9-12900K, материнской платой Asus ROG Strix Z690 и оперативной памятью DDR4-3600. Результаты тестов Geekbench OpenCL и Vulkan показали, что новый игровой флагман Nvidia действительно является самой быстрой видеокартой в указанных бенчмарках. RTX 5090 превосходит модели GeForce RTX 4090 и Radeon RX 7900 XTX в обоих тестах.

В тесте Vulkan новая карта по итогам трёх прогонов показала результаты от 331 525 до 359 742 баллов, превзойдя предшественника на 26–37 % (результат RTX 4090 — 262 487 баллов). Однако в тесте OpenCL разница в производительности оказалась значительно ниже — от 6,7 до 15 %.

В первых игровых тестах консольный процессор Ryzen Z2 Go оказался всего на 10 % медленнее Ryzen Z1 Extreme

YouTube-канал Fps Vn опубликовал результаты первых игровых тестов портативной игровой приставки Lenovo Legion Go S. Устройство, представленное в рамках международной выставки электроники CES 2025, оснащено процессором Ryzen Z2 Go и в одной из версий работает под управлением операционной системой SteamOS.

 Источник изображений: YouTube / Fps Vn

Источник изображений: YouTube / Fps Vn

Процессор Ryzen Z2 Go относится к серии Rembrandt и оснащён четырьмя ядрами Zen 3+ с поддержкой восьми виртуальных потоков. Чип работает на частоте до 4,3 ГГц и имеет 10 Мбайт кэш-памяти. Показатель энергопотребления настраивается в пределах от 15 до 30 Вт. В составе процессора также встроенная графика Radeon 680M на базе архитектуры RDNA 2 с 12 исполнительными блоками.

 Источник изображения: AMD

Источник изображения: AMD

Игровую производительность Ryzen Z2 Go в составе Lenovo Legion Go S сравнили с показателями процессора Ryzen Z1 Extreme в основе портативной приставки Asus ROG Ally X. Средой тестирования стали игры Black Myth: Wukong, Cyberpunk 2077 и Ghost of Tsushima Director's Cut. Устройства тестировались в разрешении 720p и 1080p, в режимах 15, 20 и 30 Вт для процессора.

Игровые бенчмарки показали, что Ryzen Z2 Go всего на 9–10 % медленнее. И это весьма впечатляющий результат, учитывая, что Ryzen Z2 Go использует более старую архитектуру (Zen 3 против Zen 4 у Ryzen Z1 Extreme), оснащён вдвое меньшим количеством физических ядер (четыре против восьми у Ryzen Z1 Extreme), работает на более низкой частоте (4,3 ГГц против 5,1 ГГц у Ryzen Z1 Extreme) и получил менее производительную графику (RDNA 2 против RDNA 3 у Ryzen Z1 Extreme).

Ниже представлена таблица со средним значением FPS, которое обеспечивается обеими приставками в разных режимах и при использовании разного разрешения.

 Источник изображения: Tom's Hardware

Источник изображения: Tom's Hardware

Первой в продаже должна появиться старшая версия Legion Go S под Windows. Она ожидается уже в этом месяце по цене $729,99. В марте должен появиться её менее дорогой вариант по цене $599,99. В свою очередь, модель Legion Go S на SteamOS придётся подождать до мая 2025 года, а стоить она будет $499,99. В обоих версиях приставки используется 8-дюйвый WUXGA-дисплей PureSight с соотношением сторон 16:10, разрешением 1920 × 1200 пикселей и частотой обновления 120 Гц. Консоль предложит до 32 Гбайт ОЗУ и аккумулятор ёмкость 55,5 Вт·ч.

Nvidia рассказала, насколько карты GeForce RTX 5000 на самом деле быстрее RTX 4000

Nvidia опубликовала новые данные о производительности видеокарт GeForce RTX 50-й серии, включая результаты бенчмарков без использования технологии масштабирования DLSS 4, которая обеспечивает значительный прирост производительности по сравнению с видеокартами RTX предыдущего поколения.

 Источник изображений: Nvidia

Источник изображений: Nvidia

Nvidia поделилась информацией о производительности видеокарт GeForce RTX 5090, RTX 5080, RTX 5070 Ti и RTX 5070 в двух новых играх — Resident Evil 4 и Horizon Forbidden West. Первую компания тестировала только с трассировкой лучей (RT) и без использования технологии масштабирования DLSS. Во второй использовалась технология масштабирования DLSS, но не последняя версия DLSS 4 со встроенным мультикадровым генератором (Multi Frame Generation, MLG).

Портал ComputerBase скомпилировал результаты, демонстрирующие улучшение производительности в зависимости от увеличения числа шейдерных ядер для каждого класса графических процессоров.

 Источник изображения: VideoCardz по данным ComputerBase

Источник изображения: VideoCardz по данным ComputerBase

Согласно этим данным, GeForce RTX 5090 демонстрирует 33-процентный прирост производительности по сравнению с RTX 4090 в указанных играх (Resident Evil 4 и Horizon Forbidden West). Модель RTX 5080, в свою очередь, на 15 % быстрее, а RTX 5070 Ti и RTX 5070 — примерно на 20 % быстрее своих предшественников поколения Ada Lovelace.

Новые графики Nvidia включают и другие игры, но эти результаты не подходят для сравнения, поскольку для новых карт компания использовала настройки с включённым мультикадровым генератором, а модели GeForce RTX 40-й серии его не поддерживают, что делает сравнение некорректным.

Результаты чистой растровой производительности новых видеокарт, скорее всего, станут известны после публикации первых независимых обзоров, которые ожидаются 24 января.

Низкопробный софт AMD не даёт раскрыть потенциал ИИ-ускорителей Instinct MI300X и обойти Nvidia, выяснили эксперты

Пятимесячное расследование компании SemiAnalysis показало, что специализированные ИИ-ускорители серии AMD MI300X не раскрывают свой потенциал из-за серьёзных проблем в работе программного обеспечения. Этот факт делает все усилия компании по навязыванию жёсткой конкуренции Nvidia, доминирующей на рынке аппаратного обеспечения для ИИ, бессмысленными.

 Источник изображения: The Decoder

Источник изображения: The Decoder

Исследование показало, что программное обеспечение AMD изобилует ошибками, которые делают обучение моделей ИИ практически невозможным без значительной отладки. Таким образом, пока AMD работает над обеспечением качества и простоты использования своих ускорителей, Nvidia продолжает увеличивать разрыв, развёртывая новые функции, библиотеки и повышая производительность своих решений.

По итогам обширных тестов, включая тесты GEMM и одноузловое обучение, исследователи пришли к выводу, что AMD не в состоянии преодолеть то, что они называют «неприступным рвом CUDA» — сильное преимущество в виде программного обеспечения, которым обладают ускорители Nvidia.

 Источник изображения: SemiAnalysis

Источник изображения: SemiAnalysis

AMD MI300X «на бумаге» выглядят впечатляюще: 1307 Тфлопс в вычислениях FP16 и 192 Гбайт памяти HBM3. Для сравнения, ускорители Nvidia H100 обладают производительностью 989 Тфлопс и имеют только 80 Гбайт памяти. Однако новое поколение ИИ-ускорителей Nvidia H200 с конфигурациями до 141 Гбайт памяти сокращает разрыв в объёме доступного буфера памяти. Кроме того, системы на базе ускорителей AMD также предлагают более низкую общую стоимость владения благодаря более низким ценам на такие системы и более доступной поддержке сетевой инфраструктуры.

 Источник изображения: SemiAnalysis

Источник изображения: SemiAnalysis

Однако эти преимущества мало что значат на практике. По данным SemiAnalysis, сравнение «голых» спецификаций похоже на «сравнение камер, когда просто проверяешь количество мегапикселей у одной и другой». AMD, отмечают аналитики, таким образом «просто играет с цифрами», но её решения не обеспечивают достаточный уровень производительности в реальных задачах.

Исследователи отмечают, что им пришлось напрямую работать с инженерами AMD, чтобы исправить многочисленные ошибки в ПО для получения пригодных для оценки результатов тестов. В то же время системы на базе ускорителей Nvidia работали гладко и без каких-либо дополнительных настроек.

«С OOBE от AMD (опыт, который пользователь получает при получении продукта после распаковки или при запуске установщика и подготовке к первому использованию, так называемый "опыт из коробки" — прим. ред.) очень сложно работать. И для перехода к пригодному к использованию состоянию [оборудования] может потребоваться немало терпения и усилий», — пишут эксперты.

Особенно показательным для SemiAnalysis оказался случай, когда компания TensorWave, крупнейший поставщик облачных решений на базе графических процессоров AMD, была вынуждена предоставить команде инженеров AMD бесплатный доступ к своим графическим процессорам — тому же оборудованию, которое TensorWave приобрела у AMD — только для устранения проблем с программным обеспечением.

Для решения проблем эксперты SemiAnalysis рекомендуют генеральному директору AMD Лизе Су (Lisa Su) более активно инвестировать в разработку и тестирование программного обеспечения. В частности, они предлагают выделить тысячи чипов MI300X для автоматизированного тестирования (аналогичному подходу следует Nvidia для своих ускорителей), упростить сложные переменные среды, одновременно внедрив более эффективные настройки для ускорителей по умолчанию. «Сделайте готовый опыт пригодным к использованию!» — призывают специалисты.

Представители SemiAnalysis в своём отчёте признаются, что желают успеха компании AMD в конкуренции с Nvidia, но отмечают, что «к сожалению, для этого ещё многое предстоит сделать». Без существенных улучшений программного обеспечения AMD рискует ещё больше отстать, поскольку Nvidia готовится к массовому выпуску ускорителей нового поколения Blackwell. Хотя, по сообщениям, этот процесс у Nvidia также проходит не совсем гладко.

Вышли обзоры Intel Arc B580 — лучшая видеокарта за свои деньги

Продажи видеокарты Intel Arc B580 нового поколения Battlemage стартуют уже завтра. Intel разрешила профильным изданиям и блогерам рассказать об этой новинке сегодня, однако в обзорах была представлена только эталонная версия видеокарты — Intel Arc B580 Limited Edition. Публикации обзоров моделей с дополнительным заводским разгоном от партнёров Intel начнут появляться в день старта продаж видеокарты, то есть 13 декабря.

 Источник изображений: TechPowerUp

Источник изображений: TechPowerUp

Intel Arc B580 относится к решениям среднего уровня. Как и её младшая сестра Arc B570, которая поступит в продажу только 16 января следующего года, она основана на архитектуре Xe2 Battlemage. Эта архитектура также используется в составе интегрированной графики процессоров Intel Lunar Lake для ноутбуков.

 Источник изображения: Intel

Источник изображения: Intel

Модель Intel Arc B580 получила графический процессор BGM-G21, производимый по 5-нм техпроцессу. Чип содержит 20 ядер на архитектуре Xe2 (2560 шейдерных движков), 160 текстурных блоков, 80 блоков растеризации, 160 тензорных ядер и 20 ядер для трассировки лучей второго поколения. Intel заявляет, что архитектура Xe2 обеспечивает прирост производительности на 70 % на ядро по сравнению с графикой предыдущего поколения Arc Alchemist. Базовая частота GPU новой карты составляет 1700 МГц, а в режиме Boost она повышается до 2670 МГц.

Intel Arc B580 оснащена 12 Гбайт памяти GDDR6 с поддержкой 192-битной шины и пропускной способностью 456 Гбайт/с. В эталонном исполнении карта имеет один 8-контактный разъём для дополнительного питания. Энергопотребление новинки заявлено на уровне 190 Вт. Для работы Arc B580 используются только 8 линий PCIe 4.0. Вместе с ней рекомендуется использовать Resizable BAR.

Карта поддерживает аппаратное ускорение AV1, HEVC, AVC, VP9 и XAVC-H. Кроме того, она поддерживает фирменные технологии масштабирования XeSS 2 и генерации кадров XeSS Frame Generation, которые повышают игровую производительность. В оснащение карты входят один HDMI 2.1 и три DisplayPort 2.1. Один из разъёмов DisplayPort 2.1 соответствует стандарту UHBR13.5 (54 Гбит/с), два других — UHBR10 (40 Гбит/с).

Intel Arc B580 с рекомендованной ценой $250 позиционируется в качестве решения для игр в разрешении 1080p при максимальных настройках качества и для игр в 1440p при сниженных настройках качества изображения.

Первые обзоры видеокарты показывают, что она справляется со своей задачей. По данным TechPowerUp, Arc B580 в эталонном исполнении в играх с разрешением 1080p до 42 % быстрее предшественника Arc A580 поколения Alchemist, на 5 % быстрее конкурента GeForce RTX 4060 и почти на 15 % быстрее AMD Radeon RX 7600. Старшая модель Radeon RX 7600 XT на 4 % медленнее новичка от Intel, но дороже почти на $60. Однако уже GeForce RTX 4060 Ti обеспечивает на 21 % больше кадров в секунду, а Radeon RX 7700 XT — на 33 % быстрее новой Arc B580, но и стоят эти карты около $400.

При использовании более высокого разрешения Arc B580 также оказывается быстрее конкурентов. Новинка Intel обгоняет GeForce RTX 4060 в среднем на 8 %, модель Radeon RX 7600 оказывается медленнее новичка на 9 %, модель Arc A770 отстаёт от него на 12 %, а прямой предшественник Arc A580 — на целых 30 %. Однако при игре в разрешении 1440p в любом случае придётся жертвовать либо качеством графики, либо использовать технологию масштабирования. А в некоторых случаях потребуется смириться и с тем, и с другим. По мнению обозревателя TechPowerUp, карту сложно рекомендовать в качестве надёжного выбора для игр в 1440p для не слишком требовательных геймеров.

 Относительная производительность трассировки лучей в разрешении 1080p

Относительная производительность трассировки лучей в разрешении 1080p

В новой графической архитектуре Xe2 компания Intel улучшила работу трассировки лучей. В этом аспекте Arc B580 безусловно лучше прямых конкурентов от AMD. В разрешении 1080p GeForce RTX 4060 всё ещё имеет преимущество над Arc B580, но как только игры запускаются в разрешении 1440p всё преимущество «зелёных» резко улетучивается, поскольку у них заканчивается выделенная память.

У GeForce RTX 4060 всего 8 Гбайт видеопамяти против 12 Гбайт у Arc B580. Поэтому Arc B580 в некоторых случаях может даже превзойти гораздо более дорогую GeForce RTX 4060 Ti с 8 Гбайт. Версия GeForce RTX 4060 Ti с 16 Гбайт по-прежнему остаётся далеко впереди, но она почти в два раза дороже (425 долларов против 250 долларов).

 Относительная производительность трассировки лучей в разрешении 1440p

Относительная производительность трассировки лучей в разрешении 1440p

Переход на новый 5-нм техпроцесс TSMC вкупе с архитектурными изменениями определённо пошёл на пользу серии видеокарт Intel Battlemage. В играх Arc B580 потребляет 185 Вт, что делает её намного более энергоэффективной, чем Arc A770 предыдущего поколения с потреблением 235 Вт. Также новая карта потребляет меньше Radeon RX 7600 XT, которой требуется 198 Вт. Модель Radeon RX 7600 требует на 30 Вт меньше мощности (154 Вт), но это небольшая разница с учётом производительности, которую обеспечивает Arc B580. С другой стороны, GeForce RTX 4060 энергоэффективнее по сравнению с новинкой. «Зелёной» карте в играх требуется всего 128 Вт.

 Энергопотребление Intel Arc B580 в разных сценариях использования

Энергопотребление Intel Arc B580 в разных сценариях использования

Однако обозревателям не очень понравилось энергопотребление карты в простое, а также в неигровых сценариях. При бездействии Arc B580 может потреблять 34 Вт, что обозреватели посчитали чрезмерным для видеокарты, выпущенной в 2024 году. Для сравнения, энергопотребление в простое у GeForce RTX 4060 составляет 14 Вт, у модели Radeon RX 7600 XT — 4 Вт, а у Radeon RX 7600 — всего 2 Вт. Карты Arc Alchemist, выпущенные в 2022 году, имели ту же проблему, и Intel, к сожалению, до сих пор её не исправила. Компания предлагает в качестве решения использовать настройки энергопотребления ASMP, которые изначально отключены у большинства настольных ПК и о которых большинство пользователей, вероятно, вообще никогда не слышало. Для их включения необходимо заходить в BIOS материнской платы. Включение ASMP действительно снижает энергопотребление видеокарты в простое до 7 Вт (при подключении одного монитора), однако при использовании конфигурации из нескольких мониторов или при воспроизведении видео энергопотребление карты по-прежнему остаётся высоким — 31 и 36 Вт соответственно.

В эталонном исполнении Arc B580 Limited Edition карта обладает относительно низким уровнем шума около 30 дБА. Некоторые самые доступные варианты GeForce RTX 4060 оснащаются менее качественными кулерами, которые шумят сильнее. Температуры новинки тоже приемлемые — 73 °С для GPU под нагрузкой. Если у видеокарт Arc Alchemist в эталонном исполнении не было функции остановки вентиляторов при низкой или отсутствующей нагрузке на графическую подсистему, то у Battlemage появилась такая особенность. Правда работа этой функции Arc B580 несколько раздражает, поскольку вентиляторы то и дело запускаются каждые несколько секунд. Возможно, речь идёт об ошибке в работе алгоритма управления вентиляторами — ответ на вопрос покажут будущие обновления ПО. В версиях от партнёров, оснащённых ещё более эффективными системами охлаждения, температура GPU и памяти должны быть ещё ниже.

 Температуры

Температуры

В целом обозреватели называют Arc B580 отличным решением за свои деньги. В плюсы карты записаны соотношение цены видеокарты и её производительности, поддержка трассировки лучей и технологии генерации кадров XeSS 2, высокая энергоэффективность в играх, функция остановки вентиляторов, низкие рабочие температуры, а также хорошие возможности для аппаратного кодирования и декодирования видео. Из минусов отмечаются высокое энергопотребление в простое (требуется включение режима ASMP в BIOS), программные ошибки в алгоритме работы вентиляторов, использование только восьми линий PCIe 4.0 и необходимость в использовании Resizable BAR.

Intel Arc B580 оказалась быстрее GeForce RTX 4060 и прежнего флагмана Intel в тесте 3DMark Time Spy

Публикации первых полноценных обзоров новой видеокарты Intel Arc B580 серии Battlemage ожидаются в ближайшие дни. Однако некоторым обозревателям уже не терпится поделиться информацией о производительности новинки, поэтому в Сети оказались опубликованы данные о быстродействии карты. Правда, пока только в синтетическом бенчмарке 3DMark.

 Источник изображения: Intel

Источник изображения: Intel

В графическом тесте 3DMark Time Spy видеокарта Intel Arc B580 показала результат в 14 719 баллов. Обозреватель поделился графиком сравнения производительности новинки с видеокартами GeForce RTX 4060 от Nvidia, а также Intel Arc A770 и A750 предыдущего поколения Arc Alchemist. Результат Arc B580 в этом синтетическом тесте оказался выше, чем у перечисленных моделей.

 Источник изображения: Chiphell

Источник изображения: Chiphell

Intel Arc B580 показала производительность на 31 % выше в 3DMark Time Spy, чем GeForce RTX 4060, а также на 10 % и 19 % выше, чем Intel Arc A770 и A750 соответственно. К сожалению, обозреватель не стал сравнивать B580 с моделью A580, которая формально является её прямым предшественником. Тесты проводились на системе с процессором Intel Core i9-14900KF.

Следует отметить, что видеокарты Intel нередко демонстрируют очень хорошую производительность в синтетических бенчмарках, особенно на базе DirectX 12, таких как 3DMark Time Spy. Однако высокая производительность в синтетических тестах не всегда означает столь же высокую игровую производительность. В реальных условиях (например, в играх) разница в производительности между B580 и RTX 4060 будет значительно ниже заявленных 31 %. Даже сама Intel в своих рекламных материалах указывает, что Arc B580 примерно на 10 % быстрее GeForce RTX 4060 в играх при разрешении 1440p. А разница в 1080p между картами может быть ещё меньше.


window-new
Soft
Hard
Тренды 🔥
Роскомнадзор принудительно записал Cloudflare в организаторы распространения информации 3 мин.
«Небольшой, но искренний прогресс»: DeepSeek откроет для всех пять ИИ-репозиториев 38 мин.
Видео: прохождение пролога ремейка первой Gothic и получасовая демонстрация русской озвучки 55 мин.
Политический триллер в 1613 году: сюжетное дополнение «Земский собор» к «Смуте» получило первый трейлер и новые подробности 3 ч.
Разработчики Warhammer 40,000: Space Marine 2 сделают AAA-игру по одной из главных франшиз владельца D&D, MTG и «Трансформеров» 3 ч.
Microsoft представила ИИ-агента Magma для управления приложениями и реальными роботами 5 ч.
ИИ начал «отбирать» премии у сотрудников Meta 5 ч.
Возвращение драконов, морские сражения и влияние Starfield: инсайдер поделился новыми подробностями The Elder Scrolls VI 5 ч.
Hasbro раскрыла, когда выйдет Exodus — грандиозная научно-фантастическая RPG в духе Mass Effect от студии ветеранов BioWare 6 ч.
Activision спрятала на новой карте Call of Duty: Black Ops 6 тизер анонса Tony Hawk’s Pro Skater 3 + 4 7 ч.
В Балтийском море снова повредился интернет кабель C-Lion1 15 мин.
Apple отвергла причастность модема C1 к отсутствию MagSafe в iPhone 16e 23 мин.
G.Skill представила улучшенную память DDR5 R-DIMM на 16-слойных печатных платах и с защитой от перепадов напряжения 28 мин.
HP пыталась «повысить качество» техподдержки, заставив клиентов ждать 15 минут ответа на звонок 2 ч.
DeepSeek разогнали до рекордной скорости всего на 16 чипах SambaNova — чипов Nvidia потребовалось бы в 20 раз больше 2 ч.
Обнаружена косвенная связь между взрывом сверхновой и эволюции жизни на Земле 2 ч.
Китайцы выпустили адаптер 12V-2×6 со встроенным вентилятором, чтобы уберечь видеокарты от оплавления 3 ч.
Продажи смартфонов в Европе падали четыре года подряд, но теперь вернулись к росту — Samsung осталась лидером 4 ч.
Трамповские пошлины могут сильно ударить по бизнесу Samsung 4 ч.
Radeon RX 9070 XT смогут работать с частотой выше 3000 МГц прямо из коробки 5 ч.