Новости Hardware

Тензорные и RT-ядра занимают не так много места на графических процессорах NVIDIA Turing

Ещё во время анонса первых видеокарт GeForce RTX 20-й серии многие посчитали, что своими совсем не маленьким габаритами графические процессоры Turing обязаны наличию дополнительных блоков: RT-ядер и тензорных ядер. Теперь же один из пользователей Reddit проанализировал инфракрасные снимки графических процессоров Turing TU106 и TU116 и заключил, что новые вычислительные блоки занимают не так много места, как считалось изначально.

Для начала напомним, что графический процессор Turing TU106 является младшим и самым компактным чипом NVIDIA со специальными RT-ядрами для трассировки лучей и тензорными ядрами для ускорения функций искусственного интеллекта. В свою очередь родственный ему графический процессор Turing TU116 лишён этих специальных вычислительных блоков и именно поэтому сравнить было решено именно их.

Графические процессоры NVIDIA Turing делятся на блоки TPC, которые включают в себя пару потоковых мультипроцессоров (Streaming Multiprocessors), в которые уже и входят все вычислительные ядра. И, как оказалось, у графического процессора Turing TU106 площадь блока TPC всего лишь на 1,95 мм² больше, чем у Turing TU116, то есть на 22 %. Из этой площади 1,25 мм² приходится на тензорные ядра, и лишь 0,7 мм² — на RT-ядра.

Получается, что без новых тензорных и RT-ядер флагманский графический процессор Turing TU102, лежащий в основе GeForce RTX 2080 Ti, занимал бы не 754 мм², а 684 мм² (36 TPC). В свою очередь Turing TU104, являющийся основой GeForce RTX 2080, мог бы занимать 498 мм² вместо 545 мм² (24 TPC). Как видно, даже без тензорных и RT-ядер старшие графические процессоры Turing были бы весьма крупными чипами. Значительно больше графических процессоров Pascal.

Так с чем же связаны столь немалые размеры? Для начала, у графических процессоров Turing был увеличен объём кеш-памяти. Ещё был увеличен размер шейдеров, а также чипы Turing располагают большими наборами инструкций и увеличенными регистрами. Всё это позволило ощутимо повысить не только площадь, но и производительность графических процессоров Turing. Например, та же GeForce RTX 2060 на базе TU106 обеспечивает почти такой же уровень производительности, как и GeForce GTX 1080 на базе GP104. Последний, кстати, обладает на 25 % большим числом ядер CUDA, хоть и занимает площадь в 314 мм2 против 410 мм2 у нового TU106. 

Источники:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме
Прежде чем оставить комментарий, пожалуйста, ознакомьтесь с правилами комментирования. Оставляя комментарий, вы подтверждаете ваше согласие с данными правилами и осознаете возможную ответственность за их нарушение.
Все комментарии премодерируются.
Комментарии загружаются...
window-new
Soft
Hard
Тренды 🔥