Новости Hardware

NVIDIA GeForce GTX 970 в деталях: 56 RBE и урезанный кеш

Корпорации NVIDIA не удалось отделаться общими словами о различиях в подсистемах памяти графических адаптеров GeForce GTX 970 и GeForce GTX 980, и в итоге она опубликовала полные данные, касающиеся этой проблемы. Напоминаем, GeForce GTX 970 в текущем варианте не умеет полноценно работать со всем банком видеопамяти, составляющим, как мы помним, 4 Гбайт, и вынуждена делить его на два сегмента, первичный и вторичный — объемами 3,5 и 0,5 Гбайт соответственно. В нынешние дни разработчики графических процессоров редко публикуют подробные блок-схемы своих чипов, ограничиваясь общими диаграммами, но NVIDIA пришлось вернуться к практике былых времён, когда строение чипа на блок-схеме изображалось более подробно.

Общая диаграмма не отображает главного

Общая диаграмма не отображает главного

Дело в том, что у GeForce GTX 970 не 64 модуля растровых операций (RBE/ROP), как считалось (и было объявлено) ранее, а всего 56, а эта подсистема всегда очень тесно связана с подсистемой видеопамяти. При этом, разумеется, любой современный GPU имеет в своём составе довольно большой кеш; в случае с GM204 его объём равен 2 Мбайт, но он, согласно числу основных вычислительных массивов, разбит на четыре блока с двумя разделами кеша в каждом. Нетрудно подсчитать, что при общем объёме кеша 2 Мбайт (2048 Кбайт) каждый раздел имеет ёмкость 256 Кбайт. Тут-то и кроется объяснение поведения GeForce GTX 970 по отношению к видеопамяти. Дело в том, что в версии графического процессора, которая устанавливается на эти карты, отключены не только три кластера SMM из шестнадцати, но и один из восьми разделов кеша второго уровня, что из 2048 Кбайт оставляет только 1792 Кбайт.

Конфигурация подсистем GeForce GTX 970 в деталях

Конфигурация подсистем GeForce GTX 970 в деталях

Приведённая диаграмма наглядно объясняет, почему в итоге банк видеопамяти приходится делить на два раздела: одному из восьми контроллеров памяти просто не с чем соединяться, поскольку этот блок кеша отключён. В итоге последний порт коммутатора (crossbar) подключён сразу к двум контроллерам памяти вместо одного, что и порождает сегментацию. Более того, последний блок памяти работает всего лишь на 1/7 скорости основного раздела ёмкостью 3,5 Гбайт, что вкупе с усечённым кешем и необходимостью синхронизации двух разделов видеопамяти и вызывает проблемы, освещённые в нашей предыдущей заметке. В итоге проблем с доступом ко всем 4 Гбайт видеопамяти у GeForce GTX 970 нет; здесь неприятен сам факт того, что о наличии на борту GeForce GTX 970 всего 56 RBE было публично сообщено лишь сейчас, а не в момент анонса продукта. NVIDIA говорит, что это произошло вследствие недоразумения и недопонимания между инженерным и маркетинговым отделами. Но ситуация такова, что в ней легко оправдаться задним числом, в результате чего практически невозможно доказать, совпадает ли официальная версия с реальным положением дел. 

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме
window-new
Soft
Hard
Тренды 🔥