Сегодня 04 декабря 2024
18+
MWC 2018 2018 Computex IFA 2018
реклама
Процессоры и память

RDF`2001 - что нам Rambus готовит

Введение

Президент Rambus, Девид Мурин (David Mooring), произнес на Форуме разработчиков Rambus свою довольно интересную речь.

Презентация Мурина состояла из двух основных частей. Почти 60 минут было посвящено перспективам соединения чипов, текущему положению дел в этой отрасли, грядущим проблемам, а также будущим рыночным решениям, касающимся компьютеров, связи и потребителей. Во второй части описывалась новая технология передачи сигналов Yellowstone, своеобразный шаг Rambus в гигарцовую эру.

В самом начале Мурин прояснил ситуацию: "При слове Rambus многие люди думают только о RDRAM, как будто RDRAM - это единственная технология, над которой мы работаем. Но мы владеем также и технологией RaSer. RaSer - наше фирменное название элемента последовательно-параллельного преобразования (serializer/deserializer, SerDes), который много где сегодня используется, как связи, так и в компьютерах."

Rambus в компьютерах

Хотя Rambus исторически страдала из-за недостаточного признания достижений компании в мире Pentium, 2 ГГц сигналы Pentium 4 резко изменили ситуацию, на что и указал Мурин: "Если мы сегодня взглянем на компьютерный рынок, учитывая положение RDRAM, мы уже можем явно выделить преимущество RDRAM над SDRAM. Как мы надеемся, вскоре то же самое можно будет и сказать применительно к RDRAM и DDR SDRAM. Тестовые показатели весьма приятны для нас, так как современные приложения уже реально нуждаются высокой пропускной способности и производительности RDRAM. В таблице ниже мы попытались разложить тесты по трем категориям".

Категория теста Тестовая программа Рейтинг (i850/i845) Преимущество RDRAM
Офисные приложения (слабая нагрузка) Biz Winstone 2001
CC Winstone 2001
SysMark 2001
1,13
1,10
1,06
8-13%
IT/корпоративные приложения (высокая нагрузка) Office Bench 2001 (base)
Office Bench 2001 (lev 1)
Office Bench 2001 (lev 2)
1,43
1,36
1,69
36-89%
Игры Quake III HQ
DroneZ
AquaMark
1,61
1,25
1,20
20-61%

Как видим, Rambus старательно избегает результатов сторонних тестов, вспомним какой шум наделал сайт Tom's Hardware при опубликовании печальных данных о производительности i820 с RDRAM. По этой причине нам трудно говорить о достоверности приведенных результатов, мы просто пишем то что видели, а выводы делайте сами. (Кстати, по некоторым данным, Rambus в этой таблице ссылается на данные тестирования Anandtech).

Более интересной нам показалась оценка преимущества Rambus в области передачи больших строк кэша. Как сказал Мурин: "По мере роста строк кэша в современных процессорах Rambus предоставляет самый быстрый путь передачи этих строк. Для примера возьмем Pentium 4. Если у вас есть строка в 64 байта, вы используете параллельно два RIMM, то вы будете получать по 4 байта каждые 1,25 нс. Соответственно 16 раз по 4 байта будут переданы за 20 наносекунд. Если вы проделаете то же самое с PC100 памятью, то там 8 байт передаются за 10 нс, итого получим 80 нс. Итак, с помощью чипсета i850 строки кэша передаются в четыре раза быстрее. Конечно же, вы скажете, что PC133 на 33% лучше PC100. Поэтому это сделает RDRAM примерно в три раза быстрее при передаче строк кэша. А если перейти на DDR266? Хорошо, но и тогда RDRAM будет передавать строки в полтора раза быстрее".

Конечно, суть все же заключается не в том, как быстро передаются строки кэша, а как организован сам кэш.

В приложениях по работе с мультимедиа и графикой, где кэш не играет особой роли, чистая пропускная способность RDRAM дает некоторые преимущества. Но на 2 ГГц и выше на 3 ГГц разрыв будет увеличиваться, другими словами, пропускная способность будет играть все большую роль. Это и есть главная причина столь близкой дружбы Intel и Rambus.

Цена производительности

Rambus отличается высокой ценой. Мурин постарался посмотреть в будущее с оптимизмом: "Цена обычно выставляется сборщиками OEM, производителями модулей или поставщиками модулей и контроллеров. Мы интенсивно работаем с нашими партнерами, и за последний год нам удалось уменьшить цену в два раза".

Фактически же цена памяти будет уменьшаться при улучшении техпроцесса, по мере эволюции чипов.

Уже продано 20 000 терабит RDRAM

По словам Мурина "Если сложить объем проданной на сегодня памяти, то мы получим 20 000 терабит. Это очень большое число. Поэтому кроме эволюции, которая позволяет улучшить функциональность чипов и скорость их работы, существует и еще одно преимущество, условно назовем его "ветер в спину". Интерфейс RDRAM с годами не изменяется, а число транзисторов процессора удваивается по закону Мура каждые полтора года. Поэтому перегрузка интерфейса на 128 Мб не так ощутима, как на 356 Мб или 512 Мб".

Эволюция модулей RIMM

Модули RIMM перешли от 8 и 6 к 4 слоям. Мурин также пожелал отметить точку зрения Rambus на эволюцию материнских плат: "С материнскими платами произошли изменения. Крупнейшие поставщики предлагают 4-слойные платы. Еще одно преимущество прогресса. Когда вы можете купить 4-слойную материнскую плату и установить на нее 4-слойные модули, получается что по цене материалов RDRAM вплотную приблизилась к уровню SDRAM. Фактически, производить RDRAM платы и модули сейчас даже дешевле DDR, так как DDR решения требуют большое количество терминирующих компонентов, разбросанных по материнской плате".

По правде говоря, большее влияние на цену оказывает не конструкция материнской платы, а суммарная цена компонентов. Пока Intel не сделает цену на RDRAM чипсеты долларов на семь меньше, чем на чипсеты для DDR SDRAM, производство плат на DDR SDRAM будет выгоднее.

По поводу цены, Мурин добавил: "Давайте сравним цену на 128 Мб модули. Возьмем любой магазин: 128Мб RIMM - $49, 128Мб PC133 DIMM - $19. Таким образом, разница $30. Но я не знаю другого способа купить дополнительную производительность за такую небольшую цену, как $30. По некоторым тестам, 1,6 ГГц платформа на RDRAM обеспечивает такую же производительность, как 2 ГГц платформа на SDRAM. Стоят ли $30, переплаченные за RIMM, прироста в 400 МГц?".

Тенденция развития процессоров и Rambus

Пропускная способность процессорной шины в конце 1999 - начале 2000 года составляла около 1 Гб/с. Фактически FSB перешла от 800 Мб/с на чуть больше 1 Гб/с. Дальше мы увидели Pentium 4, утроивший или даже учетверивший это значение в 2000 году. В результате, как подчеркнул Мурин, "если за последние несколько лет произошло утроение или учетверение, то по самым скромным подсчетам в ближайшие три года мы будем наблюдает удвоение пропускной способности FSB по сравнению с текущей. На MPF'2001 назывались даже цифры порядка 30 Гбайт/с для интерфейса между процессором и памятью".

"Еще раз взгляните на развитие процессоров с точки зрения закона Мура. Число транзисторов увеличивается, сейчас процессоры содержат 42 млн, значит через 18 месяцев это число теоретически удвоится. Но эти транзисторы будут увеличиваться не только в количестве, но и по частоте. Чипы будут больше, и работать они будут быстрее. Поэтому требования к пропускной способности будут только расти".

"Еще один пример. Если посмотреть на Pentium 4, он оснащен 32-битной внутренней шиной. Но когда процессор выполняет операции Netburst, эти операции связаны и параллельно исполняется три операнда на 2 ГГц. Посчитайте: 65 операций, три за раз, 2 ГГц, и вы получите 96 Гб/с внутренней пропускной способности процессора. В идеальном случае вы должны получить такую же пропускную способности и от памяти, чтобы обеспечить процессор данными. Конечно же, существуют и обходные пути типа кэша L1, L2 и L3, но все эти пути стоят определенных затрат. И они отнюдь не являются исчерпывающими решениями".

Переход к 10 ГГц процессором, одна из горячих тем прошедшего MPF'2001, определенно вдохновляет Rambus - компания планирует память для большой пропускной способности и высокой частоты.

Планы Rambus по модулям RIMM

Сегодня компания продает в основном модули 800 МГц, но опытные образцы 1066 МГц модулей уже производятся, и вскоре ожидается переход на 1200 МГц. Разрядность модулей увеличивается от 16 бит до 32 бит и далее до 64 бит. То же самое уже происходило с обычной DRAM: переход от 16 к 32 и потом к 64 битам. Поэтому мы наблюдаем обычную эволюцию.

Перспективы Nintendo и PlayStation

Учитывая, что в плохой репутации памяти Rambus для ПК виновата высокая цена, странно видеть попытки компании пробиться на рынок потребительских устройств. Rambus пытается закрепиться даже в приставках по приему цифрового ТВ, также как и в игровых приставках N64 и PS2, да и в других устройствах тоже.

Как сказал Мурин: "Пропускная способность памяти Rambus нужна не только в ПК. Несколько лет назад, когда вышла Nintendo 64, она обладала пропускной способностью памяти примерно в 0,5 Гб/с. Полгигабайта на двух RDRAM. Почти через три года была выпущена Playstation 2, которая достигла уже 3 Гб/с на двух RDRAM. За несколько лет произошло шестикратное увеличение пропускной способности. Если мы экстраполируем эту тенденцию на период в пять лет, то вы смело можете поставить 10-кратное увеличение. К 2005 году внутри "домашней" коробки мы увидим пропускную способность 30 Гб/с. Это очень интересное число, так как именно 30 Гб/с уже называлось на MPF'2001 в качестве целевой точки пропускной способности памяти для основных процессоров того времени."

Планы по Yellowstone

На Форуме была проанонсирована технология Yellowstone. Над этой технологией Rambus работает уже примерно два года. В технологии используются два ключевых момента: дифференциальный протокол передачи запросов (DSRL) и восьмикратная скорость передачи данных. Тестовые образцы YellowStone изготавливаются по техпроцессу 0,13 мкм и появятся в массовом использовании в 2004-2005 годах по техпроцессу 0,10 мкм. Как нам кажется, разработчики Sony PlayStation уже положили глаз на использование этой технологии в следующем поколении своих продуктов.

Канал DSRL работает в двух направлениях. Он позволяет использовать технологию YellowStone на стандартных печатных платах со стандартными уровнями импеданса. Добавление терминации на чипе важно не только с точки зрения сигналов, позволяя увеличить их чистоту, но и с точки зрения цены. Как уже говорилось, на материнских платах DDR терминирующие резисторы разбросаны по плате, что увеличивает как цену, так и занимаемое полезное пространство. Поэтому гораздо дешевле встраивать терминацию в чип, получая преимущество и от чистоты сигналов.

Еще одно явное преимущество YellowStone заключается в очень низкой амплитуде сигналов, всего 200 мВ. Для сравнения, DDR SSTL перешла от 3,3 В TTL до 2,5 В. С DRSL же мы получаем 200 мВ, и в каждую наносекунду передается несколько бит.

Мурин заявил: "Если вы посмотрите на реальный сигнал LVTTL или SSTL, то вы заметите его большую "квадратность", равно как и большое количество ошибок, связанных с пониженной или повышенной амплитудой. Если же увеличить масштаб сигналов RSL до LVTTL, вы заметите большую чистоту сигналов, даже при их меньшей амплитуде и меньшем периоде".

"Итак, 200 мВ позволяют предавать несколько бит за наносекунду, причем с хорошей чистотой".

Восьмикратная скорость передачи

Первое, на что следует обратить внимание при восьмикратной скорости - увеличение внутренней тактовой частоты до 1,6 ГГц на устройстве YellowStone. А так как данные передаются на обоих краях 1,6 ГГц сигнала, мы получаем восьмикратную скорость передачи (3,2 ГГц).

Технология удвоенной скорости DDR впервые появилась в 1992 году, когда RDRAM работала на 256 МГц и данные передавались на обоих краях сигнала, что позволяло достичь 500 МГц. Далее пришла учетверенная скорость передачи с различными способами применения; Rambus использовала модель сигнала, когда за такт передавалось четыре бита благодаря различным уровням кодирования. Сейчас восьмикратная скорость передачи при системной частоте 400 МГц означает 1,6 ГГц внутреннюю скорость и передачу на двух концах сигнала, соответственно 8 бит за такт.

Мурин приоткрыл завесу над внутренними тестами Rambus: "Сейчас перейдем к результатам нашего тестового образца. Осциллограф показывает дискретность сигнала. Внизу находится гистограмма, обратите внимание на маленький пик, на него указывает синяя стрелка. Как вы можете прочитать, его дрожание (jitter) составляет 31 пикосекунду. Феноменально малое число. Rambus сегодня лучшая в мире компания по величине дрожания импульса, и в сегодняшней 800 МГц RDRAM дрожание в несколько раз больше показанного".

Выводы

Как видим, Rambus планирует доминировать не только в области памяти для много-ГГц процессоров, но и в области маршрутизаторов, игровых консолей и ТВ приставок.

Парадокс заключается в том, что чем выше тактовая частота микросхемы, тем более Rambus может снизить общую цену системы. Такая тенденция связана с переходом от параллельной передачи к последовательной, что мы повсеместно наблюдаем. На ПК мы переходим от PCI или AGP к 3GIO, контакты нынче очень дороги, и не по причине медных штырьков, а из-за высокой стоимости прокладки соединительных дорожек.

Каждый контакт YellowStone может передавать более 30 Мбайт/с; если вы взглянете на PCI и представите себе огромное число контактов, то цифра суммарной пропускной способности PCI в 33 Мбайт/с кажется шокирующее малой. Поэтому мы будем экономить на числе контактов и дорожек. Если вы можете сделать то же самое, что и шина PCI, с помощью одного контакта и дорожки, то такой вариант будет существенно дешевле. Так что тенденция перехода от параллельной передачи к последовательной повсеместна, и то же самое мы наблюдаем с памятью Rambus.

Возможно, следует поругать Rambus, так как Intel больше не возлагает на компанию свои надежды. Инженеры Intel пока что находятся в поисках технологии, которая могла бы обеспечить безопасную гавань для будущих P4 и много-ГГц процессоров.

Конечно же, вам может не понравиться модель бизнеса Rambus, но не будет ли жалко, если все закончится только следующей версией игровой приставки Sony PS2, когда в 2005 мы увидим PS3 с пропускной способностью 30 Гб/с?

Rambus пытается достичь "дешевого" рынка. Компания испытывает конкуренцию, и она не сможет доминировать с высокими ценами. Отдадим Rambus должное. В ней все же разрабатываются хорошие технологии, и с ними стоит знакомиться, пусть даже для истории.

Ссылки

 
 
Если Вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Вечерний 3DNews
Каждый будний вечер мы рассылаем сводку новостей без белиберды и рекламы. Две минуты на чтение — и вы в курсе главных событий.

window-new
Soft
Hard
Тренды 🔥
GSC Game World объяснила, почему ещё один перенос S.T.A.L.K.E.R. 2: Heart of Chornobyl был невозможен 12 мин.
Kingdom Come: Deliverance 2 ушла на золото и не выйдет 11 февраля 2025 года — игру выпустят раньше запланированного 2 ч.
OpenAI пообещала 12 дней подряд представлять ИИ-новинки — от духа Рождества до рассуждающего ИИ 3 ч.
Гладиаторы далёкого будущего на мультиарене: Astrum Entertainment анонсировала футуристический шутер Ncore на Unreal Engine 5 3 ч.
Firaxis показала и рассказала, как Sid Meier’s Civilization VII будет играться на консолях 4 ч.
С Microsoft в Великобритании требуют £1 млрд за завышение расценок для клиентов облачных конкурентов 4 ч.
The Witcher 3: Wild Hunt ворвалась в мир Naraka: Bladepoint — трейлер к старту кроссовера 5 ч.
Вышло обновление Telegram — партнёрские программы, ИИ-поиск стикеров и коллажи 6 ч.
Google запустила ИИ-генератор видео Veo, но вы вряд ли сможете его опробовать 6 ч.
Xiaomi хочет обновлять Android ежемесячно со следующего года, но не готова это пообещать 6 ч.
ЕС попытается спасти свой крупнейший проект по выпуску батарей для электромобилей, но уже может быть поздно 2 ч.
Робот Toyota установил рекорд по броскам мяча в баскетбольное кольцо, но до человека ему ещё далеко 4 ч.
Apple выпустит «iPad на ножке» или «HomePod с экраном» позже, чем ожидалось 5 ч.
ИИ обойдётся без Nvidia: Amazon выпустила системы на чипах Trainium2, а через год выйдут Trainium3 5 ч.
MaxSun представила белую видеокарту Arc B580 iCraft и чёрную Arc B580 Milestone 5 ч.
AWS построит распределённый ИИ-суперкомпьютер Project Rainier с десятками тысяч ИИ-ускорителей Trainium2 6 ч.
Marvell перенесёт разработку чипов в облако AWS, а AWS получит от Marvell новые чипы для своих ЦОД 8 ч.
Разборка видеокарты Intel Arc B580 Limited Edition показала асимметричный GPU и замедленную память Samsung 8 ч.
Meta готова инвестировать в атомную энергетику для питания своих ЦОД в США 9 ч.
«Первый в мире» настольный мини-компьютер на Qualcomm Snapdragon X Elite уже не за горами 9 ч.