Материнские платы

AMD 760MP и Athlon MP - двухпроцессорный рай

⇣ Содержание
Оригинал: Anandtech
Перевод: Дмитрий Чеканов
Комментарии: Алексей Шашков

Как это ни удивительно, но процессоры AMD почти всегда поддерживали многопроцессорность (MP). Фактически, даже AMD K6 мог использовать такой режим, однако для практической реализации на рынке не хватало соответствующего чипсета.

Lehmen comments: Вообще-то это не совсем так, если придираться. На самом деле на К6, и даже на К5 можно собрать многпроцессорную систему. Только это будет система с избыточной мультипроцессорностью. То есть второй процессор осуществляет FRC (Function Redundancy Checking) проверку исполняемого первым процессором кода, что требуется в системах высокой степени надежности Конечно, это ничего общего не имеет с SMP, про которое пойдёт речь в данной статье, и что обычно подразумевается под понятием мультипроцессорности на РС, но всё-таки.

В 1999 году был выпущен первый Athlon. Он прекрасно подошел бы и для MP систем, тем более что в некоторых задачах этот процессор в однопроцессорной конфигурации обеспечивал даже большую производительность, чем двухпроцессорные системы на Pentium III. Но, к сожалению, у AMD хватало проблем в продвижении Athlon на рынок обычных (desktop) компьютеров, не говоря уже о MP платформе для серверов и рабочих станций.

Так как Athlon снискал огромную популярность на рынке производительных компьютеров, то обеспечение процессора соответствующей high-end платформой и рывок на подлинный рынок серверов и рабочих станций являлся лишь вопросом времени. Однако для гарантии успеха этого рывка AMD не могла зависеть от чипсетов сторонних компаний типа ALi или VIA, так как ни одна из упомянутых компаний не планировала экспансию на эти рынки в ближайшее время. Поэтому AMD пришлось самой заниматься дизайном и выпуском чипсета для рынков серверов и рабочих станций. Так появился чипсет 760MP.

Lehmen comments: Если смотреть строго, то далеко не все чипсеты с поддержкой мультипроцессорности для процессоров Intel могут считаться серверными. Тот же легендарный BX или более современные Via Appolo 133A и i815 назвать таковыми никак нельзя. Основная, на мой взгляд, причина, почему сторонние компании, вроде Via или SiS не стали выпускать многопроцессорные чипсеты под Athlon кроется несколько в другом. Многопроцессорная система на EV6 гораздо сложнее в разработке, чем традиционные системы на GTL+. Кроме этого, до недавнего времени считалось что реализация SMP на EV6 очень дорога, что подтверждалось многопроцессорными системами на Alpha, где использовалась эта шина. Вот, видимо, VIA и SiS решили не заморачиваться, мол им и так неплохо живётся :-)

В отличие от чипсета 760 для обычных компьютеров, AMD будет выпускать 760MP по мере спроса. По соображениям надежности, AMD в ближайшее время не планирует заменять 760MP каким-либо сторонним решением. Работа над 760MP уже идет около двух лет, и AMD желает выпустить процессор (чипсет?) настолько гладко, насколько это возможно. Хотя AMD и получила козырь среди энтузиастов из-за возросшей в последнее время стабильности, ситуация на рынке серверов и рабочих станций несколько иная. Чипсет 760MP прошел исчерпывающее тестирование, так что можно надеяться: он станет самым стабильным чипсетом под Socket A, когда-либо сделанным.

Со стороны процессора выпуску 760MP соответствует анонс первого серверного процессора Athlon. Только три недели назад AMD анонсировала мобильный Athlon 4 на ядре Palomino. Нынешняя серверная версия хотя и названа по-другому, но базируется на том же самом ядре. Ситуация очень похожа на Intel Xeon: он использует ядро Willamette, но его название отлично от Pentium 4. Имя серверной версии Athlon - Athlon MP, очевидно, что такое название появилось из-за поддержки многопроцессорного режима (MP). C точки зрения архитектуры Athlon MP не имеет никаких отличий от мобильного Athlon 4. Хотя AMD и выделяет новые возможности процессора, типа технологии "Smart MP", но все то же самое есть и в мобильном Athlon 4.

Несмотря на то, что AMD подтвердила поддержку двухпроцессорности только в Athlon MP, слово "только" здесь неуместно. Первая и единственно доступная сейчас материнская плата на базе 760MP была протестирована и на обычных Athlon с ядром Thunderbird. Даже Duron смогут работать в двухпроцессорном режиме без всяких проблем, однако AMD официально поддерживает двухпроцессорный режим только на Athlon MP. Это очень похоже на утверждения Intel о невозможности работы Celeron в режиме MP, тогда как Abit доказала обратное выпуском материнской платы BP6, которая подразумевала использование двух Celeron.

Мы подробно рассмотрим Athlon MP, равно как и чипсет 760MP в этой статье, но перед этим давайте обговорим правила игры на рынке производительных рабочих станций и серверов, а ведь именно туда нацелены Athlon MP и 760 MP.

Lehmen comments: Нацеливать его могут хоть на Марс, а вот для того что бы использовать, он подходит далеко не только для серверов и рабочих станций. Впрочем, про это мы ещё поговорим.

Требования

Скорее всего, наш средний читатель осведомлен, какой тип системы необходим для максимально быстрого выполнения последних игр. Конечно, скажете вы, одним из самых насущных требований является мощная видеокарта с большой пропускной способностью памяти. Также вы скажете, что для построения производительной домашней/офисной компьютерной системы нам потребуется платформа с достаточным количеством памяти и встроенным в процессор кэшем. Но при переходе к мощным рабочим станциям и серверам правила игры существенно меняются.

Какой такой GeForce?

Хотя можно выделить несколько типов производительных рабочих станций и серверов, мы разобьем их на два вида: те, которые работают с 3D графикой, и те, которые с ней не работают. Рабочие станции, на которых будут запускать программы типа 3D Studio MAX и Pro/ENGINEER должны быть оснащены скоростной видеосистемой. Такие станции используют видеокарты ценой в несколько тысяч долларов и действительно требуют те 110 ватт, которые подводятся к разъему AGP Pro110. Обычно здесь устанавливаются видеокарты типа nVidia Quadro DCC или 3DLabs Oxygen GVX420.

Конечно, такая высокопроизводительная графическая система не нужна для компьютеров, отображающих только 2D графику. По этой причине во многих серверах видеокарта устанавливается только для загрузки системы. Администрирование осуществляется удаленно, и такой системе вообще не нужен монитор, конечно, если с ней не произойдет что-нибудь ужасное. На серверном рынке также очень популярны встроенные видеокарты, так как для них не требуется отдельного разъема расширения. Вообще, идеальной является ситуация, когда все устройства интегрированы на материнской плате. Тогда она могла бы поместиться в корпус с очень маленькими размерами. А при существовании большого количества веб-серверов и серверов баз данных уменьшение размера позволило бы свести расценки за размещение сервера к минимуму.

Пропускная способность между северным и южным мостом (больше - лучше)

Обычный продвинутый пользователь редко сталкивается с недостатком пропускной способности шины PCI или соединения между северным и южным мостами. С одним жестким диском, приводом DVD и картой Ethernet ваша система вряд ли использует больше 50 Мбайт/с пропускной способности. Теоретическая пропускная способность 32-битной шины PCI на 33 МГц составляет 133 Мбайт/с. Именно такая шина используется сейчас в большинстве систем.

В современных чипсетах шина PCI является расширением южного моста (или ICH, как его любит называть Intel). В чипсетах типа Apollo Pro266 или Intel 850 связь между южным и северным мостами осуществляется по специальной шине с пропускной способность 266 Мбайт/с, так что даже при интенсивной нагрузке на шину PCI между мостами можно свободно передать еще достаточно много трафика.

Однако в более старых чипсетах шина PCI является расширением северного моста и используется для связи мостов между собой. В принципе, это не является узким местом для большинства обычных компьютеров, так как у них редко возникает недостаток пропускной способности шины PCI. По этой причине новые технологии соединения мостов типа архитектуры концентраторов Intel или V-Link от VIA не принесут ощутимого прироста производительности для большинства наших читателей. Но еще раз повторимся: в мире серверов и рабочих станций правила игры совсем другие.

Сейчас мы поведем свой разговор о файловых серверах и серверах баз данных, которым требуется быстрый доступ к дискам. Обычно вместе с ними используется большой RAID массив, состоящий, по крайней мере, из трех или четырех дисков. Как только вы начинаете использовать конфигурацию RAID с четырьмя или более дисками, суммарная пропускная способность дискового массива начинает зачастую превышать пропускную способность шины PCI. Например, если в массиве RAID 0 используется четыре диска с пропускной способностью 40 Мбайт/с каждый, то пропускная способность массива составляет 160 Мбайт/с. Как вы помните, 32-битная шина PCI может предоставить только 133 Мбайт/с пропускной способности к северному мосту, таким образом, RAID массив будет ограничен этим узким местом, и 160 Мбайт/с вы не получите.

Рынок высокопроизводительных компьютеров обошел это узкое место с помощью 64-битной PCI, которая существует в двух вариантах: на 33 МГц и на 66 МГц. 64-битная 33 МГц шина предоставляет пропускную способность 266 Мбайт/с, в то время как 64-битная 64 МГц шина - 533 Мбайт/с. Такого значения будет вполне достаточно для системы ввода/вывода нагруженного сервера. 64-битная шина будет полезна и при использовании гигабитных карт Ethernet, которые передают данные по сети со скоростью до 100 Мбайт/с. Две такие карты легко "съедят" пропускную способность 64-битной 33 МГц шины, поэтому большинство действительно производительных систем предоставляют несколько 64-битных шин, работающих на частоте 66 МГц. Но обычно, для обратной совместимости, такие шины поддерживают режим работы и на 33 МГц.

Если ваша периферия "съедает" больше 266 Мбайт/с, то передача такого количества данных к процессору и памяти становится проблематичной. В этом случае, даже 266 Мбайт/с соединения между мостами становится недостаточным. Поэтому здесь обычно используются технологии типа интермодульной шины (IMB). Шина IMB от ServerWorks, в частности, может передавать данные между мостами со скоростью до 1 Гбайт/с. Хм, а ведь люди еще возмущаются, почему эта кампания называется ServerWorks?

Память: 1 Гб вам может не хватить

Возьмите вашу стандартную (наверняка разогнанную) систему, заполните до отказа ее банки памяти и начните непрерывный запуск тестов, нагружающих процессор и память. Если ваша система выдержит подобное издевательство, то вы можете гордиться стабильностью своего компьютера. Но, скорее всего, ваша система не сможет вынести такую пиковую нагрузку в течение нескольких месяцев без единого перезапуска. А ведь именно такие проблемы стоят перед отказоустойчивыми серверами.

Lehmen comments: Вообще то действительно отказоустойчивый сервер должен обладать соответствующим железом. Здесь и избыточная мультипроцессорность (про которую я уже говорил выше), несколько блоков питания, избыточная дисковая система, причём всё это богатство должно поддерживать hot-swap, то есть меняться на лету. Более того, для особо ответственных работ ставят несколько таких серверов, которые синхронизируются, и готовы подменить друг друга в любой момент. Но в реальной жизни (особенно в России) гораздо чаще можно встретить обычный РС, собранный на самом обычном железе, под управлением какой-либо версии Linux или FreeBSD. И, тем не менее, up-time (время работы без перезагрузки) в несколько месяцев, или даже лет, для таких систем совсем не редкость. Так что не стоит нас пугать :-)

Сейчас вы вряд ли найдете производительный сервер с менее чем 1 Гб памяти. По этой причине RDRAM плохо пробивается на серверный рынок, так как если заказать несколько гигабайт памяти, цена сервера может вырасти на тысячи долларов по причине более дорогой памяти. Из-за спроса на большие объемы памяти, материнская плата Iwill i860 оснащена 8 разъемами для памяти, что позволяет устанавливать до 4 Гб RDRAM.

В зависимости от нагрузки, добавление памяти может легко увеличить на сотни процентов производительность приложений, работающих с базами данных. Если же мы обратимся к рабочим станциям, то нередко здесь можно встретить системы по моделированию сложных схем, которые оснащены 16 Гб памяти. Не будем забывать, что одной из причин разработки 64-битного процессора Intel Itanium явилась возможность использования в нем микроархитектуры следующего поколения. Весомое преимущество 64-битных процессоров заключается в способности адресации более 4 Гб памяти (что является пределом 32-битных процессоров, 2^32=4 Гб). Соответственно, 64-битные микропроцессоры способны адресовать 17179869184 Гб (Anand’у математику подучить надо :-)) памяти. Если вам такое число кажется слишком большим, вспомните, что когда-то все думали что 640 кб памяти будет достаточно. К тому же, вы, наверное, понимаете, что в серверных системах требуется огромное количество памяти, намного большее чем в обычных компьютерах.

Надежность не следует ставить на задний план после размера памяти. Для рабочих станций и серверов эти два параметра должны находится в разумном соответствии. Поэтому обычным требованием для таких компьютеров является использование ECC памяти (с кодом коррекции ошибок). Во многих случаях при использовании модулей высокой емкости требуется регистровая память. По этой причине рассматриваемая в статье материнская плата Tyan 760MP требует установки регистровых DDR SDRAM модулей.

Lehmen comments: Регистровая, или буферизированая память обладает собственным буфером, или, по другому, регистром. Он призван "изолировать" модуль от контролёра, и тем самым снизить эллектрическую нагрузку на контролёр памяти. Это особенно важно при использовании модулей большой ёмкости и с большим количеством микросхем.

Если вы знаете, что такое регистровый DIMM, то перейдите к следующему абзацу. Регистровые DIMM и обычные модули в вашей персоналке - это совсем не одно и то же. (Мы не принимаем во внимание редкие исключения, но если у вас установлена регистровая память, вы наверняка об этом знаете). В отличие от небуферизованной SDRAM (обычной SDRAM), регистровая SDRAM использует небольшие "регистры", размещенные между интерфейсом модуля и чипами SDRAM на плате модуля. Они часто применяются для уменьшения нагрузки и возможности использования большего количества физических SDRAM устройств на одном модуле DIMM.

Пропускная способность действительно необходима

AMD, Intel и VIA уже анонсировали технологии обеспечения высокой пропускной способности памяти для обычных компьютеров, но их улучшение производительности по сравнению с предыдущими технологиями сейчас не очень заметно. Это связано с тем, что большинство современных приложений не используют пропускную способность на уровне, которого было бы достаточно для демонстрации преимущества новых технологий. Представьте себе четырехполосное шоссе, у которого обычно занято только три полосы. Впрочем, всегда лучше заранее построить дополнительную полосу, чем пускать потом четвертую машину по обочине.
Однако приложения, запускаемые на рабочих станциях и серверах, уже умеют использовать пропускную способность новых технологий памяти. По этой причине даже один процессор Athlon на материнской плате с AMD 760 так хорошо показывает себя в тестах сервера баз данных по сравнению с двухпроцессорной системой на Pentium III.

Чем больше процессоров подключается к работе, тем большая пропускная способность памяти требуется: процессорам приходится конкурировать между собой за доступ к памяти. Собственно, поэтому система на ServerWorks Grand Champion HE с поддержкой четырех процессоров Xeon и оснащена шиной памяти с пропускной способностью 6,4 Гбайт/с (с использованием четырех каналов DDR).

Не менее важна и пропускная способность шины процессора, она определяется скоростью и шириной FSB. Из-за этого Athlon с 266 МГц шиной EV6 так хорошо себя показывает в наших последних серверных тестах.
Учитывая все эти требования, давайте посмотрим, какая архитектура стоит за процессором Athlon MP и чипсетом 760MP.

Lehmen comments: Благородные корни от Alpha явно просматривались ещё в первом Athlon. Сейчас, наконец то, они начали раскрывать свой потенциал в области SMP решений. Так что давайте посмотрим, как проявит себя на PC технология, которую Alpha прошла и отбросила как пройденный этап (сегодня там используется шина под названием EV8, так что догонять бедному PC ещё есть куда).

Следующая страница →
 
⇣ Содержание
Если Вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме
⇣ Комментарии
window-new
Soft
Hard
Тренды 🔥