Сегодня 22 декабря 2024
18+
MWC 2018 2018 Computex IFA 2018
реклама
Материнские платы

AMD 760MP и Athlon MP - двухпроцессорный рай

⇣ Содержание
Оригинал: Anandtech
Перевод: Дмитрий Чеканов
Комментарии: Алексей Шашков

Как это ни удивительно, но процессоры AMD почти всегда поддерживали многопроцессорность (MP). Фактически, даже AMD K6 мог использовать такой режим, однако для практической реализации на рынке не хватало соответствующего чипсета.

Lehmen comments: Вообще-то это не совсем так, если придираться. На самом деле на К6, и даже на К5 можно собрать многпроцессорную систему. Только это будет система с избыточной мультипроцессорностью. То есть второй процессор осуществляет FRC (Function Redundancy Checking) проверку исполняемого первым процессором кода, что требуется в системах высокой степени надежности Конечно, это ничего общего не имеет с SMP, про которое пойдёт речь в данной статье, и что обычно подразумевается под понятием мультипроцессорности на РС, но всё-таки.

В 1999 году был выпущен первый Athlon. Он прекрасно подошел бы и для MP систем, тем более что в некоторых задачах этот процессор в однопроцессорной конфигурации обеспечивал даже большую производительность, чем двухпроцессорные системы на Pentium III. Но, к сожалению, у AMD хватало проблем в продвижении Athlon на рынок обычных (desktop) компьютеров, не говоря уже о MP платформе для серверов и рабочих станций.

Так как Athlon снискал огромную популярность на рынке производительных компьютеров, то обеспечение процессора соответствующей high-end платформой и рывок на подлинный рынок серверов и рабочих станций являлся лишь вопросом времени. Однако для гарантии успеха этого рывка AMD не могла зависеть от чипсетов сторонних компаний типа ALi или VIA, так как ни одна из упомянутых компаний не планировала экспансию на эти рынки в ближайшее время. Поэтому AMD пришлось самой заниматься дизайном и выпуском чипсета для рынков серверов и рабочих станций. Так появился чипсет 760MP.

Lehmen comments: Если смотреть строго, то далеко не все чипсеты с поддержкой мультипроцессорности для процессоров Intel могут считаться серверными. Тот же легендарный BX или более современные Via Appolo 133A и i815 назвать таковыми никак нельзя. Основная, на мой взгляд, причина, почему сторонние компании, вроде Via или SiS не стали выпускать многопроцессорные чипсеты под Athlon кроется несколько в другом. Многопроцессорная система на EV6 гораздо сложнее в разработке, чем традиционные системы на GTL+. Кроме этого, до недавнего времени считалось что реализация SMP на EV6 очень дорога, что подтверждалось многопроцессорными системами на Alpha, где использовалась эта шина. Вот, видимо, VIA и SiS решили не заморачиваться, мол им и так неплохо живётся :-)

В отличие от чипсета 760 для обычных компьютеров, AMD будет выпускать 760MP по мере спроса. По соображениям надежности, AMD в ближайшее время не планирует заменять 760MP каким-либо сторонним решением. Работа над 760MP уже идет около двух лет, и AMD желает выпустить процессор (чипсет?) настолько гладко, насколько это возможно. Хотя AMD и получила козырь среди энтузиастов из-за возросшей в последнее время стабильности, ситуация на рынке серверов и рабочих станций несколько иная. Чипсет 760MP прошел исчерпывающее тестирование, так что можно надеяться: он станет самым стабильным чипсетом под Socket A, когда-либо сделанным.

Со стороны процессора выпуску 760MP соответствует анонс первого серверного процессора Athlon. Только три недели назад AMD анонсировала мобильный Athlon 4 на ядре Palomino. Нынешняя серверная версия хотя и названа по-другому, но базируется на том же самом ядре. Ситуация очень похожа на Intel Xeon: он использует ядро Willamette, но его название отлично от Pentium 4. Имя серверной версии Athlon - Athlon MP, очевидно, что такое название появилось из-за поддержки многопроцессорного режима (MP). C точки зрения архитектуры Athlon MP не имеет никаких отличий от мобильного Athlon 4. Хотя AMD и выделяет новые возможности процессора, типа технологии "Smart MP", но все то же самое есть и в мобильном Athlon 4.

Несмотря на то, что AMD подтвердила поддержку двухпроцессорности только в Athlon MP, слово "только" здесь неуместно. Первая и единственно доступная сейчас материнская плата на базе 760MP была протестирована и на обычных Athlon с ядром Thunderbird. Даже Duron смогут работать в двухпроцессорном режиме без всяких проблем, однако AMD официально поддерживает двухпроцессорный режим только на Athlon MP. Это очень похоже на утверждения Intel о невозможности работы Celeron в режиме MP, тогда как Abit доказала обратное выпуском материнской платы BP6, которая подразумевала использование двух Celeron.

Мы подробно рассмотрим Athlon MP, равно как и чипсет 760MP в этой статье, но перед этим давайте обговорим правила игры на рынке производительных рабочих станций и серверов, а ведь именно туда нацелены Athlon MP и 760 MP.

Lehmen comments: Нацеливать его могут хоть на Марс, а вот для того что бы использовать, он подходит далеко не только для серверов и рабочих станций. Впрочем, про это мы ещё поговорим.

Требования

Скорее всего, наш средний читатель осведомлен, какой тип системы необходим для максимально быстрого выполнения последних игр. Конечно, скажете вы, одним из самых насущных требований является мощная видеокарта с большой пропускной способностью памяти. Также вы скажете, что для построения производительной домашней/офисной компьютерной системы нам потребуется платформа с достаточным количеством памяти и встроенным в процессор кэшем. Но при переходе к мощным рабочим станциям и серверам правила игры существенно меняются.

Какой такой GeForce?

Хотя можно выделить несколько типов производительных рабочих станций и серверов, мы разобьем их на два вида: те, которые работают с 3D графикой, и те, которые с ней не работают. Рабочие станции, на которых будут запускать программы типа 3D Studio MAX и Pro/ENGINEER должны быть оснащены скоростной видеосистемой. Такие станции используют видеокарты ценой в несколько тысяч долларов и действительно требуют те 110 ватт, которые подводятся к разъему AGP Pro110. Обычно здесь устанавливаются видеокарты типа nVidia Quadro DCC или 3DLabs Oxygen GVX420.

Конечно, такая высокопроизводительная графическая система не нужна для компьютеров, отображающих только 2D графику. По этой причине во многих серверах видеокарта устанавливается только для загрузки системы. Администрирование осуществляется удаленно, и такой системе вообще не нужен монитор, конечно, если с ней не произойдет что-нибудь ужасное. На серверном рынке также очень популярны встроенные видеокарты, так как для них не требуется отдельного разъема расширения. Вообще, идеальной является ситуация, когда все устройства интегрированы на материнской плате. Тогда она могла бы поместиться в корпус с очень маленькими размерами. А при существовании большого количества веб-серверов и серверов баз данных уменьшение размера позволило бы свести расценки за размещение сервера к минимуму.

Пропускная способность между северным и южным мостом (больше - лучше)

Обычный продвинутый пользователь редко сталкивается с недостатком пропускной способности шины PCI или соединения между северным и южным мостами. С одним жестким диском, приводом DVD и картой Ethernet ваша система вряд ли использует больше 50 Мбайт/с пропускной способности. Теоретическая пропускная способность 32-битной шины PCI на 33 МГц составляет 133 Мбайт/с. Именно такая шина используется сейчас в большинстве систем.

В современных чипсетах шина PCI является расширением южного моста (или ICH, как его любит называть Intel). В чипсетах типа Apollo Pro266 или Intel 850 связь между южным и северным мостами осуществляется по специальной шине с пропускной способность 266 Мбайт/с, так что даже при интенсивной нагрузке на шину PCI между мостами можно свободно передать еще достаточно много трафика.

Однако в более старых чипсетах шина PCI является расширением северного моста и используется для связи мостов между собой. В принципе, это не является узким местом для большинства обычных компьютеров, так как у них редко возникает недостаток пропускной способности шины PCI. По этой причине новые технологии соединения мостов типа архитектуры концентраторов Intel или V-Link от VIA не принесут ощутимого прироста производительности для большинства наших читателей. Но еще раз повторимся: в мире серверов и рабочих станций правила игры совсем другие.

Сейчас мы поведем свой разговор о файловых серверах и серверах баз данных, которым требуется быстрый доступ к дискам. Обычно вместе с ними используется большой RAID массив, состоящий, по крайней мере, из трех или четырех дисков. Как только вы начинаете использовать конфигурацию RAID с четырьмя или более дисками, суммарная пропускная способность дискового массива начинает зачастую превышать пропускную способность шины PCI. Например, если в массиве RAID 0 используется четыре диска с пропускной способностью 40 Мбайт/с каждый, то пропускная способность массива составляет 160 Мбайт/с. Как вы помните, 32-битная шина PCI может предоставить только 133 Мбайт/с пропускной способности к северному мосту, таким образом, RAID массив будет ограничен этим узким местом, и 160 Мбайт/с вы не получите.

Рынок высокопроизводительных компьютеров обошел это узкое место с помощью 64-битной PCI, которая существует в двух вариантах: на 33 МГц и на 66 МГц. 64-битная 33 МГц шина предоставляет пропускную способность 266 Мбайт/с, в то время как 64-битная 64 МГц шина - 533 Мбайт/с. Такого значения будет вполне достаточно для системы ввода/вывода нагруженного сервера. 64-битная шина будет полезна и при использовании гигабитных карт Ethernet, которые передают данные по сети со скоростью до 100 Мбайт/с. Две такие карты легко "съедят" пропускную способность 64-битной 33 МГц шины, поэтому большинство действительно производительных систем предоставляют несколько 64-битных шин, работающих на частоте 66 МГц. Но обычно, для обратной совместимости, такие шины поддерживают режим работы и на 33 МГц.

Если ваша периферия "съедает" больше 266 Мбайт/с, то передача такого количества данных к процессору и памяти становится проблематичной. В этом случае, даже 266 Мбайт/с соединения между мостами становится недостаточным. Поэтому здесь обычно используются технологии типа интермодульной шины (IMB). Шина IMB от ServerWorks, в частности, может передавать данные между мостами со скоростью до 1 Гбайт/с. Хм, а ведь люди еще возмущаются, почему эта кампания называется ServerWorks?

Память: 1 Гб вам может не хватить

Возьмите вашу стандартную (наверняка разогнанную) систему, заполните до отказа ее банки памяти и начните непрерывный запуск тестов, нагружающих процессор и память. Если ваша система выдержит подобное издевательство, то вы можете гордиться стабильностью своего компьютера. Но, скорее всего, ваша система не сможет вынести такую пиковую нагрузку в течение нескольких месяцев без единого перезапуска. А ведь именно такие проблемы стоят перед отказоустойчивыми серверами.

Lehmen comments: Вообще то действительно отказоустойчивый сервер должен обладать соответствующим железом. Здесь и избыточная мультипроцессорность (про которую я уже говорил выше), несколько блоков питания, избыточная дисковая система, причём всё это богатство должно поддерживать hot-swap, то есть меняться на лету. Более того, для особо ответственных работ ставят несколько таких серверов, которые синхронизируются, и готовы подменить друг друга в любой момент. Но в реальной жизни (особенно в России) гораздо чаще можно встретить обычный РС, собранный на самом обычном железе, под управлением какой-либо версии Linux или FreeBSD. И, тем не менее, up-time (время работы без перезагрузки) в несколько месяцев, или даже лет, для таких систем совсем не редкость. Так что не стоит нас пугать :-)

Сейчас вы вряд ли найдете производительный сервер с менее чем 1 Гб памяти. По этой причине RDRAM плохо пробивается на серверный рынок, так как если заказать несколько гигабайт памяти, цена сервера может вырасти на тысячи долларов по причине более дорогой памяти. Из-за спроса на большие объемы памяти, материнская плата Iwill i860 оснащена 8 разъемами для памяти, что позволяет устанавливать до 4 Гб RDRAM.

В зависимости от нагрузки, добавление памяти может легко увеличить на сотни процентов производительность приложений, работающих с базами данных. Если же мы обратимся к рабочим станциям, то нередко здесь можно встретить системы по моделированию сложных схем, которые оснащены 16 Гб памяти. Не будем забывать, что одной из причин разработки 64-битного процессора Intel Itanium явилась возможность использования в нем микроархитектуры следующего поколения. Весомое преимущество 64-битных процессоров заключается в способности адресации более 4 Гб памяти (что является пределом 32-битных процессоров, 2^32=4 Гб). Соответственно, 64-битные микропроцессоры способны адресовать 17179869184 Гб (Anand’у математику подучить надо :-)) памяти. Если вам такое число кажется слишком большим, вспомните, что когда-то все думали что 640 кб памяти будет достаточно. К тому же, вы, наверное, понимаете, что в серверных системах требуется огромное количество памяти, намного большее чем в обычных компьютерах.

Надежность не следует ставить на задний план после размера памяти. Для рабочих станций и серверов эти два параметра должны находится в разумном соответствии. Поэтому обычным требованием для таких компьютеров является использование ECC памяти (с кодом коррекции ошибок). Во многих случаях при использовании модулей высокой емкости требуется регистровая память. По этой причине рассматриваемая в статье материнская плата Tyan 760MP требует установки регистровых DDR SDRAM модулей.

Lehmen comments: Регистровая, или буферизированая память обладает собственным буфером, или, по другому, регистром. Он призван "изолировать" модуль от контролёра, и тем самым снизить эллектрическую нагрузку на контролёр памяти. Это особенно важно при использовании модулей большой ёмкости и с большим количеством микросхем.

Если вы знаете, что такое регистровый DIMM, то перейдите к следующему абзацу. Регистровые DIMM и обычные модули в вашей персоналке - это совсем не одно и то же. (Мы не принимаем во внимание редкие исключения, но если у вас установлена регистровая память, вы наверняка об этом знаете). В отличие от небуферизованной SDRAM (обычной SDRAM), регистровая SDRAM использует небольшие "регистры", размещенные между интерфейсом модуля и чипами SDRAM на плате модуля. Они часто применяются для уменьшения нагрузки и возможности использования большего количества физических SDRAM устройств на одном модуле DIMM.

Пропускная способность действительно необходима

AMD, Intel и VIA уже анонсировали технологии обеспечения высокой пропускной способности памяти для обычных компьютеров, но их улучшение производительности по сравнению с предыдущими технологиями сейчас не очень заметно. Это связано с тем, что большинство современных приложений не используют пропускную способность на уровне, которого было бы достаточно для демонстрации преимущества новых технологий. Представьте себе четырехполосное шоссе, у которого обычно занято только три полосы. Впрочем, всегда лучше заранее построить дополнительную полосу, чем пускать потом четвертую машину по обочине.
Однако приложения, запускаемые на рабочих станциях и серверах, уже умеют использовать пропускную способность новых технологий памяти. По этой причине даже один процессор Athlon на материнской плате с AMD 760 так хорошо показывает себя в тестах сервера баз данных по сравнению с двухпроцессорной системой на Pentium III.

Чем больше процессоров подключается к работе, тем большая пропускная способность памяти требуется: процессорам приходится конкурировать между собой за доступ к памяти. Собственно, поэтому система на ServerWorks Grand Champion HE с поддержкой четырех процессоров Xeon и оснащена шиной памяти с пропускной способностью 6,4 Гбайт/с (с использованием четырех каналов DDR).

Не менее важна и пропускная способность шины процессора, она определяется скоростью и шириной FSB. Из-за этого Athlon с 266 МГц шиной EV6 так хорошо себя показывает в наших последних серверных тестах.
Учитывая все эти требования, давайте посмотрим, какая архитектура стоит за процессором Athlon MP и чипсетом 760MP.

Lehmen comments: Благородные корни от Alpha явно просматривались ещё в первом Athlon. Сейчас, наконец то, они начали раскрывать свой потенциал в области SMP решений. Так что давайте посмотрим, как проявит себя на PC технология, которую Alpha прошла и отбросила как пройденный этап (сегодня там используется шина под названием EV8, так что догонять бедному PC ещё есть куда).

Технология Athlon MP

Как вы, наверное, помните из нашей статьи про Athlon 4, в ядре Palomino появилось несколько улучшений, что позволяет ему иногда демонстрировать заметное преимущество в производительности по сравнению со своим предшественником. Так как Athlon MP использует то же самое ядро Palomino, что и Athlon 4, в нем присутствуют те же самые улучшения. Единственное, что не анонсировано в Athlon MP - это PowerNow!, хотя эта технология поддерживается процессором.

Athlon MP является первым не-мобильным процессором от AMD, использующим полный набор Intel SSE инструкций (Streaming SIMD Extensions). Таким образом, Athlon MP может запускать оптимизированный под 3DNow! или SSE код, впрочем, это совсем не означает, что он будет запускать SSE код так же быстро, как и Pentium III/Pentium 4. AMD называет новые инструкции (3DNow!+SSE) технологией 3DNow! Professional. Кстати, в линейку Hammer, скорее всего, будет включена поддержка SSE2.

Второе преимущество Athlon MP заключается в улучшенном механизме упреждающей выборки данных. Эта возможность позволяет процессору автоматически использовать свободные ресурсы FSB для упреждающей выборки данных. Процессор заранее запрашивает необходимые, по его мнению, данные из памяти, еще до запроса к ним. Таким образом, Athlon MP требует высокоскоростную FSB и шину памяти, но с другой стороны, он лучше чем обычный Athlon может использовать высокую пропускную способность, что обеспечивает ему преимущество в производительности. Как мы уже отмечали в анализе тестов Pentium 4, упреждающая выборка данных хорошо работает с приложениями, которые значительно нагружают пропускную способность, так как такой трафик легче поддается предсказанию. К этим приложениям относятся программы по редактированию видео, или, что более близко к теме данной статьи, программы по созданию 3D графики и серверы баз данных. Упреждающая выборка довольно полезна в случае Athlon MP, так как чипсет обеспечивает высокую пропускную способность FSB, которая лучше задействуется при включении упреждающей выборки. Впрочем, позднее мы более подробно на этом остановимся.

Следующее улучшение в Athlon MP связано с тремя новыми возможностями буфера быстрого преобразования адреса (Translation Look-aside Buffer, TLB). Как следует из технической документации AMD на ядро Palomino, эти возможности сводятся к следующему.

1. В TLB кэша данных L1 было увеличено число строк с 32 до 40.
2. TLB кэша инструкций L2 и TLB кэша данных L2 используют исключающую архитектуру.
3. Строки TLB поддерживают опережающую загрузку (speculative reload).
Как мы уже говорили в статье про Athlon 4, задачей TLB является кэширование преобразованных адресов памяти. Процесс преобразования адресов необходим для доступа процессора в основную память. Кэширование ускоряет процесс обращения к памяти.

Увеличение числа строк в TLB кэша данных L1 повышает вероятность успешного попадания в TLB (вероятность нахождения нужного адреса). Как вы помните, TLB кэша данных L1 у Pentium III содержал даже больше 40 строк.

Исключающая архитектура означает, что записи TLB кэша L1 не дублируются в TLB кэша L2. Таким образом, происходит экономия строк в TLB кэша L2, благодаря которой TLB может кэшировать больше адресов. Минусом исключающей архитектуры является повышение латентности, связанное с отсутствием дублей адресов в TLB кэша L2.

Lehmen comments: В Athlon’ах и Duron’ах это было всегда...

С помощью опережающей загрузки адрес может быть загружен в TLB еще перед тем как инструкция, запросившая адрес, закончит свое выполнение (конечно, если соответствующий адрес уже не содержался в TLB). В старых ядрах Athlon опережающая перезагрузка была невозможна, что приводило к некоторой потере производительности. В соответствии с AMD, улучшение будет заметно, прежде всего, в "high-end приложениях".

Тем самым AMD подтвердила, что улучшения в TLB у Athlon MP будут наиболее важны при выполнении "high-end приложений". Впрочем, ниже в наших тестах мы посмотрим, так это или не так. Тем более мы произвели несколько действительно "high-end" тестов.

Когерентность кэша - это важно

Представьте себе, что в вашем офисе существуют два программиста. Они находятся в соседних комнатах и работают над одним и тем же проектом. Плюс нам дан секретарь, который находится в конце коридора. Естественно, для повышения эффективности работы программисты должны постоянно друг с другом общаться. Предположим, они не могут говорить напрямую друг с другом и пишут записки. Тогда у них есть два пути для передачи записок. Первый заключается в том, что одному из программистов придется зайти в комнату к другому и передать записку. Второй путь предполагает использование посредника, секретаря, для доставки этих записок. Конечно, первый путь является более удобным и эффективным. Как вы уже, наверное, догадались, аналогичный процесс связи происходит и между двумя процессорами.

В примере с нашими программистами, каждый из них должен знать, какие задания выполнил другой программист. Для этого они должны непрерывно между собой общаться. Но, по нашему условию, они не могут говорить. Такая же проблема существует и в общении между процессорами в MP системе. Как один процессор узнает, что содержится в кэше другого?

В большинстве многопроцессорных систем, каждый процессор отслеживает запросы по FSB и возвращает данные, если они находятся в кэше процессора. Для примера, возьмем систему на базе двух процессоров Athlon MP: CPU0 и CPU1. Сначала CPU0 запрашивает блок данных, содержащийся в основной памяти и не содержащийся в кэше CPU0 или CPU1. Блок данных считывается из основной памяти, проходит через северный мост и попадает на запрашивавший процессор CPU0.

После этого CPU0 запрашивает еще один блок данных, который теперь содержится в L2 кэше CPU1. CPU1 всегда отслеживает запросы данных на FSB (такой процесс называется слежкой, snooping). Соответственно, сейчас CPU1 отсылает данные из своего кэша. У CPU0 существует два пути для получения данных: CPU1 записывает блок в основную память и CPU0 потом его считывает, или CPU1 передает данные напрямую на CPU0.

При использовании разделяемой FSB (на рисунке выше) все процессоры системы разделяют одно и то же соединение к северному мосту. Общение между процессорами осуществляется через основную память, что соответствует первому способу из перечисленных выше. При использовании FSB типа "точка-точка" каждый процессор использует свое выделенное соединение к северному мосту, и общение осуществляется через северный мост без привлечения основной памяти.

Конечно, использование FSB типа "точка-точка" или разделяемой FSB зависит от чипсета и не зависит напрямую от процессора. Процессор лишь должен поддерживать устанавливаемый чипсетом протокол. В случае 760MP и Athlon MP используется шина типа "точка-точка". Такой тип шины позволяет уменьшать трафик шины памяти, так как все межпроцессорное общение происходит без участия основной памяти. Для того чтобы вы поняли важность этого момента, учтите, что все многопроцессорные чипсеты для процессоров Intel используют разделяемую FSB. Не исключением является и недавно выпущенный i860 для Intel Xeon. Конечно, многие могут поспорить, что перенаправление всего межпроцессорного трафика через северный мост не особо сильно влияет на производительность. Впрочем, по всей видимости, такая возможность выступает как желательный фактор для повышения производительности, а не как обязательное требование.

Еще одно преимущество EV6 FSB у Athlon MP заключается в том, что она содержит два однонаправленных порта адреса (адрес на вход и адрес на выход) и один двунаправленный порт данных на каждом соединении. Это означает, что Athlon MP может "подглядывать" в поисках требуемых данных одновременно с выполнением запроса. AGTL+ FSB у Pentium 4 использует только один двунаправленный порт адреса и один двунаправленный порт данных. Таким образом, в одно время Pentium 4 может только отсылать или только принимать адрес.

Снова обратимся к нашей системе на Athlon MP. Пусть CPU0 владеет блоком данных в своем кэше, и CPU1 имеет те же самые данные в своем кэше. Далее CPU1 изменяет эти данные у себя, и после этого CPU0 будет пытаться прочитать данные у CPU1. В текущем положении данные в кэше CPU0 не являются актуальными, так как они были изменены после того как CPU0 поместил их в свой кэш. Для решения таких проблем процессоры должны обладать когерентным друг с другом кэшем.

Количество протоколов когерентности можно пересчитать по пальцам, однако существует множество их вариаций. Впрочем, наиболее часто используется протокол записи с аннулированием (write invalidate). Если не вдаваться в детали, то в случае возникновения конфликта когерентности этот протокол указывает, какому кэшу необходимо аннулировать свои данные. Аннулирование происходит по адресное шине, так что двухпортовая адресная шина EV6 снова играет нам на руку, позволяя одновременно с аннулированием запрашивать какие-либо полезные данные.

Существует множество вариаций протокола записи с аннулированием, но чаще всего встречается протокол MESI. Аббревиатура происходит от первых букв четырех состояний, которые может принимать строка кэша (Modified, Exclusive, Shared, Invalid). Ниже приведено описание каждого состояния.

  • Состояние строки "модифицированная" (modified) - данные в этой строке кэша были изменены. Данные в остальных кэшах недостоверны. Копия данных в основной памяти недостоверна.
  • Состояние строки "единственная" (exclusive) - данные содержатся только в этом кэше. Копия данных в основной памяти достоверна.
  • Состояние строки "разделяемая" (shared) - данные верны в этом кэше и в остальных кэшах. Копия данных в основной памяти достоверна.
  • Состояние строки "недостоверная" (invalid) - данные в кэше недостоверны.

  • Протокол MESI используется в большинстве x86 процессоров, включая AMD K6, Intel Pentium III, Pentium 4 и Xeon. Даже процессоры PowerPC реализуют протокол когерентности MESI.

    Однако Athlon MP (включая все предыдущие варианты Athlon и Duron) использует протокол MOESI с пятью состояниями строки. Пятое состояние строки в протоколе MOESI называется "собственная" (owned). Состояние включается, если запрашиваемые данные находятся в кэше процессора, они были изменены и копия в памяти недостоверна.

    Реализация протокола когерентности MOESI более трудоемка и требует включения в процессор большего количества транзисторов. Однако такой протокол прекрасно работает с двумя адресными портами FSB "точка-точка" у Athlon MP и действительно повышает эффективность работы шины.

    Изначально протокол когерентности MOESI предназначался для использования в high-end серверных процессорах типа Sun UltraSPARC II, однако появившийся в 1999 году Athlon, как видите, не остался в стороне.

    Чип Athlon MP

    Athlon MP был анонсирован в двух вариантах: на 1,0 ГГц и на 1,2 ГГц. Оба из них работают на шине 133 МГц DDR (эффективное значение 266 МГц).

    Lehmen comments: Обратите внимание, знаменитые L1 мостики, которые в современных Athlon на ядре Thunderbird и Duron на ядре Spitfire отвечают за разблокирование/блокирование коэффициэнта умножения остались на своём месте. Конечно, пока что выводы делать рано (не имел я в руках такого процессора), но обнадёживает...

    Athlon MP пройдет тот же жизненный путь, что и обычная версия Athlon. В будущем Athlon MP перейдет на ядро Thoroughbred и далее на ядро Barton с SOI. Если вас интересует более подробная информация про Thoroughbred, Barton и SOI, вы можете почитать наш обзор Athlon 4.

    Слухи оказались правдой, и, судя по приведенному выше плану, AMD планирует использовать будущие версии Duron на серверах начального уровня. Так как существующие Duron могут работать с чипсетом 760MP (снова повторим, что официально это не подтверждено), мы уже сейчас можем взглянуть на то, чем будет являться двухпроцессорная система на Duron с ядром Morgan в конце этого года.

    Цена Athlon MP 1,2 ГГц и 1,0 ГГц составляет $265 и $215 в партиях по 1000 штук. То есть разница с обычными процессорами составляет около $90.

    Больше чем просто 760

    Еще год назад AMD уверяла, что мы увидим их первое многопроцессорное решение в третьем/четвертом квартале 2000 года. Решение основывалось на чипсете AMD 770 и процессорах Mustang, оснащенных очень большим кэшем L2. Наверное, AMD следовало бы оставить это название чипсета (770), так как он значительно отличается от 760, впрочем, AMD все же решила назвать его AMD 760MP.

    Прежде всего, видимое отличие 760MP от 760 заключается в размерах чипов. Чипсет 760 состоит из двух частей: северного моста AMD 761 и южного моста AMD 766. Они соединяются между собой 32-битной 33 МГц шиной PCI. Северный мост 761 изготавливается в упаковке BGA (Ball Grid Array, матрица шариковых выводов) с 569 контактами. Такое количество контактов необходимо для связи чипа с различными шинами и компонентами материнской платы. AMD 760MP комплектуется другим северным мостом, AMD 762, который использует приблизительно 1000 контактов. Таким образом, 762 является самым сложным северным мостом, который когда-либо производила AMD.

    Как мы уже говорили, чипсет 760MP использует FSB типа "точка-точка" и каждый процессор подключается к северному мосту по своему соединению.

    К сожалению, это означает, что между северным мостом и процессорами необходимо проложить существенно больше дорожек, а количество контактов северного моста требуется фактически удвоить.
    Впрочем, все преимущества FSB "точка-точка" трудно перечислить. Мы уже упоминали преимущество такой шины при межпроцессорном общении (хотя здесь можно и не получить ощутимого прироста производительности), но куда больший эффект достигается благодаря повышению суммарной пропускной способности FSB.

    На системе 760MP каждый Athlon MP получает пропускную способность 2,1 Гбайт/с до северного моста при приеме/передаче информации. Для примера возьмем двухпроцессорную 760MP систему на двух Athlon MP 1,2 ГГц. Так как каждый Athlon MP использует 133 МГц FSB с удвоенной скоростью (double pumped), то эффективная тактовая частота FSB составляет 266 МГц. Помножьте частоту на 64 бита ширины шины, и вы получите пропускную способность в гигабитах в секунду. Поделите ее на 8 и получите наши 2,1 Гбайт/с. Помните, что такая пропускная способность предоставлена каждому процессору в системе. Второй Athlon MP получает точно такую же пропускную способность до северного моста.

    Хотя один Xeon использует большую пропускную способность FSB чем один Athlon MP (3,2 Гбайт/с против 2,1 Гбайт/с), в двухпроцессорной системе на Intel Xeon пропускная способность FSB разделяется между процессорами, в то время как у Athlon MP каждый процессор получает 2,1 Гбайт/с до северного моста.

    Однако это совсем не означает, что производительность сразу же увеличивается в два раза. Хотя процессоры и используют шину "точка-точка" до северного моста, шина памяти с пропускной способностью 2,1 Гбайт/с продолжает разделяться между ними. Таким образом, 760MP может использовать только одноканальную 64-битную шину памяти DDR, и пропускная способность памяти в 760MP не отличается от 760.

    Впрочем, не вызывает сомнения тот факт, что два соединения EV6 к северному мосту 762 позволяют более эффективно использовать доступную пропускную способность шины памяти. Если мы обратимся к прошлым результатам теста Sandra STREAM, то там Athlon показывает 500 - 800 Мбайт/с доступной пропускной способности памяти, хотя в спецификациях и указано 2,1 Гбайт/с. Если причиной этого является перегрузка FSB, то переход к двухпроцессорной системе на базе 760MP должен улучшить результат, так как здесь суммарная пропускная способность FSB получается в два раза выше.

    Северный мост 762 использует тот же самый контроллер AGP 4X, что и 761 (на чипсете AMD 760). Как мы уже упоминали, 64-битный контроллер памяти DDR также полностью идентичен. Соответственно, шина памяти работает в синхронном режиме с FSB (то есть при 100 МГц FSB шина памяти работает на тех же 100 МГц).

    Lehmen comments: И на примере старого доброго BX мы помним, в чём преимущества синхронных чипсетов.

    Существенным отличием является реализация контроллера PCI в северном мосту 762. Если в 761 использовался 32-битный 33 МГц мост шины PCI, то в 762 помещен уже 32/64-битный 33 МГц мост. Шина PCI соединяет северный мост с южным мостом AMD 766. Южный мост в 760MP используется точно такой же (766) что и в чипсете AMD 760.

    Lehmen comments: В чипсете AMD 760 иногда использовался южный мост от VIA, 686B. В случае с 760MP такого не будет. Причиной этого являются различия в поддержке IOAPIC и реализации механизма ACPI S3.
    Если не вдаваться в подробности, то IOAPIC это механизм, через который компьютер в ACPI режиме работает с IRQ. Читатели, использующие W2k в ACPI режиме могли заметить, что в этом режиме многие PCI устройства используют одинаковый IRQ . В MS-DOS подобная ситуация могла привести к морю проблем, из-за конфликтов различных устройств, в W2k ничего подобного не происходит (конечно, если железо достаточно современное). Несовместимость между северным мостом 760MP и 686В небольшая, и выражается в том, что не очищается буфер северного моста перед тем как процессор получает запрос на прерывание, однако последствия его могут быть самыми печальными (для исполняемой задачи). В принципе, даже северный мост 760 чипсета обладал таким недостатком, но там эта проблема могла быть решена добавлением одного резистора. В многопроцессорной системе это решение уже не работает.
    Вторая несовместимость, это возможная порча данных при входе или выходе в режим ACPI S3 (Suspend to RAM) при использовании регистровых DDR модулей.
    Всё это (особенно первое) делает невозможной полноценную работу такой связки под W2k, поэтому обладателям SMP систем на Athlon придётся удовлетвориться поддержкой только 4 USB портов, и отсутствием AC97 звука.

    По всей видимости, ограничение 64-битной шины PCI в 33 МГц связано с чипсетом 760MP. К счастью, у AMD кое-что есть для исправления этого ограничения.

    Чипсет для массового производства: 760MPX

    Единственным производителем материнских плат на 760MP в ближайшее время будет оставаться Tyan. На сегодняшний день доступна только плата Tyan Thunder K7, и, скорее всего, в ближайшие несколько месяцев ничего другого в продаже не появится. Фактически, ни один из производителей материнских плат не планирует изготавливать платы на чипсете 760MP. Вместо него в материнских платах будет устанавливаться другая версия чипсета, 760MPX.

    Lehmen comments: Следующей многопроцессорной платой для Athlon будет, скорее всего, Tyan Tiger K7. В отличии от Thunder, эта линейка классом пониже, поэтому в ней двухканальный SCSI уступит место IDE RAID, и не будет никаких встроенных видеокарт. Можно надеяться, что это снизит цену материнской платы на 100-150$. Не совсем ясно, правда, будет ли в этой плате использоваться 760MPX, или всё ещё простой 760MP. Впрочем, Tyan никогда не стоил дёшево, поэтому цена этой матери всё равно останется достаточно высокой. Но после её можно ожидать MB "второго дивизиона", а это именно то, что нам нужно. В настоящий момент объявлены следующие платы:
    ASUS. Объявил A7M266-D. Известно про неё немного, только то, что будет двойная мать, с поддержкой PC1600-PC1200 DDR SDRAM.
    ABIT. Объявил WA-2A. Известно про неё немногим больше чем про ASUS, однако уже можно сказать что она будет иметь 2 PCI-64 слота, AGP Pro50 слот, поддерживать до 4 Gb регистровой PC2100 DDR памяти (только, видимо, ABIT больше целит на рынок высокопроизводительных рабочих станций, чем на настольные PC и дешёвые сервера, как было с BP6), и иметь 10/100 сетевой контролёр.
    MSI. Не только объявил K7D Master-LR, но и, по некоторым данным, успел продемонстрировать её прототип на COMDEX. Судя по существующим анонсам, это будет одна из лучших плат на 760MPX. Плата будет обладать всем набором "фирменных" примочек от MSI, таких как Fuzzy Logic, Live BIOS, D-LED и PC-Alert, будет поддержка Live Driver (когда новые драйвера для материнской платы будут скачиваться и устанавливаться через интернет автоматически, с сайта MSI), заявлена поддержка PC2PC (соединение двух компьютеров через USB кабель). Про функции разгона ничего не говориться, но хочется верить что будет. Материнская плата будет обладать AGP Pro слотом, двумя PCI64 слотами, и тремя простыми PCI32 слотами. Будет поддерживаться до 4 Gb РС2100 или РС2100 DDR памяти в четырёх слотах, причём любой, в том числе и не регистровой. На K7D Master-LR будет IDE RAID на Promise 20265/20267, стандартный ATX разъём питания и 10/100 сетевая карта на (внимание, барабанная дробь) Intel 82559. Что это, тонкая форма издевательства, или "само приползло", решайте сами :-) И самое приятное, цену этого чуда обещают ниже 200$.
    Giga-Byte. Объявил GA-7DPXDW. AGP Pro слот, 2 PCI64 слота, три PCI32 слота, четыре слота для PC1600 или PC2100 памяти, сумарным объёмом до 4 Gb (в том числе и небуферизированой), RAID на Promice 20265/20267, и 10/100 сетевая карта на Intel 82559 (что они, сговорились, что ли :-))

    AMD уже показала 760MPX на WinHEC в апреле, однако только немногие обратили на это внимание. Основное отличие между 760MP и 760MPX заключается в использовании последним 66 МГц 64-битной PCI шины с подключением до двух устройств, не считая северного моста. Новый южный мост 768 поддерживает традиционную 32-битную 33 МГц шину PCI.

    AMD 768 соединяется с северным мостом по 32-битной 66 МГц шине PCI, обеспечивая пропускную способность 266 Мбайт/с между двумя мостами. То же самое предлагают архитектуры Intel Hub Architecture и VIA V-Link.

    По остальным рабочим параметрам 760MP и 760MPX друг от друга не отличаются. Так что основным преимуществом 760MPX можно считать поддержку 66 МГц 64-битных PCI карт.
    Будет ли востребован AMD 760MPX? Большинство производителей материнских плат уже анонсировали платформы на базе MPX (Abit и MSI), причем как нам стало известно от MSI, они нацеливаются на рынок <$200. Так как AMD, скорее всего, объявит многопроцессорную поддержку в Duron на базе Morgan, мы увидим очень дешевое решение для MP систем.


    Эталонная плата на AMD 760MPX

    Через 6-8 недель будет доступна эталонная плата на базе AMD 760MPX, а к концу года чипсет уже будет присутствовать в дизайнах других материнских плат. Так что не надейтесь, что платы от других производителей кроме Tyan появятся до середины третьего квартала 2001 года.

    Lehmen comments: Тем не менее, на фотографии явно не Tyan Thunder. Но я сомневаюсь что это именно эталоный дизайн. Во первых, плата на фотографии всё ещё использует дополнительный коннектор питания, которого, как утверждается не будет на уже объявленных материнских платах (или это они отходят от эталонного дизайна?). Кроме этого, два чипа в левом нижнем углу подозрительно напоминают IDE RAID, что вряд ли будет присутствовать на эталонной плате.
    Самая последняя информация. В сети появились фотографии плат, очень похожих на эту, похожих настолько, что это могут фотографии именно этой платы. Ходят они под именами Giga-Byte GA-7DPXDW и ABIT WA-2A (в последнем случае на матери присутствует наклейка ABIT). Скорее всего это фейк, но на основе реальных фактов. То есть, это действительно эталонная плата, и именно по этому дизайну будут делаться платы от ABIT и Giga-Byte. Вместе с ними есть фотографии ещё одной платы, которая выдаётся за MSI K7D Master-LR. А вот тут я склонен верить, во первых потому что по моей информации эту плату уже демонстрировали (о чём я уже писал выше), а во вторых она выглядит именно так, как должна выглядеть эта плата исходя из того, что про неё известно. Более того, утверждается что MSI K7D Master-LR начнёт продаваться совсем скоро! И здесь, как сказал классик, "обмануть меня нетрудно, я сам обманываться рад". Но не будем спешить с выводами.

    На троне пока что Tyan

    Во время запуска первого процессора Athlon в 1999 году, AMD выбрала себе в партнеры несколько производителей материнских плат. В их число были включены компании типа FIC и Gigabyte, и они отвечали за то, что процессор не останется без материнских плат во время своего выхода. Для чипсета 760MP AMD решила выбрать только одного производителя материнских плат. Конечно, AMD остановилась на компании, которая всегда гордилась своими серверными материнскими платами: Tyan.

    По существу, Tyan получила эксклюзивные права на выпуск AMD 760MP. Это означает, что мы не увидим платы от других производителей, по крайней мере, до конца года. Для такого решения существовало несколько причин. Но самая главная причина заключалась в следующем: серверную материнскую плату должна изготавливать набившая в этом деле руку компания. Сейчас вы уже представляете себе все требования серверных платформ, и наверняка поверите в соответствующий большой опыт Tyan.

    Факт существования единственного производителя материнских плат на 760MP, на самом деле, не так уж и плох. Тем более, как нам кажется, Tyan Thunder K7 содержит самый богатый набор функций из всех плат, виденных нами за последние четыре года.
    Thunder K7 основывается на эталонном дизайне 760MP, который AMD называет Guinness. Характеристики платы:

    - 2 - Socket-A разъема (100 МГц/133 МГц DDR FSB)

    - 4 - разъема DDR SDRAM DIMM под углом 45 градусов
    - 5 - 64-битных 33 МГц разъема PCI (обратно совместимы с 32-битными 33 МГц устройствами)
    - 1 - AGP Pro110 разъем, обеспечивающий мощность до 110 Вт
    - 1 - интегрированный на плату графический чип ATi RageXL
    - 1 - Adaptec 7899W двухканальный контроллер Ultra160 SCSI
    - 2 - интегрированных на плату контроллера Ethernet 10/100 от 3Com

    Плата выделяется несколькими интересными особенностями. Во-первых, разъемы для памяти размещены под углом 45 градусов, что позволяет использовать Thunder K7 в серверных корпусах 1U (примерно 2'' высотой). Такая возможность иногда бывает весьма полезна, так как стоимость пространства в серверной стойке довольно высока. Разработка двухпроцессорного сервера 1U с Athlon MP на Thunder K7 требует использования специального охлаждения и питания, так как в таком корпусе нет достаточного для обычных радиаторов места. Впрочем, "сложно" отнюдь не означает "невозможно". Поэтому в ближайшее время мы увидим системы в форм-факторе 1U, по крайней мере, от одного производителя.

    Во-вторых, Thunder K7 использует только регистровые DDR SDRAM модули и не работает с обычными DDR SDRAM модулями. К счастью, благодаря очень низким ценам на DDR память от таких компаний, как Crucial, регистровая DDR SDRAM память не сильно дороже обычной.

    Lehmen comments: Как я уже говорил, после выхода материнских плат от других производителей появится возможность использовать любые DDR модули.

    Северный мост в Thunder K7 сильно нагревается, поэтому на нем используется распределитель тепла. Но производители, скорее всего, добавят к нему радиатор и вентилятор для лучшего охлаждения. Этот северный мост, как нам кажется, является самым горячим северным мостом из всех, которые мы когда-либо видели.

    Lehmen comments: Какой красавец! Люди, когда- либо владевшие К6 смахивают скупую слезу :-)

    Благодаря встроенным PCI видео, контроллеру SCSI и двум портам Ethernet 10/100, плата является прекрасным решением для 1U серверов, так как для создания полноценного сервера не требуется установки никаких дополнительных карт. Хотя в такой сервер вряд ли получится установить больше трех или четырех дисков, Thunder K7 может рассматриваться как основа для построения очень мощного 1U веб-сервера.
    Многие OEM-покупатели Tyan интересуются возможностью использования Thunder K7 в действительно high-end 3D рабочих станциях, большинство из которых требует поддержки AGP Pro50 или AGP Pro110. В связи с использованием порта AGP Pro110 (110 Вт), плата Thunder K7 использует уникальное питание.


    Сверху вниз: 24-контактный WTX, 20-контактный
    ATX, 8-контактный вторичный WTX разъемы

    Материнская плата использует два подключения питания: по 24-контактному разъему WTX и по вторичному 8-контактному разъему (стандартное питание ATX использует 20-контактный разъем). Хотя сами разъемы аналогичны спецификации WTX и похожи на разъемы в материнской плате Iwill Dual Xeon, схема расположения выводов у них различна. К сожалению, это означает, что Thunder K7 использует нестандартный блок питания.

    Сейчас нам известно о существовании двух производителей блоков питания для Thunder K7: Delta и NMB Technologies. Delta разработала 450 Вт модель, а NMB - 460 Вт. В наших тестах мы использовали блок питания от NMB.

    Lehmen comments: При желании такое чудо можно попробовать соорудить из двух простых ATX блоков, или даже одного, разводки разъёмов в сети есть. Впрочем, если сумеете достать ТАКУЮ мать, то достанете и соответствующий блок питания. И опять таки, многие следующие MB на 760MPX будут иметь абсолютно стандартное подключение питания. Правда блок питания, как утверждается, нужен будет не менее 400 ватт. Ну, на крайний случай 300. Однако, как вы помните, нечто подобное говорили и про Thunderbird, и про Pentium4. Однако, и то и другое вполне работоспособно на простых 250 ваттных блоках. Так что вопрос сколько мощности действительно необходимо, остаётся открытым.
    Tyan удалось подгадать выпуск Thunder K7 к моменту ее рыночного спроса. То есть новую технологию можно будет купить уже в кратчайшие сроки. Другие производители выпустят свои материнские платы в конце этого года, причем они будут использовать как спецификацию WTX, так и обычное ATX питание. Некоторые материнские платы будут иметь возможность работы с обычными DDR SDRAM модулями, а не с регистровыми. Thunder K7 не имеет возможностей для разгона, так что любителям ускорять свой процессор придется подождать платы от другого производителя, которая сполна будет реализовывать функции изменения множителя, FSB и напряжения.

    Материнская плата от Abit на базе 760MPX будет использовать WTX питание, в то время как плата от MSI будет соответствовать стандарту ATX.

    Цена платы Tyan для дистрибуторов составляет $500, так что конечная цена будет находиться в районе $550-$700.

    Тестирование

    Тестовая система Windows 98SE / 2000
    Аппаратное обеспечение
    Процессор
    Intel Pentium III 933 МГц x 2
    Intel Xeon 1,7 ГГц x 2
    AMD Athlon MP 1,2 ГГц x 2
    AMD Athlon-C "Thunderbird" 1,2 ГГц x 2
    AMD Duron 850 МГц x 2
    Материнская плата
    Iwill DVD266-R
    Iwill DX400-SN
    Tyan Thunder K7
    Память
    1 Гбайт PC2100 Corsair DDR SDRAM
    1 Гбайт PC800 Toshiba RDRAM
    Жесткий диск
    IBM Deskstar 30 Гбайт 75GXP 7200 об/мин Ultra ATA/100
    CDROM
    Phillips 48X
    Видеокарта
    NVIDIA GeForce2 Ultra 64 Мбайт DDR (частота по умолчанию - 250/230 DDR)
    Сетевая карта
    Linksys LNE100TX 100 Мбит/с PCI Ethernet
    Программное обеспечение
    Операционная система
    Windows 2000 Professional SP2
    Windows 2000 Server SP2
    Видеодрайвер
    NVIDIA Detonator3 v6.50 @ 1024 x 768 x 16 @ 75 Гц
    NVIDIA Detonator3 v6.50 @ 1280 x 1024 x 32 (SPECviewperf) @ 75 Гц
    На материнских платах с чипсетом VIA был установлен VIA 4-in-1 4.31V

    Сравнение пропускной способности памяти

    Мы, вообще, не являемся любителями теста SiSoft Sandra, но тест пропускной способности из этого пакета нам кажется полезным. Без сомнения, Xeon располагает самым большим значением пропускной способности памяти, теоретически чипсет i860 с двумя каналами RDRAM обеспечивает значение до 3,2 Гбайт/с. В соответствии с показанными результатами, на самом деле два Xeon зайдействуют 44% теоретического значения. Даже Xeon в одиночной конфигурации не изменяет эту картину. Таким образом, FSB или шина памяти оказываются перегруженными даже одним Xeon на 1,7 ГГц.

    Картина становится намного более интересной в случае сравнения однопроцессорной и двухпроцессорной конфигурации на Athlon MP. Переход на двухпроцессорную конфигурацию дает прирост в 37%. Один процессор Athlon MP использует примерно 33% от своей теоретической пропускной способности памяти в 2,1 Гбайт/с. Переход к двум процессорам дает повышение использования до 45%, что превышает результат Xeon на i860. Подобное увеличение пропускной способности памяти наблюдается и на обычных Athlon или Duron.

    А сейчас давайте взглянем на результаты FP STREAM.

    Почти такие же результаты мы наблюдаем и в тесте FP STREAM из пакета Sandra 2001. Как видно, платформа Xeon теоретически обладает и практически использует наибольшую пропускную способность памяти. Производительность одного и двух Xeon практически не отличается, предоставляя 1400 Мбайт/с пропускной способности.

    И опять же интересная картина наблюдается при сравнении одного и двух процессоров на 760MP. Использование теоретической пропускной способности у Athlon MP поднимается от 36% до 46%. Закономерный вопрос - почему?

    Lehmen comments: закономерный вопрос - почему Anand видит только у AthlonMP, когда на самом деле и у Athlon Thunderbird и у Duron.

    Вспомните, что только на платформе 760MP используется FSB типа "точка-точка". Один Athlon MP в таком случае "съедает" примерно 700-800 Мбайт/с пропускной способности памяти, и добавление второго процессора (так как каждый процессор связывается с северным мостом по своей шине с 2,1 Гбайт/с) означает, что вся система может "съедать" в два раза больше пропускной способности памяти. Конечно, в реальности все не так радужно и мы не видим двукратного увеличения, но тот факт, что использование пропускной способности памяти все же повышается, говорит о том, что у однопроцессорной конфигурации Athlon MP использование пропускной способности памяти ограничивается FSB.

    Если наше предположение верно, то лидерство Pentium 4 (и Xeon) в этом тесте объясняется работой 100 МГц FSB с учетверенной скоростью (эффективное значение - 400 МГц).

    Lehmen comments: Конечно же верно. Все объяснения можно в три слова уместить: потому что EV6. А по Р4: потому что RAMBUS.

    Производительность сервера баз данных

    В обзоре Intel Xeon мы разработали новый тест в нашу коллекцию для high-end процессоров: тест производительности сервера баз данных. Условие теста довольно простое: мы записываем каждую транзакцию на сервере баз данных форумов Anandtech в течение 30 минут. Далее мы по логу повторяем все те же самые транзакции на тестовых платформах в максимально быстром режиме (без ожидания пользовательского ввода данных). Такое тестирование очень напоминает timedemo в Quake III Arena, когда записанное демо проигрывается с максимально возможной скоростью, при этом показывается средняя частота кадров. Вместо частоты кадров в нашем тесте результатом является время обработки всех транзакций.

    Мы не изменяли условий теста с нашего прошлого обзора Intel Xeon, так что более подробное описание вы можете прочитать там.

    Для еще большего уменьшения узких мест, связанных с операциями ввода/вывода, тестовая система была не только оснащена четырьмя дисками Quantum Atlas 10K в массиве RAID 0, но и 1 Гбайт памяти. Кстати, такой массив обеспечивает большую скорость записи, но такую же скорость чтения, что и наш RAID 10 массив на сервере форумов.

    Во время 30-минутной записи произошло: 105267 операций выбора, 4984 операций обновления, 701 операций добавления и 5 операций удаления в базе данных. Если быть точным, то операция выбора означают чтение, обновления - чтение и запись, добавления - запись и удаление - просто удаление (редкое событие).

    Первое, что здесь нужно отметить - тест значительно нагружает базу операциями чтения, таким образом, узкие места, связанные с вводом/выводом не так выступают, как при нагрузке базы операциями записи. Чтение всегда происходит быстрее чем запись, следовательно, наш тест больше зависит от производительности платформы, а не от узких мест операций ввода/вывода.

    Если же ваше приложение больше нагружает базу данных операциями записи, то результат сравнения нескольких процессоров по своей форме не изменится, однако разница между ними уменьшится, так как система ввода/вывода при переходе от одного процессора к другому не меняется.

    Природа базы данных форумов такова, что она задействует совсем немного интенсивных вычислительных операций, в основном используются функции прямого чтения и записи. Таким образом, скорость главным образом зависит от производительности всей платформы, а не от мощности вычислительных блоков процессора.

    В нашем прошлом тесте лидировала двухпроцессорная платформа на Xeon 1,7 ГГц, и нам было интересно узнать, как покажет себя двойной Athlon MP на 760MP.

    Не правда ли, шокирующий результат? Первая попытка AMD выйти на серверный рынок, без сомнения, очень успешна. Мы всего лишь показали производительность системы на реальной задаче. Два Athlon MP 1,2 МГц на 760MP выполнили 30-минутный лог чуть больше чем за 12 минут. Это почти на 20% быстрее, чем Dual Xeon 1,7 ГГц. А ведь там пропускная способность памяти на 50% больше.

    Этот тест наглядно показывает, что пропускная способность памяти не является самым важным показателем в таким системах. Другие факторы, типа пропускной способности FSB и просто вычислительная мощность процессора влияют на производительность нисколько не меньше. Если вы желаете модернизировать свой сервер баз данных, то лучшего выбора чем 760MP и пара Athlon MP у вас нет.

    Не менее любопытно большое отличие в результатах двух Athlon MP и двух обычных Athlon. Обычные Athlon не смогли показать результат лучше, чем у двухпроцессорной конфигурации Xeon. А Athlon MP легко его обогнал. Еще более интересно, что в однопроцессорной конфигурации разница между Athlon и Athlon MP почти незаметна. Если вспомнить улучшения в ядре Athlon MP, то они ориентированы, главным образом, на передачу данных. А при таком количестве обрабатываемых данных (база в 3 Гбайт), лидерство Athlon MP в двухпроцессорной конфигурации не является столь уж удивительным.

    Обратите внимание и на Duron. Если AMD увеличит скорость Duron, то он станет прекрасным решением для дешевых серверов баз данных, тем более что материнские платы 760MPX будут продаваться в ценовом диапазоне до $200. Конечно, главной проблемой использования Duron в MP системе является то, что скорость выполнения системных задач очень зависит от большого размера кэша. Даже 384 кб кэша у Athlon можно рассматривать как пороговое значение. Было бы очень интересно узнать, какова будет производительность пары Athlon с 512 кб или 1 Мб кэша, однако, по всей видимости, мы увидим такое количество только в процессорах Hammer (K8). А пока что придется довольствоваться 384 кб у Athlon MP.

    Если производительность платформы вас еще не убедила, другим решающим фактором остается очень низкая цена регистровой DDR SDRAM по сравнению с требуемой Xeon RDRAM. Вы можете купить 1 Гбайт регистровой DDR SDRAM за $305, в то время как тот же самый объем RDRAM стоит более чем в два раза дороже - $740. А теперь примите во внимание, что большинство серверов баз данных использует 2-4 Гбайт памяти, и посчитайте сэкономленные средства.

    Производительность в программах 3D моделирования

    Итак, система 760MP с Athlon MP взяла хороший старт, заняв лидирующее положение при тестировании сервера баз данных. Как же себя покажет эта система в качестве рабочей станции для 3D моделирования? Нас немножко заклинило в тестировании жизненных приложений, и мы решили взять за основу проблему, с которой столкнулся человек из команды сайта Anandtech.
    Совсем недавно наш редактор начал работу в 3D Studio MAX по созданию нескольких довольно интересных 3D сцен. Больше всего он жаловался на то, что даже в 640x480 процесс рендеринга занимает больше двух часов. И если наш редактор всего лишь развлекался с 3D Studio MAX, некоторые наши читатели наверняка ежедневно работают с этим популярным продуктом Kinetix. Если рендеринг простых космических сцен занимал два часа времени на довольно приличной рабочей станции, то остается только догадываться, сколько же времени понадобится на рендеринг более сложных сцен.

    Таким образом, появился наш следующий тест по рендерингу с помощью 3D Studio MAX. Тестовая сцена состояла из четырех объектов (2 сферы, модифицированная сфера и квадратный патч (patch) с модификатором помех (noise)). На сцену мы добавили общий свет (omni light) и камеру. После этого были применены эффекты lens flare и lens glow в общем свете, а также огонь на сфере Солнца. К астероиду (модифицированная сфера) был добавлен эффект размывания движущегося объекта (motion blur). Ролик занял больше 300 кадров и состоял из движения камеры, вращения планеты, и движения и вращения астероида. Рендеринг производился в режиме Video post, так что были добавлены и эффекты камеры. Сжатие в AVI осуществлялось кодеком Cinepak от Radius с качеством 100. Разрешение ролика - 320x240. Режим монитора - 32-битный цвет 1024x768, в качестве видеокарты везде использовалась GeForce2 Ultra. В настройках было указано использование OpenGL, версия драйверов - 12.01 от nVidia. Версия 3D Studio MAX - 4.02.

    Конечно, производительность здесь зависит не только от процессора, но и от графической подсистемы. К счастью 3D Studio MAX может использовать несколько потоков, так что переход к многопроцессорности отражается на производительности.

    Мы уже знаем, что в Xeon (и в Pentium 4) используется отнюдь не лучший в мире FPU. Для получения хорошей производительности приложения должны быть оптимизированы под SSE2. Однако следует отметить, что двухпроцессорная платформа на Xeon все же показывает достойные результаты в этом тесте. Но опять таки два Athlon MP и даже два Athlon превзошли последнюю итерацию Xeon от Intel.

    Двухпроцессорная система на Athlon MP смогла выполнить рендеринг за 94% времени двойного Athlon 1,2 ГГц, что еще раз подтверждает теорию о некоторых изменениях, реализованных в Athlon MP для лучшего выполнения high-end приложений.

    Duron 850 в двойной конфигурации снова показывает производительность на уровне двойного Pentium III 933. Это открывает дорогу для довольно гибкой модернизации: при дальнейшем падении цен на процессоры вы сможете заменить ваши Duron на Athlon или на Athlon MP. Слабым местом Duron продолжает быть ограничение по FSB (эффективные 200 МГц против эффективных 266 МГц) и маленький кэш (192 кб против 384 кб).

    Производительность в редактировании изображений

    Сегодня мы живем в мире, где трехмерность приобретает все большее значение (по крайней мере, с точки зрения "железной" индустрии). Наблюдается явная тенденция переноса максимально возможного количества технологий в третье измерение. Сначала это было моделирование, потом игры, а сейчас даже сканеры. Но мы не можем не помнить, что для создания графического наполнения и его обработки все еще необходимы двумерные изображения.

    В нашем случае для этого используется Adobe Photoshop, без сомнения самая известная программа по редактированию 2D изображений на сегодняшний день. В 3D Studio MAX наибольшее время занимает процесс рендеринга и анимации, а в Photoshop самой ресурсоемкой задачей является наложение фильтров. В отличие от 3D Studio MAX Photoshop не является многопотоковым приложением, однако некоторые фильтры в нем все же используют многопоточность. С последней версией патча Photoshop 6.0.1 также демонстрирует улучшенную производительность с Pentium 4 и, соответственно, Xeon.

    Для оценки производительности Photoshop мы использовали PSBench, который выполняет последовательно около 20 фильтров (после каждого фильтра происходит откат обратно) над 50 Мб изображением. Производительность измеряется в секундах, и наши системы показали следующие результаты.


    Duron 850
    Два Duron 850
    Athlon 1, 2 ГГц
    Два Athlon 1,2 ГГц
    Athlon MP 1,2 ГГц
    Два Athlon MP 1,2 ГГц
    Два Intel Xeon 1,7 ГГц
    Intel Xeon 1,7 ГГц
    Два Intel Pentium III 933 МГц
    Фильтр/Действие
    Время выполнения в секундах (меньше-лучше)
    Поворот 90
    8.0
    8.7
    7.2
    7.5
    7.8
    8.2
    7.9
    7.8
    6.8
    Поворот 9
    15.2
    13.2
    14.4
    10.3
    11.4
    10.5
    10.9
    13.8
    10.7
    Поворот .9
    16.0
    12.5
    14.4
    10.6
    11.8
    10.8
    11.1
    13.0
    10.3
    Gaussian Blur 1 pixel
    7.4
    6.2
    6.9
    6.0
    6.4
    6.0
    6.3
    6.6
    5.1
    Gaussian Blur 3.7 pixels
    15.9
    12.4
    16.6
    10.5
    12.1
    10.7
    10.5
    11.8
    11.4
    Gaussian Blur 85 pixels
    18.0
    13.7
    18.5
    12.1
    13.4
    11.6
    10.9
    12.6
    12.4
    50%, 1 pixel, 0 level Unsharp Mask
    6.5
    5.4
    5.7
    4.3
    4.3
    4.2
    4.4
    5.3
    4.4
    50%, 3.7 pixel, 0 level Unsharp Mask
    16.4
    12.7
    17.1
    11.7
    13.0
    11.1
    10.7
    12.2
    11.7
    50%, 10 pixel, 5 level Unsharp Mask
    16.5
    12.9
    17.3
    11.8
    13.3
    11.0
    10.9
    12.7
    11.9
    Despeckle
    10.6
    7.3
    10.0
    5.1
    7.1
    5.1
    6.7
    9.5
    7.1
    RGB-CMYK
    29.5
    29.5
    28.2
    21.0
    20.5
    20.2
    26.6
    26.5
    26.7
    Reduce Size 60%
    5.2
    3.7
    5.3
    2.9
    3.7
    2.9
    2.8
    3.3
    3.2
    Lens Flare
    19.7
    13.6
    19.7
    12.2
    15.8
    12.6
    12.6
    16.0
    14.4
    Color Halftone
    28.7
    28.4
    28.8
    20.0
    18.8
    19.2
    30.1
    30.8
    3.3
    NTSC Colors
    11.1
    11.4
    9.8
    7.6
    7.1
    7.3
    8.6
    8.4
    9.4
    Accented Edges Brush Strokes
    34.3
    34.5
    34.0
    24.1
    23.3
    23.6
    25.1
    25.7
    28.3
    Pointillize
    57.4
    34.7
    57.7
    26.7
    41.6
    26.7
    26.2
    42.1
    29.7
    Water Color
    69.2
    70.0
    69.9
    48.7
    45.2
    45.5
    54.1
    54.4
    58.5
    Polar Coordinates
    33.0
    23.8
    35.6
    16.0
    22.7
    15.5
    17.3
    28.1
    Failed
    Radial Blur
    154.7
    88.1
    153.8
    66.8
    109.4
    66.3
    57.5
    101.8
    70.2
    Lighting Effects
    25.1
    17.4
    24.0
    12.7
    8.0
    8.1
    6.4
    7.7
    8.4

    Суммарное время выполнения всех фильтров можно представить следующим графиком.

    Xeon выглядит здесь вполне достойно, но опять же, Athlon MP вырывается вперед и в этом тесте. Даже с оптимизацией под Pentium 4/Xeon Photoshop продолжает быстрее выполняться на 760MP.

    Пока вы не ощутили вкус системы на двойных Duron меньше чем за $100 (по крайней мере, по отношению к процессорам), заметьте, что система на двух Duron 850 выглядит хуже по сравнению с одним Athlon MP 1,2 ГГц. Переход к двум медленным процессором оказывается хуже, чем использование одного, но заметно более быстрого процессора. Помните, что эффект от двухпроцессорности не всегда будет таким, каким мы его хотим увидеть.

    Конечно, не последнюю роль в таком печальном результате играет маленький размер кэша Duron.

    Lehmen comments: Равно как и наоборот. Как можно убедиться в моих статьях (SMP на домашнем компьютере и Тесты SMP систем), прелесть двухпроцессорных систем не только, не столько, и совсем даже НЕ в скорости выполнения одной единственной задачи. Свою истинную силу SMP машины показывают при выполнении нескольких ресурсоёмких задач ОДНОВРЕМЕННО. Таким образом, можно без труда поставить очень быстрый Athlon в такое положение, что он проиграет двум стареньким Селеронам. Например в такой задаче как DVD-Rip. Причем не столько по скорости (хотя FairUse на двухпроцессорной системе работает просто быстрее, несмотря на огромный проигрыш по тактовой частоте), сколько по тому, что на двухпроцессорной машине процесс декодирования практически не мешает заниматься другими делами на компьютере, чего не скажешь про однопроцессорную машину.

    Производительность в задачах для рабочей станции

    Давайте посмотрим на производительность системы в задачах для рабочих станций типа CAD, ПО для редактирования изображений и разработки приложений. Для этого мы будем использовать тест Ziff Davis Media's Dual Processor Inspection, который состоит из трех приложений: MicroStation SE (CAD), Photoshop 4.0 (редактирование изображений) и Visual C++ (разработка приложений).

    Microstation SE является пакетом моделирования/CAD и очень сильно нагружает x87 FPU. В этой области Athlon занимает, бесспорно, лидирующее положение, что мы и видим по результатам. Даже двухпроцессорная система на Duron 850 обгоняет двойной Xeon 1,7. И это при такой разнице в цене в пользу Duron.

    Приложения, использующие стандартный x87 код, будут лучше работать на Pentium III, еще лучше на Athlon и совсем уж прекрасно на двухпроцессорном Athlon MP. Впрочем, вы сами все хорошо видите.

    Тест Photoshop 4.0 - единственный, где двойной Xeon превзошел двойной Athlon MP. Что ж, действительно 12% в пользу Xeon.

    Сам по себе Visual C++ не разбивает процесс компиляции на несколько потоков, поэтому в этом тесте одновременно компилируются две программы. Следовательно, от двухпроцессорной конфигурации здесь должна появиться реальная польза. Athlon MP в этом тесте снова лидирует с 14% отрывом от своего конкурента.

    Пальмовая ветвь теста по общей производительности по праву принадлежит двойному Athlon MP. Вы уже видели тесты, которые привели к такому впечатляющему результату в финале.

    Производительность Linux

    Рынок Linux только выиграет от выпуска двухпроцессорной платформы AMD. Linux является намного более сервер-ориентированной ОС по сравнению с Microsoft Windows, поэтому многие приложения обычно требуют наличия и эффективно используют многопроцессорные системы. В качестве примера можно привести системы на Linux таких разработчиков, как Pogo, Penguin Computing и VA Linux. Эти компании широко известны на рынке веб-серверов. Как нам кажется, Tyan 760MP разработана именно для этого рынка, так как размещенные под углом разъемы DIMM обеспечивают возможность использования платы в 1U серверах. Учитывая характер работы веб-сервера, ориентированный на обслуживание многих пользователей одновременно, использование нескольких процессоров должно прекрасно отразиться на производительности сервера. Впрочем, стойка таких серверов выглядела бы еще лучше.

    Если дополнительный процессор прекрасно себя показывает в серверных задачах, то обычные приложения, как правило, получают крайне небольшой прирост производительности. Например, Xfree86 (низкоуровневая программа-сервер для обеспечения оконного GUI) использует только один поток, как и большинство пользовательских приложений.

    Для тестирования производительности под Linux мы выполняли компиляцию ядра. Компиляция ядра не является "синтетическим" тестом, к тому же здесь можно указывать число задействованных процессов.
    Для компиляции мы использовали такую же версию Linux 2.4.4 как и в нашем предыдущем тестировании Xeon, несмотря на недавно вышедшую 2.4.5. Впрочем, для большей уверенности мы все же повторили тестирование Xeon и в этот раз. Заметьте, что на 10 платформах мы проводили компиляцию с тремя разными параметрами, каждый тест проводился три раза. Таким образом, мы скомпилировали 90 ядер. Ядра компилировались с параметрами по умолчанию - для повторения теста вы можете запустить make menuconfig и выйти, или запустить make config и держать клавишу ввода для назначения всех опций. Сжатия ядер не производилось.

    Выше показан результат в секундах, чем меньше - тем лучше.

    Во-первых, по этим данным мы можем сделать вывод, насколько выигрывает параллельная архитектура. Athlon и Duron используют FSB типа "точка-точка", что приводит к лучшему использованию 266 МГц (или 200 МГц, соответственно) DDR шины. Применяемая в Xeon 400 МГц FSB (эффективное значение) является значительным усовершенствованием после относительно медленной 133 МГц FSB у Pentium III. Несмотря на такие различия, почти каждая платформа показывает одинаковое улучшение при переходе от одного к двум процессором, уменьшая время компиляции примерно на 60%. Таким образом, компиляция ядра не настолько сильно нагружает FSB, чтобы показать превосходство одной архитектуры над другой.

    Во-вторых, обратите внимание, насколько ошибочна стратегия "покупать гигагерцы". 1,2 ГГц Athlon MP по времени обгоняет 1,7 ГГц Xeon. Система на Athlon MP закончила 2-процессную компиляцию ядра за 90% времени, понадобившегося Xeon. Новое ядро Athlon MP на 4% быстрее справилось с заданием по сравнению со старым.

    В третьих, довольно любопытна разница в результатах 1-процессной компиляции между однопроцессорной и двухпроцессорной системой. При переходе к двум процессорам каждая архитектура получает преимущество несмотря на использование только 1 процесса, что проясняет дальнейший путь для улучшения. Нам, кстати, такой результат очень нравится, так как он говорит о пользе многопроцессорных систем даже при запуске однопотоковых приложений. Еще одна маленькая деталь: Athlon и Athlon MP показали лучший результат (82%) при переходе к двум процессорам. Аналогичный переход у Xeon дает меньшую разницу - 87%. Причину этого установить довольно трудно, но факт все равно интересен.

    И, наконец, заметьте, что если количество процессов превышает число процессоров, то результат ухудшается. Как нам кажется, каждому процессу в таком случае приходится конкурировать с другими за процессорное время, память и кэш файловой системы, что не играет им на руку.

    Производительность в среде с постоянной вычислительной нагрузкой

    Наши молитвы не пропали даром, и CSA Research Benchmark Studio 2001 включила в себя несколько улучшений. Для упрощения процесса тестирования, CSA Research встроила в программу уровни нагрузки системы. Как вы, наверное, помните из наших предыдущих обзоров, Benchmark Studio измеряет производительность в среде с постоянной вычислительной нагрузкой (Constant Computing). В такой среде пользователь может одновременно соединяться с почтовым сервером для получения писем, снимать данные из корпоративной базы данных, просматривать видеофильм с интранет-сервера и редактировать документ в Word. Benchmark Studio 2001 симулирует подобную вычислительную среду и измеряет производительность системы. Как видно, природа такого теста довольно далека от обычного офисного компьютера, зато она наглядно должна показать все преимущества многопроцессорной системы.

    Мы тестировали программу в трех прогонах. Первый (Baseline) просто проверял офисную производительность с помощью выполнения скрипта без дополнительных фоновых задач. Второй прогон (Loading level 1) использовал базу данных, почту и проигрыватель мультимедиа файлов, при этом был выставлен минимальный уровень нагрузки. Третий прогон (Loading Level 2) отличался от второго указанием максимального уровня нагрузки. Во время второго и третьего прогона запускался такой же офисный скрипт, что и в первом прогоне. Итоговая производительность высчитывалась в зависимости от затраченного времени и выражалась в секундах.

    Без всякой дополнительной нагрузки Athlon MP не демонстрирует никакого преимущества в производительности по сравнению с Athlon. От перехода к двухпроцессорной конфигурации тоже мало пользы. Однако у двух Xeon заметен некоторый отрыв по сравнению с одним, что связано с отставанием одного процессора в офисной производительности (большое число ошибок ветвления при длинном конвейере). Впрочем, мы можем не обращать внимания на эти результаты, так как вряд ли вы будете использовать двухпроцессорную систему для запуска Word, Excel или PowerPoint.

    Увеличение нагрузки расставляет все по своим местам. С одной стороны, почти все двухпроцессорные системы вырываются вперед (за исключением Duron 850 со слишком маленьким кэшем). Впрочем, различие в производительности между ними слишком мало для выделения неоспоримого лидера.

    Еще большее увеличение нагрузки усугубляет разрыв в результатах, что демонстрирует необходимость в производительных процессорах для high-end сетевых рабочих станций. Не забывайте, что для создания подобной ситуации запуском одного MS Office вам не обойтись. В нашем случае процессору приходится обрабатывать несколько видеопотоков, работать с базой данных и сервером почты. Неудивителен и полученный результат.

    AMD не солгала, когда указала на 15% прирост производительности Athlon MP над обычным ядром Athlon. В нашем случает Athlon MP выполнил тест за время, на 10% меньшее чем Athlon (оба использовали двухпроцессорную конфигурацию). .GIF" height=507 width=424>

    Переход к двухпроцессорности у Athlon MP улучшил среднее время отклика приложений только на 7%. Да, такой рынок не является целевым для 760MP, равно как и для любой многопроцессорной системы.

    Заключение

    AMD действительно прошла долгий путь за последние два года. Она начала его с репутации компании-изготовителя дешевых и сомнительных решений. Сейчас же AMD предлагает самую производительную X86 двухпроцессорную платформу на рынке - 760MP.

    Меньше месяца назад Intel объявила свой процессор Xeon, а сегодня AMD не оставила этой платформе никаких шансов. Intel продолжает свою игру, не считая AMD серьезной угрозой, но мы то с вами все видим. Угроза на самом деле существует, и она весьма велика.

    Но не стоит недооценивать Intel. В их будущем чипе Prestonia (Xeon MP) вероятно будет использоваться технология Jackson и будет увеличен кэш, так что AMD еще придется побегать за своими денежками. Однако у AMD еще есть больше полугода в запасе и она, скорее всего, не потратит время впустую. А пока что возникает единственная проблема: какой процессор выбрать для 760MP?

    AMD, по всей видимости, желает чтобы вы использовали Athlon MP на 760MP, несмотря на прекрасную работу и обычных Thunderbird. Но в любом случае, Athlon MP будут лучшим выбором. Архитектурные улучшения ядра Athlon MP заметны, прежде всего, в приложениях, действительно требующих наличия двухпроцессорности.

    Возможность использования Duron совместно 760MP выглядит довольно любопытно, однако этот процессор плохо подходит на эту роль. Во многих случаях двойной Pentium III показывает подобную (если не лучшую) производительность. В будущем эта картина может измениться, однако сдерживающим фактором у Duron все еще будет оставаться маленький размер кэша. На самом деле, размер кэша также сдерживает производительность и у Athlon. Большой кэш ощутимо влияет на производительность многопроцессорных систем, и рынок не желает ждать пока выйдет Hammer, преодолевающий магическую цифру в 384 кб.
    Кстати, переход на технологию 0,13 мкм очень хорошо сочетается с увеличением размера кэша L2 у Athlon MP, что улучшило бы результаты AMD во многих тестах.

    Как вы, наверное, догадываетесь, нас очень впечатлил чипсет AMD 760MP. Эта платформа надежна, производительна и довольно гибка. То есть вы получаете от AMD все то, что ожидаете от решения на базе Intel.

    Еще три года назад нас посчитали бы сумасшедшими, если бы мы порекомендовали серверное решение на базе AMD. Тем не менее, сегодня мы именно так и поступаем.

    Lehmen comments: Наши ожидания оправдались, у AMD получилась действительно очень и очень удачная система. Однако, справедливости ради стоит отметить, что не настолько крутая, как может показаться из только что прочитанного обзора. Anand немного "схитрил", не знаю нарочно или нет, но набор приведённых тестов показывает AthlonMP слишком уж в выгодном свете, по сравнению с Pentium4 Xeon, особенно если учитывать разницу между ними в 500 Mhz. Но если посмотреть другие обзоры, то картина будет более ровной, количество тестов и задач где двойной AthlonMP не в состоянии "обскакать" двойной P4Xeon достаточно велико. Но, что отмечают все обозреватели - это великолепную стабильность тестируемой системы на 760MP, что не может не радовать. Кроме этого стоит отметить очень неслабый прирост систем на AthlonMP от добавления второго процессора. В процентном отношении этот прирост практически ВСЕГДА выше, чем в случае с интеловскими процессорами. Что свидетельствует об очень сбалансированной и удачной архитектуре всей системы в целом. Всё-таки, как я уже говорил, наследие Alpha чувствуется, и чувство это весьма приятно. Кроме этого стоит отметить, что система на 760МР обладает самой широкой линейкой процессоров, что когда-либо можно было ставить на многопроцессорные платы. От 600 Duron (который сегодня можно взять чуть ли не за бесплатно), до AthlonMP, у которого только младшая модель имеет частоту 1000 Mhz. Я совсем не удивлюсь, если частоты процессоров, что будут работать на 760MP дойдут до 4-5 гигагерц. Ситуация с BP6 не должна повториться (в отличии от систем на P4 Xeon), что делает приобретение материнской платы на 760MP очень выгодным приобретением, даже несмотря на цену Tyan Thunder K7. Кроме этого, есть основания надеяться что MSI сдержит своё слово, и их платы действительно будут продаваться дешевле 200$. Кроме этого, сомнительно, что производители материнских плат отдадут такой перспективный рынок как мультипроцессорные платы под Athlon до конца года, как предрекает Anand. Тем более что прототипы плат уже готовы судя по просочившимся фотографиям). Надеюсь, что ещё до конца этого лета мне удастся получить в свои руки такую плату, и тогда разговор можно будет продолжить. На этой оптимистичной ноте и заканчиваем.

     
     
    ⇣ Содержание
    Если Вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
    Вечерний 3DNews
    Каждый будний вечер мы рассылаем сводку новостей без белиберды и рекламы. Две минуты на чтение — и вы в курсе главных событий.

    window-new
    Soft
    Hard
    Тренды 🔥
    AirPods научатся измерять пульс, температуру и «множество физиологических показателей» 36 мин.
    Саудовская Аравия привлечёт роботов для строительства футуристического мегаполиса в пустыне 2 ч.
    Облако Vultr привлекло на развитие $333 млн при оценке $3,5 млрд 5 ч.
    Разработчик керамических накопителей Cerabyte получил поддержку от Европейского совета по инновациям 6 ч.
    Вышел первый настольный компьютер Copilot+PC — Asus NUC 14 Pro AI на чипе Intel Core Ultra 9 7 ч.
    Foxconn немного охладела к покупке Nissan, но вернётся к этой теме, если слияние с Honda не состоится 12 ч.
    В следующем году выйдет умная колонка Apple HomePod с 7-дюймовым дисплеем и поддержкой ИИ 13 ч.
    Продажи AirPods превысили выручку Nintendo, они могут стать третьим по прибыльности продуктом Apple 13 ч.
    Прорывы в науке, сделанные ИИ в 2024 году: археологические находки, разговоры с кашалотами и сворачивание белков 21 ч.
    Arm будет добиваться повторного разбирательства нарушений лицензий компанией Qualcomm 21-12 18:37