Ddr2 800 что значит
Характеристики и маркировка оперативной памяти
Как известно, оперативная память вкладывает большую составляющую в производительность компьютера. И понятно, что пользователи стараются увеличить объем оперативной памяти по максимуму.
Если года 2-3 назад на рынке было буквально несколько типов модулей памяти, то сейчас их значительно больше. И разобраться в них стало сложнее.
В этой статье мы рассмотрим различные обозначения в маркировке модулей памяти, чтобы вам проще в них было ориентироваться.
Для начала введем ряд терминов, котоыре нам понадобятся для понимания статьи:
Объем
Тип корпуса
В ноутбуках используются модули памяти меньших габаритов, называемые SO-DIMM (Small Outline DIMM).
Тип памяти
Частоты передачи данных для типов памяти:
Модули памяти всех типов отличаются напряжением питания и разъемами и не позволяют быть вставленными друг в друга.
Частота передачи данных характеризует потенциал шины памяти по передаче данных за единицу времени: чем больше частота, тем больше данных можно передать.
Однако, есть еще факторы, такие как количество каналов памяти, разрядность шины памяти. Они также влияют на производительность подсистем памяти.
Для комплексной оценки возможностей RAM используется термин пропускная способность памяти. Он учитывает и частоту, на которой передаются данные и разрядность шины и количество каналов памяти.
Пропускная способность (B) = Частота (f) x разрядность шины памяти (c) x кол-во каналов (k)
Например, при использовании памяти DDR400 400 МГц и двухканального контроллера памяти пропускная способность будет:
(400 МГц x 64 бит x 2)/ 8 бит = 6400 Мбайт/с
На 8 мы поделили, чтобы перевести Мбит/с в Мбайт/с (в 1 байте 8 бит).
Стандарт скорости модуля памяти
В обозначении для облегчения понимания скорости модуля указывается и стандарт пропускной способности памяти. Он как раз и показывает, какую пропускную способность имеет модуль.
Все эти стандарты начинаются с букв PC и далее идут цифры, указывающие пропускную способность памяти в Мбайтах в секунду.
Название модуля | Частота шины | Тип чипа | Пиковая скорость передачи данных |
PC2-3200 | 200 МГц | DDR2-400 | 3200 МБ/с или 3.2 ГБ/с |
PC2-4200 | 266 МГц | DDR2-533 | 4200 МБ/с или 4.2 ГБ/с |
PC2-5300 | 333 МГц | DDR2-667 | 5300 МБ/с или 5.3 ГБ/с 1 |
PC2-5400 | 337 МГц | DDR2-675 | 5400 МБ/с или 5.4 ГБ/с |
PC2-5600 | 350 МГц | DDR2-700 | 5600 МБ/с или 5.6 ГБ/с |
PC2-5700 | 355 МГц | DDR2-711 | 5700 МБ/с или 5.7 ГБ/с |
PC2-6000 | 375 МГц | DDR2-750 | 6000 МБ/с или 6.0 ГБ/с |
PC2-6400 | 400 МГц | DDR2-800 | 6400 МБ/с или 6.4 ГБ/с |
PC2-7100 | 444 МГц | DDR2-888 | 7100 МБ/с или 7.1 ГБ/с |
PC2-7200 | 450 МГц | DDR2-900 | 7200 МБ/с или 7.2 ГБ/с |
PC2-8000 | 500 МГц | DDR2-1000 | 8000 МБ/с или 8.0 ГБ/с |
PC2-8500 | 533 МГц | DDR2-1066 | 8500 МБ/с или 8.5 ГБ/с |
PC2-9200 | 575 МГц | DDR2-1150 | 9200 МБ/с или 9.2 ГБ/с |
PC2-9600 | 600 МГц | DDR2-1200 | 9600 МБ/с или 9.6 ГБ/с |
Тип памяти | Частота памяти | Время цикла | Частота шины | Передач данных в секунду | Название стандарта | Пиковая скорость передачи данных |
DDR3-800 | 100 МГц | 10.00 нс | 400 МГц | 800 млн | PC3-6400 | 6400 МБ/с |
DDR3-1066 | 133 МГц | 7.50 нс | 533 МГц | 1066 млн | PC3-8500 | 8533 МБ/с |
DDR3-1333 | 166 МГц | 6.00 нс | 667 МГц | 1333 млн | PC3-10600 | 10667 МБ/с |
DDR3-1600 | 200 МГц | 5.00 нс | 800 МГц | 1600 млн | PC3-12800 | 12800 МБ/с |
DDR3-1800 | 225 МГц | 4.44 нс | 900 МГц | 1800 млн | PC3-14400 | 14400 МБ/с |
DDR3-2000 | 250 МГц | 4.00 нс | 1000 МГц | 2000 млн | PC3-16000 | 16000 МБ/с |
DDR3-2133 | 266 МГц | 3.75 нс | 1066 МГц | 2133 млн | PC3-17000 | 17066 МБ/с |
DDR3-2400 | 300 МГц | 3.33 нс | 1200 МГц | 2400 млн | PC3-19200 | 19200 МБ/с |
В таблицах указываются именно пиковые величины, на практике они могут быть недостижимы.
Производитель и его part number
Для модулей памяти у разных производителей она выглядит примерно так:
На сайте многих производителей памяти можно изучить, как читается их Part Number.
Модули Kingston семейства ValueRAM:
Модули Kingston семейства HyperX (с дополнительным пассивным охлаждением для разгона):
По маркировке OCZ можно понять, что это модуль DDR2 объемом 1 Гбайт, частотой 800 МГц.
По маркировке CM2X1024-6400C5 понятно, что это модуль DDR2 объемом 1024 Мбайт стандарта PC2-6400 и задержками CL=5.
Тайминги
Главным таймингом считается CAS latency, который часто обозначается сокращенно CL=5. Именно он в наибольшей степени «тормозит» память.
Основываясь на этой информации, вы сможете грамотно выбрать подходящий модуль памяти.
Исследование основных характеристик модулей памяти
Мы продолжаем изучение важнейших характеристик высокоскоростных модулей DDR2 на низком уровне с помощью универсального тестового пакета RightMark Memory Analyzer. Совсем недавно мы рассмотрели двухканальный комплект модулей памяти Kingston high-end серии HyperX, рассчитанный на функционирование в нестандартном режиме «DDR2-900», сегодня же будет рассмотрено похожее предложение, но укладывающееся в рамки стандарта JEDEC двухканальный комплект модулей памяти Kingston HyperX DDR2-800 высокой емкости (суммарный объем 2 ГБ), обладающих, как утверждает производитель, низкими задержками.Информация о производителе модуля
Производитель модуля: Kingston Technology
Производитель микросхем модуля: Elpida Memory, Inc.
Сайт производителя модуля:
www.kingston.com/hyperx/products/khx_ddr2.asp
Сайт производителя микросхем модуля:
www.elpida.com/en/products/ddr2.htmlВнешний вид модуля
Фото модуля памяти
Со снятыми радиаторами:
Фото микросхемы памяти
Расшифровка Part Number модуля
Руководство по расшифровке Part Number модулей памяти DDR2 на сайте производителя отсутствует. В краткой технической документации модулей с Part Number KHX6400D2LLK2/2G указывается, что продукт представляет собой комплект из двух модулей с низкими задержками (Low Latency, отсюда сокращение «LL») объемом 1 ГБ каждый, имеющих конфигурацию 128M x 64 и основанных на 16 микросхемах с конфигурацией 64M x8. Производитель гарантирует 100% стабильную работу модулей в штатном режиме DDR2-800 при таймингах 4-4-4-12 и питающем напряжении 2.0 В, но в микросхеме SPD в качестве режима по умолчанию прописан режим DDR2-800 со стандартными таймингами 5-5-5-15 и напряжением питания 1.8 В.
Расшифровка Part Number микросхемы
Как и в ранее исследованных Kingston HyperX DDR2-900, в настоящих модулях памяти использованы микросхемы с оригинальной маркировкой их реального производителя (Elpida), что позволяет нам изучить их характеристики в том числе, воспользовавшись описанием технических характеристик (data sheet) 512-Мбит чипов памяти DDR2 Elpida, применяемых в данных модулях.
Поле | Значение | Расшифровка |
---|---|---|
0 | | Производитель (отсутствует, «E» = Elpida Memory) |
1 | | Тип (отсутствует, «D» = монолитное устройство) |
2 | E | Код продукта: «E» = DDR2 |
3 | 51 | Емкость/количество логических банков: «51» = 512М/4 банка |
4 | 08 | Ширина внутренней шины данных: «08» = x8 |
5 | A | Протокол питания: «A» = SSTL 1.8V |
6 | G | Ревизия кристалла: «G» |
7 | | Код упаковки (отсутствует, «SE» = FBGA) |
8 | 6E | Скорость компонента: «6E» = DDR2-667 (5-5-5) |
9 | E | Код охраны окружающей среды: «E» = без использования свинца |
В маркировке рассматриваемых микросхем Elpida, как обычно, отсутствуют поля, характеризующие производителя (Elpida Memory) и тип устройства (монолитное), а также код упаковки устройства (FBGA). Как видно из приведенных в таблице характеристик, микросхемы модуля имеют конфигурацию 64M x8 (полная емкость 512 Мбит) и рассчитаны на функционирование в «медленном» режиме DDR2-667 (при таймингах 5-5-5), соответствующем первой ревизии стандарта DDR2-667. Заметим, что такие же микросхемы (но другого производителя) применяются в еще более высокоскоростных модулях Kingston HyperX DDR2-900, рассмотренных нами ранее. По-видимому, в обоих случаях можно говорить о тщательном отборе производителем модулей микросхем DDR2-667, обладающих наилучшими показателями скорости и надежности функционирования, вместо использования реальных микросхем скоростной категории DDR2-800.Данные микросхемы SPD модуля
Параметр | Байт | Значение | Расшифровка |
---|---|---|---|
Фундаментальный тип памяти | 2 | 08h | DDR2 SDRAM |
Общее количество адресных линий строки модуля | 3 | 0Eh | 14 (RA0-RA13) |
Общее количество адресных линий столбца модуля | 4 | 0Ah | 10 (CA0-CA9) |
Общее количество физических банков модуля памяти | 5 | 61h | 2 физических банка |
Внешняя шина данных модуля памяти | 6 | 40h | 64 бит |
Уровень питающего напряжения | 8 | 05h | SSTL 1.8V |
Минимальная длительность периода синхросигнала (tCK) при максимальной задержке CAS# (CL X) | 9 | 25h | 2.50 нс (400.0 МГц) |
Тип конфигурации модуля | 11 | 00h | Non-ECC |
Тип и способ регенерации данных | 12 | 82h | 7.8125 мс 0.5x сокращенная саморегенерация |
Ширина внешнего интерфейса шины данных (тип организации) используемых микросхем памяти | 13 | 08h | x8 |
Ширина внешнего интерфейса шины данных (тип организации) используемых микросхем памяти ECC-модуля | 14 | 00h | Не определено |
Длительность передаваемых пакетов (BL) | 16 | 0Ch | BL = 4, 8 |
Количество логических банков каждой микросхемы в модуле | 17 | 04h | 4 |
Поддерживаемые длительности задержки CAS# (CL) | 18 | 38h | CL = 5, 4, 3 |
Минимальная длительность периода синхросигнала (tCK) при уменьшенной задержке CAS# (CL X-1) | 23 | 3Dh | 3.75 нс (266.7 МГц) |
Минимальная длительность периода синхросигнала (tCK) при уменьшенной задержке CAS# (CL X-2) | 25 | 50h | 5.00 нс (200.0 МГц) |
Минимальное время подзарядки данных в строке (tRP) | 27 | 32h | 12.5 нс 5.0, CL = 5 3.3, CL = 4 2.5, CL = 3 |
Минимальная задержка между активизацией соседних строк (tRRD) | 28 | 1Eh | 7.5 нс 3.0, CL = 5 2.0, CL = 4 1.5, CL = 3 |
Минимальная задержка между RAS# и CAS# (tRCD) | 29 | 32h | 12.5 нс 5.0, CL = 5 3.3, CL = 4 2.5, CL = 3 |
Минимальная длительность импульса сигнала RAS# (tRAS) | 30 | 27h | 39.0 нс 15.6, CL = 5 10.4, CL = 4 7.8, CL = 3 |
Емкость одного физического банка модуля памяти | 31 | 80h | 512 МБ |
Период восстановления после записи (tWR) | 36 | 3Ch | 15.0 нс 6, CL = 5 4, CL = 4 3, CL = 3 |
Внутренняя задержка между командами WRITE и READ (tWTR) | 37 | 1Eh | 7.5 нс 3.0, CL = 5 2.0, CL = 4 1.5, CL = 3 |
Внутренняя задержка между командами READ и PRECHARGE (tRTP) | 38 | 1Eh | 7.5 нс 3.0, CL = 5 2.0, CL = 4 1.5, CL = 3 |
Минимальное время цикла строки (tRC) | 41, 40 | 33h, 30h | 51.5 нс 20.6, CL = 5 13.7, CL = 4 10.3, CL = 3 |
Период между командами саморегенерации (tRFC) | 42, 40 | 69h, 30h | 105.0 нс 42, CL = 5 28, CL = 4 21, CL = 3 |
Максимальная длительность периода синхросигнала (tCKmax) | 43 | 80h | 8.0 нс |
Номер ревизии SPD | 62 | 12h | Ревизия 1.2 |
Контрольная сумма байт 0-62 | 63 | 31h | 49 (верно) |
Идентификационный код производителя по JEDEC | 64-71 | 7Fh, 98h | Kingston |
Part Number модуля | 73-90 | 00h. 00h | Не определено |
Дата изготовления модуля | 93-94 | 06h, 0Fh | 2006 год, 15 неделя |
Серийный номер модуля | 95-98 | 5Ah, 15h, 8Eh, 29h | 298E155Ah |
Тесты производительности
В первой серии тестов использовалась схема таймингов, выставляемая в настройках BIOS по умолчанию (Memory Timings: «by SPD»). Тестирование осуществлялось в двух скоростных режимах DDR2-667 при частотах FSB 200 и 266 МГц (множители памяти 1.67 и 1.25, соответственно) и DDR2-800 при частотах FSB 200 и 266 МГц (множители памяти 2.0 и 1.5, соответственно). Напомним, что, начиная с нашего предыдущего исследования, в тестах модулей памяти используется новая версия тестового пакета RMMA 3.65, в которой по умолчанию выбран больший размер тестируемого блока памяти (32 МБ), что позволяет в большей степени устранить влияние сравнительно большого 2-МБ L2-кэша процессора Pentium 4 Extreme Edition.
В режиме DDR2-667 BIOS материнской платы в качестве значений таймингов по умолчанию выставила схему 5-5-5-13 («наугад», т.к. соответствующие данные отсутствуют в SPD), тогда как в режиме DDR2-800 по умолчанию выставляется схема 5-5-5-16, соответствующая рассмотренным выше данным SPD.
Скоростные показатели модулей достаточно высоки максимальная реальная ПСП составляет примерно 6.4-6.5 ГБ/с при 200-МГц FSB и 8.2-8.6ГБ/с при 266-МГц FSB, т.е. практически достигает теоретического максимума ПС процессорной шины (и даже несколько превосходит его, т.к. некоторое влияние L2-кэша процессора все же присутствует). Задержки при доступе в память, как обычно, уменьшаются при переходе как к более скоростным режимам (от DDR2-667 к DDR2-800), так и к более высокой частоте системной шины (от 200-МГц к 266-МГц FSB). Минимальная латентность памяти в режиме DDR2-800 при частоте системной шины 266 МГц находится в интервале от 45.5 нс (псевдослучайный обход, аппаратная предвыборка включена) до 116.6 нс (случайный обход, аппаратная предвыборка отключена), что несколько уступает значениям, полученным ранее на более «топовых» модулях Kingston HyperX DDR2-900.
Тесты стабильности
Значения таймингов, за исключением tCL, варьировались «на ходу» благодаря встроенной в тестовый пакет RMMA возможности динамического изменения поддерживаемых чипсетом настроек подсистемы памяти. Устойчивость функционирования подсистемы памяти определялась с помощью вспомогательной утилиты RightMark Memory Stability Test, входящей в состав тестового пакета RMMA.
Минимальные значения таймингов, которые нам удалось достичь в режиме DDR2-667 при использовании рекомендованного производителем повышенного питающего напряжения 2.0 В, как ни странно, выглядят весьма скромно 3-4-4 (изменение параметра tRAS в данном случае игнорируется). Напомним, что с модулями Kingston HyperX DDR2-900 в указанных условиях нам удалось достичь гораздо более «экстремальную» схему 3-3-2. Еще хуже обстоят дела в режиме DDR2-800 минимальной возможной (устойчивой) оказалась лишь схема 4-5-4-12, что даже выше по сравнению с «официально» заявленной производителем схемой 4-4-4-12. Что интересно, параметр tRAS в данном случае вносит решающий вклад в устойчивость функционирования подсистемы памяти его уменьшение приводило к немедленному «зависанию» системы.
Как обычно, выставление «экстремальных» схем таймингов лишь незначительно увеличивает пропускную способность подсистемы памяти и отчетливо проявляет себя лишь в величинах латентностей истинно случайного доступа к памяти. Максимальный эффект снижения задержек достигается в режиме DDR2-667 и составляет порядка 9 нс, т.е. примерно 8%.Итоги
Исследованные модули Kingston HyperX DDR2-800 (PC2-6400) высокой емкости с «низкими задержками» способны функционировать в скоростных режимах DDR2-667 и DDR2-800 при номинальных условиях (т.е. стандартных схемах таймингов, вроде 5-5-5-15 для режима DDR2-800) и характеризуются высокой производительностью в указанных режимах. В то же время, «разгонный потенциал» модулей по таймингам явно оставляет желать лучшего, что с трудом позволяет говорить о них как о модулях класса «Low Latency». Минимально возможная схема таймингов в режиме DDR2-667, не приводящая к потере устойчивости функционирования подсистемы памяти, составляет всего 3-4-4 (при рекомендованном питающем напряжении 2.0 В), а в режиме DDR2-800 4-5-4-12, что «не дотягивает» даже до значений 4-4-4-12, официально заявленных производителем в документации. По крайней мере, на используемой в тестах материнской плате (ASUS P5WD2-E), надежно зарекомендовавшей себя для тестирования высокоскоростных модулей памяти DDR2.
Память для Core 2 Duo, часть 3. Обзор модулей DDR2-800
В первую очередь отметим, что именно DDR2-800 SDRAM в большинстве случаев следует считать лучшим выбором для использования в платформах, основанных на процессоре Core 2 Duo. Как было показано нами в статье «Выбор памяти для платформы Core 2 Duo», наивысшую производительность в разогнанных системах можно получить при синхронном тактовании процессорной шины и шины памяти. А если учесть, что наиболее типичный разгон процессоров с ядром Conroe происходит при частотах FSB порядка 400 МГц, то именно оверклокерскую DDR2-800 SDRAM можно рекомендовать для приобретения большинству энтузиастов. Тем более что, как показывает практика, многие модули памяти PC2-6400, оказываются, способны не только на работу при частоте 800 МГц с достаточно агрессивными таймингами, но и зачастую могут быть разогнаны до более высоких скоростей при некотором увеличении задержек.
Конечно, учитывая обнаруженную нами ранее универсальность быстрых модулей, отрицать возможность их эффективного применения в разогнанных системах не следует. Как показали тесты, быстрые оверклокерские модули, рассчитанные на эксплуатацию при частоте 1 ГГц и выше, способны функционировать и с достаточно агрессивными таймингами при частотах около 800 МГц. Однако не следует упускать из виду важный ценовой фактор. Модули PC2-6400 SDRAM стоят ощутимо дешевле гигагерцовой и более быстрой памяти. Именно поэтому такие модули оказываются наиболее популярными среди основной массы оверклокеров.
Надо сказать, что высокая эффективность синхронного тактования процессорной шины и шины памяти – не единственный аргумент в пользу оверклокерских DIMM со средней скоростью. Проведённые нами тесты выявили, что далеко не все LGA775 материнские платы, совместимые с процессорами Core 2 Duo, способны обеспечить стабильное функционирование модулей памяти при частотах около 1 ГГц и выше. Например, определённые проблемы возникают у плат на базе набора логики i975X, в частности, у популярной среди оверклокеров ASUS P5W DH Deluxe. В результате, PC2-8000 и более быстрая память может быть полноценно использована и реально востребована только в системах на базе набора логики Intel P965, что значительно сужает сферу применимости такой высокочастотной памяти.
Кстати, отчасти именно поэтому тесты оверклокерской DDR2 SDRAM в платформах на базе Core 2 Duo мы проводим, используя материнскую плату ASUS P5B Deluxe, в основе которой лежит набор логики Intel P965 Express. Данная системная плата даёт возможность раскрыть потенциал памяти в Core 2 Duo системах наилучшим образом, поскольку более новый чипсет от Intel лучше оптимизирован для работы со скоростной DDR2 SDRAM. Вместе с этим следует отметить, что в Socket AM2 системах DDR2 память обычно разгоняется ещё лучше. Но, по озвученным в предыдущих частях нашего тестирования причинам, в настоящем материале нас интересует эксплуатация оверклокерской DDR2 SDRAM именно в системах с процессором Core 2 Duo.
реклама
К вышесказанному остаётся добавить то, что контроллер памяти нового набора логики Intel P965 имеет ряд особенностей по сравнению с предшествующими и конкурирующими контроллерами памяти. Дело в том, что при разработке этого нового чипсета инженеры уделили внимание наделению контроллера памяти значительной интеллектуальностью: в нём впервые реализованы алгоритмы внеочередного исполнения команд, целью которых является более эффективное использование открытых в памяти страниц. Это, в конечном итоге, позволяет повысить КПД полосы пропускания DDR2 SDRAM и снизить латентности при работе с данными. Таким образом, контроллер памяти iP965 во многом отличается по свойствам и своей архитектуре от аналогичных блоков, встроенных в другие процессоры и чипсеты.
Возвращаясь к основной цели данного материала, состоящей в тестировании двухгигабайтных комплектов оверклокерскиx модулей памяти PC2-6400 SDRAM, напомним состав используемой нами тестовой системы:
Набор тестов, который мы употребляли для проверки стабильности памяти, был стандартен и включал три приложения: Memtest86, S&M и Prime95. Исследование характеристик памяти проводилось при штатном для них напряжении питания, указанном производителем модулей DDR2 SDRAM.
Corsair TWIN2X2048-6400C4
Компания Corsair – постоянный участник всех тестирований оверклокерской памяти, проводимых нашим сайтом. Это совершенно неудивительно, так как продукты этого производителя разнообразны как по своей стоимости, так и по характеристикам. Надо сказать, что Corsair предлагает энтузиастам два варианта наборов модулей общей ёмкостью 2 Гбайта со штатной частотой 800 МГц: TWIN2X2048-6400С3 и TWIN2X2048-6400С4. Первый вариант является более дорогим и рассчитан на работу при таймингах 3-4-3-9, в то время как второй использует набор задержек 4-4-4-12. Нам на тесты достался более демократичный с точки зрения цены вариант с менее агрессивными таймингами, который к тому же более доступен в розничной продаже.
Двухканальная DDR2-800 на платформе AMD Athlon 64 X2 «AM2»
Оперативная память типа DDR2 известна уже довольно давно — начиная со своих первых вариантов DDR2-400 и DDR2-533, появившихся примерно 2 года назад и обладавших весьма высокими задержками (как динамическими, связанными с характеристиками самих микросхем памяти, так и системными, связанными с изначально медленными схемами таймингов — 3-3-3 и 4-4-4 соответственно), и заканчивая ее современными разновидностями, обладающими как высокими скоростями функционирования (DDR2-667, DDR2-800 и неофициальные DDR2-1000/1066), так и сравнительно низкими задержками (вплоть до схем вида 4-4-4 для DDR2-800). Тем не менее, реальный потенциал памяти данного типа в двухканальном режиме ее функционирования вплоть до сегодняшнего дня остается нераскрытым (использование сравнительно дорогой высокоскоростной памяти DDR2 в одноканальном режиме не оправдано по крайней мере экономическими причинами, т. к. гораздо более дешевая DDR400 в двухканальном режиме обладает как минимум не худшими, а зачастую — лучшими характеристиками). Причина этого заключается в том, что память типа DDR2 до сих пор поддерживалась (а фактически — предназначалась для) лишь одним классом платформ — Intel Pentium 4/Pentium D с чипсетами Intel, начиная от 915-й и заканчивая современной 975-й серией (как вариант — NVIDIA nForce 4 Intel Edition или чипсеты конкурентов, но это принципиально не меняет дело). Главное ограничение на раскрытие потенциала памяти DDR2 в этом классе платформ заключается в их традиционной «шинной» архитектуре, когда процессор связан посредством системной шины (Front-Side Bus, FSB) с северным мостом чипсета, важнейшим составляющим которого является собственно контроллер памяти, способный функционировать в двухканальном режиме. Несмотря на то что такой контроллер памяти способен обеспечить пропускную способность по своей «внутренней» шине, равную теоретической ПСП двухканальной DDR2 (от 6.4 ГБ/с для DDR2-400 до 12.8 ГБ/с для DDR2-800), реальная скорость обмена данными процессора с памятью ограничивается пропускной способностью системной шины процессора, которая функционирует на частоте 200 либо 266 МГц (для «экстремальных» вариантов процессоров). Пропускная способность последней составляет всего 6.4 либо 8.53 ГБ/с — что, как нетрудно заметить, в лучшем случае не превышает теоретическую пропускную способность двухканальной памяти DDR2-533. Исходя из этой простой математики, мы не устаем делать основной вывод о том, что даже на сегодняшний день двухканальной памяти типа DDR2-533 для платформ Intel по-прежнему хватает «за глаза». Конечно, практика показывает, что более высокоскоростная память типа DDR2-667 или DDR2-800 все же имеет преимущество и на этом классе платформ, которое заключается исключительно в снижении задержек при случайном доступе к оперативной памяти. Однако согласитесь, что постоянный случайный доступ к памяти вряд ли является типичным режимом ее функционирования, характерным для большинства реальных задач.
Итак, «необходимость и достаточность» памяти DDR2-533 могла бы еще долго оставаться такой — как минимум, до тех пор, пока не появились бы процессоры и чипсеты Intel, обладающие более высокой частотой системной шины (каковыми, кстати, станут грядущие процессоры Intel Core 2 (ядра Conroe/Merom/Woodcrest) и соответствующие им чипсеты). Если бы не решение конкурента, обладающее, по крайней мере «на бумаге», потенциально лучшими характеристиками обмена данными с памятью.
Как известно, существенным отличием процессоров/платформ класса AMD Athlon 64 (включая их двухъядерную реализацию Athlon 64 X2) является наличие интегрированного контроллера памяти (двухканального либо одноканального — в бюджетном секторе решений), функционирующего на полной частоте (равной частоте ядра процессора) и имеющего прямую шину обмена командами и данными с оперативной памятью. Последняя функционирует на частоте, максимально приближенной (именно «максимально приближенной», а не «равной», т. к. последняя получается делением частоты процессора на некую целую постоянную) к номинальной частоте памяти. При этом роль «системной шины» в привычном ее понимании играет шина HyperTransport, никак не связанная с шиной памяти и служащая для обмена данными с периферией посредством чипсета (говорить о строгом разделении последнего на северный и южный мосты здесь не приходится, поскольку отчасти функции северного моста выполняет сам процессор). Очевидно, что применение такой схемы, по крайней мере в теории, позволяет полностью «выбрать» реальную пропускную способность памяти даже при ее двухканальном подключении — обмен данными с памятью идет напрямую, минуя всевозможные «узкие места» (если, конечно, таковые не встречаются непосредственно в самом ядре процессора, о чем ниже). По нашим многочисленным исследованиям мы можем констатировать, что с нынешними процессорами AMD Athlon 64 (начиная от первой ревизии ядра («C») и заканчивая последней («E»)), интегрированный контроллер памяти которых рассчитан на использование памяти типа DDR400 (в последнем случае — и выше, вплоть до неофициальной «DDR533»), так оно и есть — наблюдаемые реально максимальные значения ПСП весьма близки к теоретическим.
Новое решение от AMD — двухъядерные процессоры с тем же названием Athlon 64 X2 (топовые модели — Athlon 64 FX), но ревизией ядра/контроллера памяти «F» и несколько иным процессорным разъемом «Socket AM2» в некоторой степени является принципиально новым — как уже можно было догадаться, интегрированный контроллер памяти этих процессоров теперь поддерживает память типа DDR2 (и только DDR2, начиная от DDR2-400 и пока что заканчивая DDR2-800). Пожалуй, это единственное серьезное отличие — бегло проведенные нами микроархитектурные тесты данного процессора в RightMark Memory Analyzer не выявили каких-либо заметных отличий от всех предыдущих ревизий процессоров класса AMD64 (чего не скажешь о постоянно меняющихся ревизиях ядер процессоров Intel!). Что ж, самое время посмотреть, на что способен новый контроллер памяти от AMD, сможет ли он раскрыть реальный потенциал двухканальной памяти DDR2-800. Или, перефразируя последнее предложение, «пришла ли наконец-то пора по-настоящему быстрой DDR2?» 🙂
Конфигурации тестовых стендов
Тестовый стенд №1
Тестовый стенд №2
Тестовый стенд №3
Результаты тестирования
Начнем с изучения результатов тестирования новой платформы как таковой (стенд №1), а затем сопоставим их с уже имеющимися результатами тестирования как памяти типа DDR2-800 на платформе Intel (стенд №2), так и памяти типа DDR400 на нынешнем поколении платформ AMD Athlon 64 (стенд №3).
В настройках контроллера памяти в BIOS материнской платы MSI K9N SLI Platinum, как и для предыдущих ревизий ядер AMD64, можно задать максимальную частоту функционирования памяти (MemCLK Limit). В данном случае она, выраженная в терминах скоростной категории памяти, может принимать значения «DDR2-400», «DDR2-533», «DDR2-667» и «DDR2-800», что соответствует четырем принятым стандартам памяти типа DDR2. В очередной раз оговоримся, что речь идет именно о максимальной, но не номинальной частоте функционирования памяти, поскольку она получается путем деления частоты процессора (контроллера памяти) на некоторое целое значение. Таким образом, реальная частота шины памяти может оказаться меньшей или равной заданному пределу MemCLK Limit.
К сожалению, узнать реальную частоту шины памяти в том или ином случае в точности не представляется возможным. Данный параметр просто не фигурирует в конфигурационных регистрах «северного моста» процессора (в них хранится лишь вышеупомянутый предел частоты памяти), поэтому всегда вычисляется эмпирическим путем, однако логика выставления частоты шины памяти процессором может отличаться от таковой, реализованной в системных утилитах (включая наш тест RMMA). Заметим также, что переориентация интегрированного контроллера памяти AMD64 на память типа DDR2 в новой ревизии ядер «F» неизбежно повлекла за собой многочисленные изменения в параметрах конфигурационных регистров, и, таким образом, на настоящий момент как сам процессор, так и настройки его контроллера памяти определяются неверно. Так, последняя версия RMMA (3.65) утверждает, что перед нами — процессор «AMD Athlon 64 FX-39» с частотой шины памяти 100 МГц (независимо от выставленного предела частоты), а большинство значений таймингов памяти просто не определяется. С нетерпением ждем новой документации от AMD, дабы исправить это положение, а пока вернемся к нашим тестам.
В приведенной ниже таблице представлены результаты тестирования памяти типа DDR2-800 (тайминги выставлялись в настройках BIOS по умолчанию) во всех четырех скоростных режимах, поддерживаемых новым контроллером памяти. Для каждого из этих режимов представлена теоретическая пропускная способность памяти, рассчитанная с учетом наиболее вероятной реальной частоты шины памяти (она отличается от номинала лишь в случае DDR2-533 и составляет 250 (500) МГц), а также реально измеренные величины ПСП и задержек при псевдослучайном (случайность в пределах одной страницы памяти, прямой последовательный обход страниц) и истинно случайном обходе 32-мегабайтного блока памяти.
* реальная частота памяти 250 МГц, режим «DDR2-500»
** размер блока 32 МБ
Результаты, мягко говоря, не впечатляют. Уже в случае наименее скоростного режима DDR2-400 максимальная реальная ПСП едва превышает 5.2-5.6 ГБ/с (заметим, что она оказывается ниже при чтении данных с программной предвыборкой, нежели при записи данных методом прямого сохранения) — что явно меньше типичных 6.2-6.4 ГБ/с, наблюдаемых в нынешнем поколении платформ AMD64 с памятью типа DDR400.
При переходе от наименее скоростного режима DDR2-400 к более скоростным изменение частоты шины памяти явно происходит — об этом говорят все более возрастающие величины ПСП, однако сам прирост указанных величин вряд ли заслуживает похвалы. В режиме DDR2-533 ПСП при чтении данных из памяти начинает превышать ПСП при записи данных (что сохраняется и при дальнейшем увеличении частоты шины памяти), но по-прежнему не достигает значений, типичных для… DDR400. Паритет достигается примерно в области DDR2-667 — в этом режиме ПСП при чтении начинает немного превышать ПСП DDR400, но достигает лишь порядка 62% от собственного теоретического максимума. Еще меньший эффект заметен в максимально скоростном режиме — ПСП достигает лишь 6.8 ГБ/с, т. е. примерно 53% от теоретического предела. Картина выглядит более чем печально — как показали наши недавние тесты, гораздо лучших результатов можно достичь с нынешним поколением контроллеров памяти AMD64 ревизии «E», применяя нестандартную (оверклокерскую) память типа DDR533.
Единственный приятный момент при переходе к высокоскоростным режимам функционирования DDR2 заключается лишь в постоянном уменьшении задержек, наиболее заметном по латентности случайного доступа к памяти (от 142 до 85 нс). Однако и этому находится достаточно прозаическое объяснение — во всех режимах использовалась одна и та же схема таймингов по умолчанию (5-5-5-12), которая в абсолютных величинах выглядит совершенно по-разному для режимов DDR2-400 и DDR2-800 (чтобы быть точным, различие составляет ровно два раза в пользу DDR2-800).
Сопоставим теперь полученные результаты с типичными скоростными показателями памяти типа DDR2-800 на платформах Intel и DDR400 на платформах AMD, взятыми из результатов тестирования модулей памяти Corsair XMS2 PC2-8500 (в режиме DDR2-800) и Corsair XMS 3500LLPRO (в режиме DDR400).
* ПС системной шины, частота 200.0 МГц
** ПС системной шины, частота 266.7 МГц
*** размер блока 32 МБ
О сопоставлении величин ПСП, полученных в настоящем исследовании, с результатами тестирования других платформ мы уже отчасти говорили выше — даже в максимальном скоростном режиме DDR2-800 они лишь незначительно опережают типичные величины для DDR400 на текущем поколении платформ AMD. На платформе Intel, явно ограничивающей реальный потенциал DDR2-800, и то наблюдаются значительно более высокие показатели — по крайней мере, соответствующие почти 100% эффективности утилизации процессорной шины, являющейся «узким местом». Достаточно приятную картину интегрированный контроллер DDR2 показывает лишь по части задержек — они оказываются меньше по сравнению с таковыми на платформе Intel, обладающей внешним контроллером памяти (в обоих случаях величины получены при включенной аппаратной предвыборке данных), т. е. некоторое преимущество интегрированного контроллера памяти над «традиционной» схемой построения подсистемы памяти все же имеется. Задержки при псевдослучайном обходе DDR2-800 на платформе «AM2» также не уступают задержкам при псевдослучайном обходе DDR400, а по части истинно случайного доступа к памяти новый интегрированный контроллер памяти DDR2 все же несколько проигрывает своему предыдущему DDR-аналогу.
Вместо заключения
Каковы же могут быть причины наблюдаемых результатов? На наш взгляд, их как минимум две. Первая из них достаточно очевидна — это «сырость» самого интегрированного контроллера памяти DDR2, который явно «не тянет» высокоскоростные режимы вроде DDR2-800, в связи с чем большую часть времени, по всей видимости, занимается отправкой «пустых» команд NOP по шине памяти :). Вторая причина менее очевидна, к тому же, она способна объяснить лишь часть представленных фактов. Это — «узость», да и вообще ограничение схемы организации шины L1-L2 кэша процессора (двунаправленная шина, эффективная разрядность которой — всего 64 бита в каждую сторону, в противовес 256-битной шине L1-L2 кэша процессоров Intel Pentium 4/Pentium D, к тому же, обладающих инклюзивной организацией кэша, не требующей «лишнего трафика» по шине L1-L2). Ее пиковая пропускная способность — 8 байт/такт, что для процессора с тактовой частотой в 2 ГГц составляет ровно 16.0 ГБ/с (заведомо выше ПСП двухканальной DDR2-800, но уже сопоставимо с ПСП более скоростной двухканальной DDR2-1066), однако в реальности мы имеем совсем другую картину.
Итак, реальная ПС в области L2-кэша данных составляет всего 4 байта/такт, т. е. ровно 8.0 ГБ/с, что явно ниже, чем теоретическая ПСП двухканальной DDR2-800. Реальная пропускная способность памяти как таковой, как мы уже показали, оказывается еще ниже. Тем не менее, «узость» шины L1-L2, хотя и имеет место быть, неспособна объяснить крайне низкие значения ПСП на запись методом прямого сохранения данных (минуя иерархию кэшей процессора), которая во всех случаях ограничивается уровнем 5.6-5.7 ГБ/с (т. е. проигрывает даже предыдущему контроллеру памяти, рассчитанному на DDR400!). С чем связано последнее ограничение, пока не понятно, однако складывается впечатление, что схема записи в память через «буферы объединения записи» (write-combining buffers), реализованная еще во времена первых процессоров Athlon 64 и не претерпевшая изменений впоследствии, уже явно устарела и «не поспевает» за современными стандартами двухканальной DDR2, обладающей весьма серьезным потенциалом пропускной способности (как мы видим, она оказывается сопоставимой со скоростью внутрипроцессорных коммуникаций, а это весьма и весьма серьезно!).
Таким образом, увы, в очередной раз раскрыть реальный потенциал топовых моделей DDR2 (DDR2-667 и выше) не удалось, эра высокоскоростной DDR2 не настала :(. На наш взгляд, виновной на сей раз оказалась сама компания AMD, попытавшаяся привязать уже устаревающие технологии почти 5-летней давности, реализованные еще в первых процессорах Athlon 64 (вроде сравнительно узкой шины L1-L2 кэша с эксклюзивной организацией последнего) к самым современным технологиям памяти, пропускная способность которых стремительно приближается к скорости передачи данных внутри самого процессора. Оперативная память определенно перестает быть «узким местом» системы, так что производителям процессора уже стоит начинать считаться с этим фактом. Что ж, будем надеяться, что производители услышат наши слова, и в следующей ревизии «G» процессорных ядер AMD64 (или принципиально новом процессорном ядре от AMD) подобные пробелы будут устранены.