Поддержка двухканальной архитектуры памяти ddr2 800 что это
Двухканальная оперативная память является одной из версий многоканальной памяти. Все версии многоканального ОЗУ увеличивают скорость передачи данных за счет добавления каналов связи между памятью и контроллером памяти.
Как работает многоканальное ОЗУ?
ОЗУ модуля памяти взаимодействует с остальной частью компьютера через контроллер памяти центрального процессора (также известный как центральный процессор или ЦП) с помощью шины. Некоторые контроллеры памяти имеют несколько каналов для связи с модулем памяти. Это позволяет быстрее обмениваться данными, так как обмен происходит по более чем одному каналу. Существуют контроллеры памяти с одним каналом, двумя каналами (двухканальный режим памяти), четырьмя каналами (четырехканальные), шестью каналами и восемью каналами. Шестиканальная и восьмиканальная архитектура обычно предназначена для серверов.
На рынке также имеются немногочисленные материнские платы, поддерживающие трехканальную архитектуру. Трехканальная архитектура также использует расслоение памяти — метод назначения адресов памяти в установленном порядке.
Какое оборудование необходимо помимо этого?
Чтобы воспользоваться преимуществами многоканальной памяти, процессор должен иметь контроллер и материнскую плату, которые поддерживают подобную архитектуру. Кроме того, модули ОЗУ должны быть сопоставлены как группы, которые соответствуют уровню многоканальной архитектуры, например, для двухканального режима требуется пара, для четырехканального режима требуется четыре модуля и так далее. Материнские платы, поддерживающие многоканальную архитектуру, часто имеют цветовую маркировку слотов памяти, чтобы гарантировать установку соответствующих модулей. Большинство производителей DRAM продают память "комплектами", чтобы обеспечить соответствие модулей памяти по емкости, скорости, задержке, количеству микросхем и сторон, а также размеру строк и столбцов. Чтобы воспользоваться преимуществами многоканальной памяти, следует приобретать ОЗУ в комплектах, совместимых с вашей материнской платой и процессором. Если установить несовместимые модули памяти, они, как правило, будут работать, но с характеристиками самого медленного модуля.
Для достижения наилучших результатов, воспользуйтесь инструментом Crucial® Advisor™ или системным сканером, чтобы найти совместимые комплекты для вашей материнской платы. Подробнее об установке памяти читайте здесь
Вывод
Если вы хотите значительно увеличить быстродействие вашего компьютера, этого можно добиться с помощью многоканальной архитектуры. Но для поддержки быстродействия потребуются значительные инвестиции в совместимое оборудование.
К теме раскрытия реального потенциала двухканальной памяти DDR2 мы обращались, так или иначе, уже неоднократно. Причина этого заключается в реальном потенциале памяти типа DDR2 как таковой, пропускная способность которой в двухканальном режиме работы, начиная с самых первых вариантов вроде DDR2-533, оказывается весьма высокой и, как правило, всегда превышает пропускную способность какого-либо компонента, лежащего на пути «регистры процессора — оперативная память» и лимитирующего пропускную способность подсистемы памяти в целом.
Чаще всего, «узким местом» системы оказывалась системная шина, связывающая шинный интерфейс (BIU) процессора (фактически — его L2-кэш) с контроллером памяти, расположенном в северном мосту чипсета. Именно так обстояло дело на платформах Intel, которые, как известно, обладают именно такой организацией подсистемы памяти. Частота системной шины на этих платформах не превышает 200 (большинство систем класса Pentium 4, включая двухъядерные Pentium D) или 266 МГц («экстремальные» варианты процессоров Pentium 4 Extreme Edition и двухъядерные Pentium Extreme Edition, а также новые платформы с двухъядерными процессорами с микроархитектурой Intel Core), что в терминах пропускной способности соответствует всего лишь двухканальной DDR2-400 или DDR2-533, соответственно. В связи с этим достаточно очевидно, что использование более высокоскоростных видов памяти вроде DDR2-667, DDR2-800 и, тем более, «неофициальных» вариантов DDR2-1066 на этом классе платформ не является оправданным по крайней мере с точки зрения пропускной способности памяти. С другой стороны, более высокая частота функционирования подсистемы памяти приводит к снижению ее системных задержек, что не может не являться плюсом и служит, так сказать, некоторым словом в защиту использования высокоскоростных разновидностей памяти DDR2 на платформах Intel.
Как бы там ни было, большие надежды на раскрытие реального потенциала памяти типа DDR2-667 и выше возлагалось на новую платформу AMD «AM2» (или, более официально — AMD K8 New Platform Technology, NPT), обладающую интегрированным в процессор двухканальным контроллером памяти, отныне «переделанным» для работы с памятью типа DDR2 (от DDR2-400 до DDR2-800 включительно) вместо устаревающей DDR, которая официально так и не превзошла частотный предел в виде DDR-400. Действительно, ведь в этом случае контроллер памяти расположен непосредственно в процессоре, функционирует на полной частоте процессора и имеет свой собственный интерфейс обмена данными с оперативной памятью, частота которого может составлять от 200 до 400 МГц и задается неким целым делителем полной частоты ядра процессора. И казалось бы — ничего не мешает «прокачивать» данные из памяти в регистры процессора с максимально возможной скоростью… так нет, наши исследования показали, что «узким местом» системы в этом случае оказывается шина L1-L2 кэша процессора, обладающая сравнительно низкой разрядностью (по 64 бита — в каждую сторону) и сложной (эксклюзивной) организацией. Ее пиковая пропускная способность, в теории, равна 8.0 байт/такт, однако тесты показывают, что ее реальная пропускная способность оказывается примерно вдвое ниже (порядка 4.0 байт/такт), что недостаточно для обеспечения бесперебойной «прокачки» данных из двухканальной DDR2-800 в регистры процессора даже у процессора Athlon 64 FX-62 с тактовой частотой ядра 2.8 ГГц.
Поскольку «узким местом» системы на платформе AMD «AM2» оказались, так сказать, именно «внутренности» ядра процессора, в заключительной части упомянутого выше исследования нам ничего не оставалось сделать, кроме как предположить, что «два ядра — лучше, чем одно». Ведь шина контроллера памяти в процессорах AMD Athlon 64 X2 является общей для обоих ядер, а «внутренности» у каждого ядра свои и, следовательно, большей утилизации пропускной способности памяти можно достичь при одновременном обращении к оперативной памяти со стороны обоих ядер процессора. По крайней мере — в теории, а как оно окажется на практике, нам покажут результаты, представленные в настоящей статье.
Итак, цель исследования, поставленного в рамках настоящей статьи, заключается в сравнении эффективности утилизации пропускной способности двухканальной памяти типа DDR2-800 при обращении к ней со стороны обоих ядер процессора, по сравнению с обращением к ней лишь одного ядра. Для проведения этого исследования мы воспользовались недавно разработанной утилитой RightMark Multi-Threded Memory Test, входящей в состав тестового пакета RightMark Memory Analyzer версии 3.7 и выше. Напомним, что эта утилита рассчитана на измерение пропускной способности подсистемы памяти (либо L2-кэша процессора, чему было посвящено наше предыдущее исследование с использованием этого инструмента, либо оперативной памяти, чему посвящено настоящее исследование) в условиях одно- или многопоточного обращения при осуществлении следующих операций: чтение (Read), запись (Write), чтение с программной предвыборкой (Read PF) и запись методом прямого сохранения данных (Write NT). Для сравнения, мы решили провести это исследование не только на платформах класса AMD «AM2», но и современных платформах на базе двухядерных процессоров Intel Core 2 Duo, первые исследования которых показали не самую высокую эффективность утилизации пропускной способности даже 266-МГц системной шины процессора в условиях «одноядерного» обращения.
Конфигурация тестовых стендов
Тестовый стенд №1
- Процессор: Intel Core2 Duo E6600, 4 МБ L2, 2.4 ГГц (266 МГц x 9)
- Чипсет: Intel 965G
- Материнская плата: Gigabyte 965G-DS3, BIOS F3 от 05.09.2006
- Память: 2 x 1 ГБ Corsair XMS2-8500C5 в режиме DDR2-800, тайминги 4-4-4-12
- Видео: Sapphire Radeon X1900XTX, 512 МБ
- HDD: Western Digital WD1600, SATA
Тестовый стенд №2
- Процессор: Intel Core2 Duo E6600, 4 МБ L2, 2.4 ГГц (266 МГц x 9)
- Чипсет: Intel 975X
- Материнская плата: ASUS P5W DH Deluxe, BIOS 0801 от 14.07.2006
- Память: 2 x 1 ГБ Corsair XMS2-8500C5 в режиме DDR2-800, тайминги 4-4-4-12
- Видео: Sapphire Radeon X1900XTX, 512 МБ
- HDD: Western Digital WD1600, SATA
Тестовый стенд №3
- Процессор: Athlon 64 X2 4800+ (Socket M2), 1+1 МБ L2, 2.4 ГГц
- Чипсет: NVIDIA MCP590
- Материнская плата: ASUS CROSSHAIR, версия BIOS 0121 от 24.07.2006
- Память: 2 x 1 ГБ Corsair XMS2-6400C3 в режиме DDR2-800, тайминги 4-4-4-12 (2T/1T)
- Видео: Sapphire Radeon X1900XTX, 512 МБ
- HDD: Western Digital WD1600, SATA
Intel Core 2 Duo
Рассмотрение результатов нашего исследования мы решили начать именно с этой платформы, поскольку раскрытие реального потенциала двухканальной DDR2-800 на этой платформе следует ожидать в меньшей степени, чем на платформе AMD «AM2», которую мы рассмотрим следом.
Эффективность доступа к памяти на Intel Core 2 Duo мы решили исследовать в двух различных конфигурациях — с участием нового, так сказать, специально разработанного под новую платформу чипсета семейства Intel 965 (в виде его представителя Intel 965G на материнской плате Gigabyte 965G-DS3, стенд №1) и несколько более старого чипсета Intel 975X (материнская плата ASUS P5W DH Deluxe, стенд №2), предположительно, обладающего несколько более высокими скоростными показателями.
Рис.1. Пропускная способность памяти (ГБ/с), Intel Core 2 Duo E6600, Intel 965G
Результаты измерений с участием чипсета Intel 965G представлены на рисунке 1. Здесь и далее, используемый размер блока во всех случаях составлял 32 МБ (32 МБ при однопоточном доступе, 16+16 МБ при двухпоточном доступе). В условиях однопоточного обращения к памяти на этом процессоре достигается пропускная способность порядка 5.96 ГБ/с (69.8% от теоретической ПС системной шины) при операциях чтения и 2.39 ГБ/с (28.0%) при операциях записи. Использование программной предвыборки данных (Software Prefetch, дистанция предвыборки подбиралась так, чтобы показатели ПСП были максимальными и составила 1024 байта) увеличивает ПСП на чтение до 6.76 ГБ/с (79.2%), а использование метода прямого сохранения данных (Non-Temporal Store) увеличивает ПСП на запись до 4.84 ГБ/с (56.7%). Таким образом, во всех случаях реальные величины ПСП явно далеки от теоретического предела ПС процессорной шины, равного 8.53 ГБ/с. В лучшем случае (чтение с предвыборкой), они составляют примерно 80% от указанного предела.
Параллельное включение второго потока (т.е. задействование второго ядра процессора) для доступа к данным, находящимся в оперативной памяти, практически не влияет на пропускную способность памяти при операциях записи данных — как «обычной», так и методом прямого сохранения. В то же время, ПСП на чтение возрастает до 7.38 ГБ/с (на 23.8%) при операциях чтения и до 8.33 ГБ/с (на сопоставимую величину — 23.2%) при чтении с программной предвыборкой. Полученный результат выглядит намного лучше, поскольку максимальная наблюдаемая ПСП в этом случае составляет уже почти 98% от теоретического предела. Тем не менее, говорить о раскрытии потенциала DDR2-800, обладающей теоретической ПСП в 12.8 ГБ/с, здесь явно не приходится. Впрочем, учитывая пропускную способность процессорной шины на уровне DDR2-533, его и не стоило ждать на этой платформе.
Рис.2. Пропускная способность памяти (ГБ/с), Intel Core 2 Duo E6600, Intel 975X
Несколько иные значения абсолютных показателей ПСП наблюдаются на чипсете Intel 975X (рис. 2). Сравнивая результаты исследования этого чипсета с рассмотренными выше, нельзя сказать об однозначном преимуществе того или иного чипсета Intel. В одних случаях преимуществом обладает Intel 965G, в других — Intel 975X. А именно, Intel 975X (при прочих равных условиях) характеризуется несколько более высокими ПСП на чтение (как «обычное», так и с программной предвыборкой) в условиях однопоточного обращения — 6.15 и 6.96 ГБ/с против 5.96 и 6.76 ГБ/с. В то же время, в операциях записи данных в память (как «обычной», так и методом прямого сохранения) сравнение оказывается не в пользу Intel 975X — соответствующие величины на этом чипсете составляют 1.81 и 4.72 ГБ/с против 2.39 и 4.84 ГБ/с. Наилучший результат по ПСП в условиях однопоточного доступа на этом чипсете вновь наблюдается при чтении данных с программной предвыборкой и составляет примерно 81.6% от максимальной теоретической ПС процессорной шины.
Что касается «двухъядерного» обращения, легко заметить, что прирост от использования второго потока доступа к памяти на этом чипсете оказывается менее выраженным по сравнению с Intel 965G, как по абсолютным, так и по относительным показателям. Они составляют 7.12 ГБ/с (прирост — 15.8%) и 8.00 ГБ/с (прирост — 14.9%) при «обычном» чтении и чтении с программной предвыборкой. Следует также отметить, что на этом чипсете несколько более заметен прирост при «двухпоточной» записи данных (ПСП возрастает с 1.81 до 2.28 ГБ/с). Итак, максимально достижимая ПСП при использовании обоих ядер процессора с участием чипсета Intel 975X составляет 8.00 ГБ/с, что соответствует примерно 93.8% от теоретической ПС процессорной шины. Учитывая полученные результаты, можно предположить, что новый чипсет Intel лучше оптимизирован для работы с памятью в условиях доступа к ней со стороны обоих ядер одновременно, нежели доступа лишь одного ядра процессора.
AMD Athlon 64 X2
Для исследования платформы AMD «AM2» был выбран достаточно высокопроизводительный процессор Athlon 64 X2 4800+ с тактовой частотой ядра 2.4 ГГц. При этом, поскольку процессоры AMD позволяют непосредственно настраивать величину задержек командного интерфейса (CMD rate), измерения проводились при величине задержек 2T (типичный режим для двух 1-ГБ модулей памяти DDR2-800) и 1T. Важно заметить, что даже новейшие модули памяти DDR2-800 от Corsair — XMS2-6400C3, обладающие экстремально низкими задержками в целом (для них позволительна схема таймингов 3-4-3-9), не обеспечивают 100% стабильную работу системы при уменьшенной величине задержек командного интерфейса 1T, хотя и достаточную для проведения измерений. Поэтому результаты измерений в режиме 1T, приведенные в настоящем исследовании, более полезны с теоретической, нежели практической точки зрения. Тем не менее, они могут стать более практически полезными при использовании меньших объемов памяти, например, двух 512-МБ модулей DDR2-800.
Рис.3. Пропускная способность памяти (ГБ/с), AMD Athlon 64 X2 4800+, 2T CMD rate
Результаты измерений в номинальном режиме «2T» приведены на рис. 3. По сравнению с рассмотренной выше платформой Intel, для процессоров AMD характерны более высокие показатели ПСП при операциях записи (как «обычной», так и методом прямого сохранения), что хорошо известно из наших предыдущих исследований. Величины ПСП на чтение и на запись в условиях однопоточного доступа довольно близки и составляют 3.97 и 3.17 ГБ/с, соответственно, что в пересчете на теоретическую ПСП двухканальной DDR2-800 составляет всего 31.0% и 24.8%, соответственно. Использование оптимизаций — программной предвыборки при чтении данных (дистанция предвыборки 1024 байта) и метода прямого сохранения при записи данных позволяет ощутимо увеличить эти показатели до значений 7.59 ГБ/с (59.3%) и 6.90 ГБ/с (53.9%), соответственно.
Наиболее существенное возрастание ПСП при использовании двухпоточного доступа к памяти наблюдается в случае «обычного» чтения данных — соответствующий показатель возрастает до 6.76 ГБ/с, что на 70.3% выше по сравнению с однопоточным обращением. Менее заметен прирост в ПСП при двухпоточной записи данных — ПСП при этой операции возрастает до 4.11 ГБ/с, т.е. примерно на 29.7%, а также при чтении с программной предвыборкой — прирост в ПСП в этом случае составляет всего 15.9% (с 7.59 до 8.80 ГБ/с). Тем не менее, наиболее неожиданный результат наблюдается в случае записи данных методом прямого сохранения — реальная ПСП в этом случае при двухпоточном обращении оказывается ниже (примерно на 4.5%) относительно ПСП при однопоточном доступе.
Теоретически, «двухъядерный» вариант доступа к памяти, по сравнению с «одноядерным», более не должен лимитироваться скоростью обмена данными внутри процессора (т.к. каждое из ядер обладает независимыми L1- и L2-кэшем данных). Иными словами, теоретически вполне можно ожидать почти двукратное возрастание ПСП при переходе от однопоточного к двухпоточному доступу к памяти. В связи с этим, последние два результата — сравнительно невысокий прирост в ПСП при операциях чтения с программной предвыборкой и вовсе ее уменьшение при операциях записи методом прямого сохранения, по-видимому, связаны уже с ограничениями самого контроллера памяти DDR2, реализованного в процессорах AMD «AM2», на уровне шины общих запросов к контроллеру со стороны обоих ядер либо шины памяти как таковой. Как бы там ни было, наилучший результат, показанный при чтении данных с программной предвыборкой, весьма далек от теоретической ПСП двухканальной DDR2-800, т.к. составляет лишь 68.8% от этой величины.
Рис.4. Пропускная способность памяти (ГБ/с), AMD Athlon 64 X2 4800+, 1T CMD rate
Заключение
Проведенное исследование эффективности одновременного обращения к памяти со стороны обоих ядер современных двухъядерных процессоров Intel Core 2 Duo и AMD Athlon 64 X2 показало, что «двухъядерный» вариант доступа к памяти действительно приводит к увеличению реально наблюдаемой пропускной способности памяти. Однако нельзя сказать, что это увеличение является весьма заметным и ярко выраженным.
Так, на платформе Intel Core 2 Duo с частотой системной шины 266 МГц реальная ПСП оказывается ограниченной именно на уровне ПС процессорной шины (8.53 ГБ/с), которая заведомо меньше теоретической пропускной способностью двухканальной DDR2-800 (12.8 ГБ/с). Так что для раскрытия реального потенциала высокоскоростной DDR2 все надежды здесь следует возлагать на будущее поколение процессоров/чипсетов Intel, рассчитанных на 333-МГц частоту системной шины (что увеличит ее ПС до уровня теоретической ПСП DDR2-667).
Что касается платформы AMD «AM2», где, казалось бы, более не должно быть никаких ограничений на раскрытие реального потенциала DDR2-800 — т.к. изначально выявленные ограничения в «одноядерном» режиме доступа были связаны со скоростью передачи данных внутри самого ядра процессора. В случае двух ядер передача данных могла бы осуществляться параллельно и с удвоенной скоростью, если бы не новое ограничение, на этот раз, по всей видимости, связанное не с микроархитектурными особенностями ядра процессора, но с реализацией общей шины системных запросов и/или шины памяти интегрированного контроллера памяти.
Итак, печально, но факт: реальный потенциал двухканальной DDR2-800, в плане ее высокой пропускной способности, в очередной раз остается нераскрытым. На сей раз, не таким успешным оказался принцип «два ядра — лучше, чем одно», все «уперлось», в одном случае — в пропускную способность системной шины, в другом — в эффективность реализации контроллера памяти. Что же тогда говорить о ныне существующей, пусть и «неофициальной» пока памяти DDR2-1066, а также грядущей DDR3 с обещанными рейтингами производительности вплоть до DDR3-1600? Нам остается лишь напомнить вывод, сделанный ранее: оперативная память явно перестает быть «узким местом» системы, и производителям процессоров и чипсетов определенно стоит считаться с этим фактом. Будем надеяться, что этот опыт будет учтен с выпуском новых процессоров и чипсетов, рассчитанных на более высокую частоту системной шины либо оснащенных более совершенным интегрированным контроллером памяти.
Практически каждый начинающий пользователь, начавший апгрейд компьютера, сталкивается с вопросом конфигурирования оперативной памяти. Что лучше, одна планка на 16 Гб или две по 8 Гб? Как включить двухканальный режим? В какие слоты ставить планки памяти — ближние или дальние от процессора? Как включить XMP профиль? Какой прирост производительности дает двухканальный режим, включение XMP профиля и разгон памяти?
В идеале конфигурирование памяти желательно начать еще до ее покупки, прикинув, какой объем памяти (ОЗУ) достаточен для ваших задач. Однако зачастую приходится добавлять память к уже имеющейся, что несколько усложняет дело.
Современные приложения и игры стали требовательны к подсистеме памяти, и важно, чтобы она работала в двухканальном режиме для максимальной отдачи. Почему так происходит?
В первую очередь из-за роста производительности процессоров. ОЗУ должна успевать загрузить работой все ядра процессоров, которых становится все больше с каждым годом.
В играх требования к скорости памяти растут в первую очередь от того, что проекты становятся все реалистичнее, увеличиваются в объемах и детализации 3D-моделей. Новые игры вплотную подбираются к отметке в 100 Гб, и этот объем в первую очередь состоит из текстур высокого разрешения, которые надо переместить с накопителя и обработать.
Недорогие ПК и ноутбуки со встроенной в процессор графикой получают приличный прирост от быстрой памяти и включения двухканального режима. Ведь обычная ОЗУ там используется и видеоядром. Поэтому давайте для начала разберем все о двухканальном режиме ОЗУ.
Двухканальный режим работы памяти
На большинстве материнских плат устанавливаются два или четыре слота под ОЗУ, которые могут работать в двухканальном режиме. Слоты материнской платы обычно помечаются разными цветами.
Чтобы реализовать самый оптимальный режим работы памяти в двухканале, нужно установить два одинаковых модуля ОЗУ в слоты одинакового цвета. Слоты для двух модулей ОЗУ в двухканале обычно называются DIMMA1(2) и DIMMB1(2). Желательно уточнить это в инструкции к вашей материнской плате.
Не всегда у пользователей бывают модули, совпадающие по частотам и таймингам. Не беда, двухканал просто заработает на скорости самого медленного модуля.
Двухканальный режим работы ОЗУ довольно гибок и позволяет установить и разные по объему модули. Например — 4 Гб и 2 Гб в канале A и 4 Гб и 2 Гб в канале B.
Как вариант, можно установить 8 Гб ОЗУ как 4 Гб в канале A и 2+2 Гб в канале B.
И даже конфигурация 4 Гб в канале A и 2 Гб в канале B будет работать в двухканальном режиме, но только для первых 2 Гб ОЗУ.
Но бывают такие ситуации, когда пользователь специально выбирает одноканальный режим работы ОЗУ с одним модулем. Например, если ставит только 16 Гб памяти и только через пару-тройку месяцев накопит на второй модуль на 16 Гб.
Ниже я протестирую, можно ли увеличить производительность одного модуля, разогнав его. А заодно протестирую все возможные режимы работы ОЗУ: с настройками по умолчанию, с включенным XMP профилем и с разгоном. Все тесты проведу как для одноканального режима работы, так и для двухканального.
Серверных материнских плат с четырехканальным режимом работы ОЗУ мы касаться не будем из-за их малого распространения.
Сколько модулей памяти оптимально для производительности?
Теперь нам надо решить, сколько модулей памяти лучше ставить в компьютер.
Если у вас материнская плата с двумя разъемами под ОЗУ, то выбор очевиден — вам нужно ставить две планки с подходящим вам объемом.
А вот если слотов под память у вас четыре, то, поставив четыре планки в четыре слота, можно получить небольшой прирост производительности. Прочитать об этом можно тут.
Но минусы такого решения перевешивают — у вас не остается слотов под апгрейд, модули памяти меньшего объема быстрее устаревают морально и меньше ценятся на вторичном рынке.
Какого объема ОЗУ достаточно?
При выборе объема ОЗУ ориентируйтесь на 8 Гб для офисного ПК и 16 Гб для игрового.
Выбирая 32 Гб ОЗУ, вы получите еще и прирост производительности, ведь большинство модулей DDR4 на 16 Гб — двухранговые. Это значит, что контроллер памяти в процессоре может чередовать запросы к такой памяти, повышая производительность в рабочих приложениях и играх.
Популярная двухранговая память
То есть, 2х16 Гб ОЗУ будут быстрее 2х8 Гб с той же частотой. Но есть и небольшой минус — у двухранговых модулей более низкий разгонный потенциал.
Посмотреть тип памяти можно программой CPU-Z, во вкладке SPD.
В какие слоты ставить модули памяти — ближние или дальние от процессора?
Раньше ОЗУ чаще ставили в самые ближние к процессору слоты (левые), но теперь все не так однозначно. Надо смотреть инструкцию к материнской плате и ставить по указаниям производителя.
Например, ASUS почти всегда рекомендует ставить память во второй слот.
Включение XMP профилей
Память с высокой частотой недостаточно просто установить в материнскую плату, чтобы она заработала на заявленной скорости. Как правило, скорость ограничится стандартной частотой для вашего процессора и материнской платы. В моем случае это 2400 МГц.
Чтобы активировать для ОЗУ скорость работы, которая записана в XMP профиле, надо зайти в BIOS и в разделе, посвященном настройке памяти, включить нужный XMP профиль. Вот так это выглядит на материнской плате MSI B450-A PRO MAX.
Тестирование разных режимов работы памяти
А теперь давайте протестируем память в разных режимах работы. Главной целью тестов будет разница работы в одно- и двухканальных режимах и разгоне.
- Процессор: Ryzen 5 1600 с разгоном до 4000 МГц
- Материнская плата: MSI B450-A PRO MAX
- Память: два двухранговых модуля CRUCIAL Ballistix Sport LT BLS16G4D30AESC, объемом по 16 Гб. XMP профиль — 2933 МГц. Разгон — 3400 МГц с настроенными таймингами и субтаймингами
- Видеокарта: GeForce GTX 1060 6 Гб
Начнем с тестирования пропускной способности чтения ОЗУ в AIDA64, в Мб/сек.
На графиках одноканальный режим работы отмечен как (S), а двухканальный — как (D), вместе с частотой работы памяти.
ОЗУ в двухканале прилично выигрывает.
Тестирование в архиваторе WinRAR 5.40 преподносит первый сюрприз. Одна планка памяти в разгоне до 3400 МГц работает быстрее, чем две на частоте 2933 МГц.
Архиватор 7-Zip 19.0, итоговая скорость распаковки в MIPS. Опять одна планка в разгоне обошла две на 2933 МГц.
Скорость работы архиваторов имеет важное практическое значение — чем она быстрее, тем быстрее будут устанавливаться программы и игры.
Из игр я выбрал Assassin’s Creed Odyssey и Shadow of the Tomb Raider. Для минимизации воздействия видеокарты на результаты я отключил сглаживание и выставил разрешение в 720p.
В Assassin’s Creed Odyssey даже при 50 % разрешения кое-где производительность упиралась в GeForce GTX 1060, ее загрузка доходила до 99 %.
Более быстрая видеокарта позволила бы еще нагляднее увидеть прирост производительности от режимов работы ОЗУ.
Assassin’s Creed Odyssey, средний FPS. Одна планка ОЗУ, работающая с разгоном, сумела обогнать две планки в двухканале, на частоте 2400 МГц.
Shadow of the Tomb Raider, DX12, средний FPS. Картина повторяется, и одна планка памяти в разгоне быстрее, чем две низкочастотные.
Демонстрация плавности геймплея в Shadow of the Tomb Raider с одним модулем ОЗУ на 3400 МГц. Надо учесть, что запись съела пару кадров результата.
Выводы
В моих тестах один двухранговый модуль памяти на 16 Гб в разгоне обогнал в архиваторах модули с частотой 2933 МГц, работающие в двухканале. А в играх обогнал модули, работающие с частотой 2400 МГц.
Это значит, что вы можете купить быстрый модуль на 16 Гб и добавить еще 16 Гб, когда его станет не хватать.
Но самый идеальный вариант компоновки памяти — два одинаковых модуля в двухканальном режиме.
И совсем хорошо, если вы потратите немного времени на ее разгон. Благо, есть много хороших гайдов на эту тему.
В первую очередь отметим, что именно DDR2-800 SDRAM в большинстве случаев следует считать лучшим выбором для использования в платформах, основанных на процессоре Core 2 Duo. Как было показано нами в статье "Выбор памяти для платформы Core 2 Duo", наивысшую производительность в разогнанных системах можно получить при синхронном тактовании процессорной шины и шины памяти. А если учесть, что наиболее типичный разгон процессоров с ядром Conroe происходит при частотах FSB порядка 400 МГц, то именно оверклокерскую DDR2-800 SDRAM можно рекомендовать для приобретения большинству энтузиастов. Тем более что, как показывает практика, многие модули памяти PC2-6400, оказываются, способны не только на работу при частоте 800 МГц с достаточно агрессивными таймингами, но и зачастую могут быть разогнаны до более высоких скоростей при некотором увеличении задержек.
Конечно, учитывая обнаруженную нами ранее универсальность быстрых модулей, отрицать возможность их эффективного применения в разогнанных системах не следует. Как показали тесты, быстрые оверклокерские модули, рассчитанные на эксплуатацию при частоте 1 ГГц и выше, способны функционировать и с достаточно агрессивными таймингами при частотах около 800 МГц. Однако не следует упускать из виду важный ценовой фактор. Модули PC2-6400 SDRAM стоят ощутимо дешевле гигагерцовой и более быстрой памяти. Именно поэтому такие модули оказываются наиболее популярными среди основной массы оверклокеров.
Надо сказать, что высокая эффективность синхронного тактования процессорной шины и шины памяти – не единственный аргумент в пользу оверклокерских DIMM со средней скоростью. Проведённые нами тесты выявили, что далеко не все LGA775 материнские платы, совместимые с процессорами Core 2 Duo, способны обеспечить стабильное функционирование модулей памяти при частотах около 1 ГГц и выше. Например, определённые проблемы возникают у плат на базе набора логики i975X, в частности, у популярной среди оверклокеров ASUS P5W DH Deluxe. В результате, PC2-8000 и более быстрая память может быть полноценно использована и реально востребована только в системах на базе набора логики Intel P965, что значительно сужает сферу применимости такой высокочастотной памяти.
Кстати, отчасти именно поэтому тесты оверклокерской DDR2 SDRAM в платформах на базе Core 2 Duo мы проводим, используя материнскую плату ASUS P5B Deluxe, в основе которой лежит набор логики Intel P965 Express. Данная системная плата даёт возможность раскрыть потенциал памяти в Core 2 Duo системах наилучшим образом, поскольку более новый чипсет от Intel лучше оптимизирован для работы со скоростной DDR2 SDRAM. Вместе с этим следует отметить, что в Socket AM2 системах DDR2 память обычно разгоняется ещё лучше. Но, по озвученным в предыдущих частях нашего тестирования причинам, в настоящем материале нас интересует эксплуатация оверклокерской DDR2 SDRAM именно в системах с процессором Core 2 Duo.
реклама
К вышесказанному остаётся добавить то, что контроллер памяти нового набора логики Intel P965 имеет ряд особенностей по сравнению с предшествующими и конкурирующими контроллерами памяти. Дело в том, что при разработке этого нового чипсета инженеры уделили внимание наделению контроллера памяти значительной интеллектуальностью: в нём впервые реализованы алгоритмы внеочередного исполнения команд, целью которых является более эффективное использование открытых в памяти страниц. Это, в конечном итоге, позволяет повысить КПД полосы пропускания DDR2 SDRAM и снизить латентности при работе с данными. Таким образом, контроллер памяти iP965 во многом отличается по свойствам и своей архитектуре от аналогичных блоков, встроенных в другие процессоры и чипсеты.
Возвращаясь к основной цели данного материала, состоящей в тестировании двухгигабайтных комплектов оверклокерскиx модулей памяти PC2-6400 SDRAM, напомним состав используемой нами тестовой системы:
- Процессор Intel Core 2 Extreme X6800 (LGA775, 2.93GHz, 4MB L2);
- Материнская плата ASUS P5B Deluxe (LGA775, Intel P965 Express);
- Графическая карта: PowerColor X1900 XTX 512MB (PCI-E x16);
- Дисковая подсистема: Maxtor MaXLine III 250GB (SATA150);
- Операционная система: Microsoft Windows XP SP2 с DirectX 9.0c.
Набор тестов, который мы употребляли для проверки стабильности памяти, был стандартен и включал три приложения: Memtest86, S&M и Prime95. Исследование характеристик памяти проводилось при штатном для них напряжении питания, указанном производителем модулей DDR2 SDRAM.
Объём оперативной памяти можно увеличить, только купив плашки памяти большего размера и/или докупив к уже имеющимся плашкам ОЗУ новые, если материнская плата обладает достаточным количеством слотов. Да и увеличение объёмов ОЗУ повышает производительность не всегда, только если ранее памяти для хранения промежуточных данных не хватало. К примеру, даже современным AAA проектам не требуется больше 10-12 Гб памяти (хватает и 8 Гб, но уже впритык). Для сёрфинга интернета, работы в офисных приложениях достаточно и меньших объёмов (зависит от используемых приложений). Ну а для серьёзных рабочих станций объёмы от 32 Гб ОЗУ и выше – насущная необходимость.
В отличие от увеличения объёма, прирост производительности от уменьшения латентности и увеличения пропускной способности памяти наблюдается практически всегда. Показатели латентности и ПСП можно изменить в БИОС материнской платы и специализированном софте, если материнская плата позволяет изменять множители/делители частоты ОЗУ, а также тайминги оперативной памяти. Благодаря этому пользователь без денежных затрат может увеличить производительность компьютера. Можете почитать про разгон оперативной памяти через БИОС.
Кроме изменения тактовой частоты, существует другой способ увеличения ПСП – многоканальный режим работы оперативной памяти. Двухканальный режим работы оперативной памяти является самым простым и распространённым частным случаем многоканального режима, доступным большинству пользователей. Этот способ увеличения ПСП не требует никаких особых навыков и знаний, тогда как изменение таймингов и частоты ОЗУ умеют выполнять не все опытные пользователи, не говоря о новичках.
Почему двухканальный режим работы оперативной памяти увеличивает пропускную способность
Скорость передачи данных из ОЗУ, как говорилось выше, зависит от латентности и ПСП. Пропускная способность памяти, в свою очередь, напрямую зависит от тактовой частоты работы ОЗУ и ширины шины обмена данными между контроллером памяти (КП) и оперативной памятью. Ширина шины одного канала ОЗУ у памяти типа DDR всех поколений составляет 64 бита. Контроллеры памяти, поддерживающие многоканальный режим, определяют несколько плашек памяти с шириной шины 64 бит как одно устройство с шириной шины n*64 (где n – количество плашек памяти, при условии, что КП поддерживает n-канальный режим работы ОЗУ). То есть двухканальный режим оперативной памяти увеличивает ширину шины ровно в 2 раза (2*64 = 128 бит). Формула расчёт теоретической ПСП (в Гб/c): “Clock * memory_bus / 8 / 1000”, где “Clock” – эффективная частота памяти (в МГц), а “memory_bus” – ширина шины обмена данными ОЗУ с КП.
Исходя из вышесказанного следует, что теоретическая пропускная способность памяти при увеличении ширины шины кратно возрастает. Следовательно, двухканальный режим оперативной памяти увеличивает пропускную способность в 2 раза.
Как включить двухканальный режим оперативной памяти
После всего прочитанного в этой статье, уверен, вам захотелось узнать, как включить двухканальный режим работы оперативной памяти на своем компьютере. Для активации двухканального режима необходимо выполнение следующих условий:
- Поддержка контроллером памяти двухканального режима работы ОЗУ;
- Наличие двух и более плашек оперативной памяти одного поколения;
- Наличие двух слотов для установки ОЗУ;
- Идентичность типов обоих плашек памяти (с ECC или без);
- (опционально) Идентичность характеристик плашек оперативной памяти (тактовой частоты, таймингов, кол-ва рангов, производителя чипов памяти и др.).
Чтобы активировать двухканальный режим оперативной памяти, нужно вставить минимум 2 плашки ОЗУ в разные слоты материнской платы (если слотов больше, чем 2, то они должны быть 1 цвета). В большинстве случаев больше ничего делать не нужно, двухканальный режим работы ОЗУ активируется самостоятельно.
Однако иногда пользователю вручную приходится активировать в БИОС функцию “Dual Channel”. Также существует вероятность, что ПК вообще откажется стартовать. Такое случается при использовании разных плашек памяти. В этом случае можно попробовать отключить некоторые функции для ОЗУ в БИОС и/или изменять частоту и тайминги, загрузившись с 1 плашкой.
Проверить, активировался ли двухканальный режим работы оперативной памяти, можно в специализированном софте (например, в CPU-Z или Aida64).
Видно, что двухканальный режим работы оперативной памяти активирован
Прирост производительности от двухканального режима оперативной памяти
Наибольший прирост производительности (практически кратный) от активации двухканального режима ОЗУ получают системы, использующие интегрированную графику. Производительность такой графики зачастую упирается в ПСП и латентность памяти. GPU большую часть времени “вхолостую” простаивает, ожидая данные из ОЗУ (оперативная память в подобных системах используется ещё и в качестве видеопамяти).
Также значительного прироста следует ожидать на системах, страдающих от нехватки ОЗУ. При увеличении скорости обмена данными, ОЗУ за единицу времени может передать больше данных, чем раньше, поэтому данные будут занимать в оперативной памяти немного меньший объём. Кроме того, существенный прирост могут получить системы с мощными процессорами, страдающими от нехватки данных, так как пропускной способности памяти в одноканальном режиме (в первую очередь у памяти устаревших стандартов) не хватает некоторым приложениям для своевременного обмена данными с контроллером памяти. Так в игре Rise of The Tomb Raider Intel Core i7 2600 получает прирост производительности в 34,5% от увеличения пропускной способности памяти, в частности частоты:
На системах с маломощным центральным процессором, использующих дискретную графику и современный тип памяти, прирост производительности в игровых приложениях будет достаточно маленький (значительно увеличатся лишь показатели 0,1% и 1% минимального фпс), не говоря уже о рендеринге, где на первый план выходит мощность ЦП. Так на Intel core i3 6100 двухканальный режим оперативной памяти в 3DMark Fire Strike не даёт никаких преимуществ, в сравнении с одноканальным.
Тогда как прирост ПСП составил внушительных 94%:
В играх прирост производительности небольшой, зато серьёзно вырастает минимальный FPS и скачки времени кадра становятся менее выраженными, что серьёзно повышает плавность игры в целом.
Читайте также: