Юрий бублий разгон памяти
Украинский разработчик Юрий Бублий, также известный как 1usmus, выпустил финальную версию ClockTuner for Ryzen (CTR), которая помогает владельцам процессоров Zen 2 (и в будущем Zen 3) оптимизировать настройки энергопотребления и частоты под возможности и индивидуальные особенности конкретного кристалла.
Такая утилита требуется потому, что на заводе каждый процессор не подвергают тщательной калибровке — на всех выставляются одинаковые усреднённые значения, которые могут быть далеки от оптимальных.
CTR автоматически производит классификацию ССХ-блоков по качеству и индивидуально подбирает максимальную частоту для каждого из них.
CCX (Core CompleX) — это одна из структурных единиц процессора, в которую может входить до 4-х ядер, кэши и другие сопутствующие модули. Линейка Ryzen серии 3000 имеет продукты, в которых количество CCX может варьироваться от 1 до 16 штук (Threadripper 3990X).
Тем не менее, имея столь могучий инструмент как разгон с помощью CCX, большинство пользователей (95%) не будут иметь понятия, какую частоту установить для каждого CCX и какое напряжение должно быть. Процессоры, у которых четыре CCX и более могут повергнуть начинающего энтузиаста в шок.
Поскольку это всё огромная сложность для многих, а резерв у процессоров не использован, мне пришла в голову идея создать ПО, которое сможет помочь пользователям легко и просто получить бесплатную производительность, если таковая, конечно, имеется.
Разработчик поделился результатами своей тестовой системы на базе Ryzen 3900X.
Программе удалось на 10,3% увеличить производительность процессора (7974 балла в Cinebench R20 против 7191 в стоке), одновременно снизив напряжение до 1,25 В (было 1,283 В).
Поскольку утилита подбирает параметры для каждого процессора индивидуально, результаты в каждом конкретном случае будут отличаться.
Оптимизация через CTR обеспечивает меньший прирост производительности, чем традиционный оверклокинг, но значительно безопаснее для процессора и несравненно проще — подбирать правильные параметры вручную намного сложнее и требует специфических знаний.
Встроенная в современные процессоры Ryzen система автоматического разгона PBO (Precision Boost Overdrive) даёт сравнимые результаты, но склонна выставлять более высокое напряжение по сравнению с ClockTuner.
В список поддерживаемых процессоров входят все существующие десктопные модели на архитектуре Zen2 — Ryzen 3, 5, 7, 9 и Threadripper серий 3000 и 4000. Модели Ryzen серии 3000G со встроенной графикой не подходят, так как в них используется архитектура Zen+. Также не поддерживаются процессоры для ноутбуков.
Работа утилиты не зависит от материнской платы и версии BIOS, а интерфейс позволит оптимизировать производительность и энергопотребление «в один клик».
ClockTuner for Ryzen анонсировали в конце августа 2020 года — одними из первых утилиту протестировали в ролике Linus Tech Tips.
Если все так круто, почему это не делается на заводе или родными утилитами?
"На практике все немного иначе. Поскольку процесс оценки энергетических характеристик сложный, а временные рамки на оценку ограничены (время — деньги) — используется более простой способ оценки энергетических характеристик. В результате мы имеем некий образец процессора, с информацией о приблизительных его возможностях. Соответственно, чтобы каждый образец работал так как надо, рабочее напряжение будет выбрано по самому худшему образцу. Недостатки — это некорректные метки ядер, завышенное энергопотребление (и тепловыделение) если пользователю попался удачный экземпляр процессора. Иными словами, такой образец имеет скрытый резерв."
родная утилита тоже есть AMD Zen Master, но она сложная в использовании, а PBO (Precision Boost Overdrive) не настолько эффективен.
Если вам ничего не говорит название утилиты DRAM Calculator и само имя 1usmus, то на вашем месте я бы не стал ничего трогать предварительно не изучив материалы.
Читайте руководство , ссылка в статье. Там на большинство вопросов ,есть ответы от самого разработчика. ред.
Чел, какое к чёрту руководство? Я готов читать статью полностью перед написанием комментария, но я не готов изучать для этого какие-то руководства к железу, которого у меня нет (я на интеле). Именно для этого всякие Еливсратовы и пишут краткую общую информацию в конце статьи.
Хаха, интелбоя порвало.
Чел, какое к чёрту руководство? Я готов читать статью полностью перед написанием комментария, но я не готов изучать для этого какие-то руководства к железу, которого у меня нет (я на интеле). Именно для этого всякие Еливсратовы и пишут краткую общую информацию в конце статьи.
Чтобы понять, что не так с режимом DDR4-4000 (и более скоростными) в Ryzen 5000, нужно немного углубиться в их внутреннее устройство. Процессоры этого семейства собраны из чиплетов двух типов – 7-нм восьмиядерных CCD-чиплетов, которые содержат внутри себя вычислительные ядра, и 12-нм чиплета IOD, в котором находятся контроллеры памяти, PCIe 4.0 и некоторых других внешних интерфейсов. Соединяются чиплеты между собой специальной 32-битной шиной Infinity Fabric, которая работает на своей независимой частоте.
Поскольку контроллер памяти в Ryzen физически оторван от процессорных ядер, он также имеет свою рабочую частоту. И в сумме всё это приводит к тому, что скорость работы подсистемы памяти определяется сразу тремя частотами: частотой модулей памяти, частотой контроллера памяти и частотой шины Infinity Fabric, связывающей контроллер с процессорными ядрами и L3-кешем.
Естественно, максимальная производительность всего этого комплекса достигается в том случае, когда Infinity Fabric, контроллер памяти и сама память работают синхронно, то есть на одинаковой частоте, однако добиться этого для любых вариантов модулей DDR4 SDRAM невозможно. Но AMD хотя бы постаралась, чтобы правило синхронного тактования соблюдалось в максимально возможном количестве случаев. И если в системе используется DDR4-3600 или менее скоростная память, то синхронность достигается автоматически. Но для более быстрых модулей памяти всё получается уже иначе.
Частота памяти (mclk) | Частота контроллера (uclk) | Частота Infinity Fabric (fclk) | |
---|---|---|---|
До DDR4-3600 | mclk до 1800 МГц | uclk = mclk | fclk = mclk |
DDR4-3600 | mclk = 1800 МГц | uclk = 1800 МГц | fclk = 1800 МГц |
После DDR4-3600 | mclk выше 1800 МГц | uclk = mclk/2 | fclk = 1800 МГц |
В таблице выше показано, как ведут себя частоты контроллера памяти и шины Infinity Fabric при переходе через режим DDR4-3600. В более скоростных режимах частота Infinity Fabric перестаёт расти вслед за частотой памяти и остаётся на отметке 1800 МГц, активируя асинхронность.
Что касается контроллера памяти, то его частота связана с частотой памяти, но он может работать как на частоте памяти, так и на половине её частоты. При этом есть и ещё одно условие: его частота не может быть выше частоты Infinity Fabric. В результате если частота Infinity Fabric перестаёт соответствовать частоте памяти, контроллер памяти вынужден переходить в более медленный режим половинной частоты. В итоге получается два принципиально различных варианта: либо всё работает синхронно и всё хорошо, либо все частоты, связанные с подсистемой памяти, выходят из связки, и это порождает дополнительные и довольно весомые задержки. Именно из-за них мы и наблюдаем снижение производительности Ryzen 7 5800X при установке в систему DDR4-4000.
Однако есть и ещё один важный нюанс. Описанная выше связь частот – это механизм, который реализован в системах на базе процессоров Ryzen 5000 по умолчанию. В действительности же у пользователя есть доступ как к изменению частоты Infinity Fabric вручную, так и к смене режимов тактования контроллера памяти – синхронно с модулями DDR4 SDRAM или на половинной частоте.
В результате пользователь сам может попытаться включить производительный синхронный режим для более быстрых, нежели DDR4-3600, вариантов памяти. И в ряде случаев это действительно работает. Так, благодаря ручной настройке частот с Ryzen 5000 может синхронно работать не только DDR4-3600, но и более быстрая DDR4-3800 (чем мы и воспользовались для тестов в предыдущем разделе). В этом случае достаточно вручную зафиксировать частоту Infinity Fabric на значении 1900 МГц, и это чаще всего будет работать без каких-либо проблем. Однако для более быстрых вариантов памяти, таких как DDR4-4000, добиться стабильности в синхронном режиме уже почти невозможно.
Когда AMD анонсировала процессоры семейства Ryzen 5000, она обещала, что с ними при удачном стечении обстоятельств сможет работать синхронно и DDR4-4000, то есть утверждалось, что частота 2000 МГц для шины Infinity Fabric вполне реальна.
Однако это утверждение не прошло проверку жизнью. Установить частоту Infinity Fabric и контроллера памяти в 2000 МГц возможно, но при таких настройках в операционной системе начинают фиксироваться множественные ошибки WHEA (Windows Hardware Error), которые связаны с искажением данных, передаваемых по Infinity Fabric. В большинстве своём эти ошибки исправляются механизмами Windows 10, однако некоторые из них могут привести к краху системы и появлению «синих экранов». Иными словами, система, работающая в таком состоянии, не может считаться стопроцентно стабильной, и максимально доступным синхронным режимом памяти для процессоров Ryzen 5000 следует считать DDR4-3800, а не DDR4-4000.
Чтобы оценить штраф, который налагается при отключении синхронного режима памяти, мы протестировали, как Ryzen 7 5800X работает с DDR4-3800 при трёх схемах тактования: 1900:1900:1900 – когда частоты памяти, Infinity Fabric и контроллера памяти совпадают; 1900:1900:950 – когда память и Infinity Fabric работают синхронно, но контроллер переведён в режим половинной частоты; 1900:1800:950 – когда Infinity Fabric работает на асинхронной частоте 1800 МГц.
Кроме того, попутно мы попытались ответить на вопрос о целесообразности разгона Infinity Fabric в системах, где память работает на более низкой частоте. На тех же графиках присутствуют результаты, полученные при использовании в системе DDR4-3200 в трёх режимах: 1600:1600:1600 – полностью синхронном; 1600:1900:1600 – асинхронном при разгоне Infinity Fabric до 1900 МГц; 1600:1900:800 – асинхронном, где Infinity Fabric разогнана, а контроллер памяти заторможен до половинной частоты. Все тесты проведены с двумя модулями по 16 Гбайт.
Из результатов синтетических тестов видно, что нарушение синхронности в трёх частотах приводит не столько к падению практической пропускной способности подсистемы памяти, сколько к увеличению задержки. В конечном итоге латентность возрастает почти на 20 %, причём основная часть этого штрафа возникает при включении в контроллере памяти режима половинной частоты, а вовсе не тогда, когда частота Infinity Fabric перестаёт совпадать с частотой памяти.
В приложениях использование асинхронных режимов не кажется опасным для производительности. Существенное падение быстродействия заметно только при архивации. Однако в целом видно, что отсутствие согласованности между частотами ни к чему хорошему не приводит. Даже разгон частоты Infinity Fabric выше частоты памяти оказывает на итоговую производительность негативное влияние.
Игры реагируют на асинхронность довольно болезненно. Разница в игровой производительности системы с равными частотами на магистрали «процессор—память» и этой же системы, где все три частоты (память, Infinity Fabric, контроллер) разные, составляет в среднем 5 %. Причём удар по FPS наносит как снижение частоты контроллера памяти, так и отсутствие согласованности между частотой памяти и Infinity Fabric.
В итоге получается, что использовать с Ryzen 7 5800X память в режимах быстрее DDR4-3800 действительно не имеет смысла. При этом нужно обязательно следить, чтобы соблюдалось равенство частоты памяти, частоты Infinity Fabric и частоты контроллера памяти. Проверить правильность их тактования можно диагностическими утилитами, например в HWINFO64.
Заодно там же стоит проконтролировать отсутствие ошибок WHEA, которые появляются в системах на базе Ryzen 5000 при переразгоне Infinity Fabric.
Раз мы сегодня говорим обо всех факторах, которые влияют на производительность памяти и в конечном итоге всей системы, обойти стороной тайминги просто невозможно. В процессорах Ryzen 5000, основанных на микроархитектуре Zen 3, произошли значительные изменения, самым заметным из которых стало объединение восьми ядер в одном CCX-комплексе. Это привело к удвоению размера L3-кеша, адресуемого каждым вычислительным ядром, что, в свою очередь, повлекло за собой снижение усреднённых задержек, которые возникают при обращениях процессора к данным. В теории это могло бы означать и снижение влияния на производительность таймингов памяти, которое в процессорах прошлого поколения было определённо заметным.
Но простой тест позволяет убедиться, что схема таймингов, с которой работает тот или иной комплект памяти, продолжает влиять на быстродействие всей системы. Чтобы убедиться в этом, мы протестировали 32-Гбайт комплект DDR4-3600, состоящий из двух модулей, с четырьмя различными схемами таймингов, начиная с 14-14-14-28 и заканчивая 20-20-20-40. Результаты получились вполне показательными.
Не слишком выигрывают от снижения таймингов и приложения. Даже если сравнивать между собой результаты, полученные с худшей и лучшей схемой задержек, то получится, что максимальный разрыв в производительности достигает лишь 5 %. Причём такая разница наблюдается всего единожды – при измерении скорости архивации данных.
Но для игр тайминги всё-таки кажутся довольно важной характеристикой. Кадровая частота может различаться на величину до 6 % в относительном выражении. Таким образом, выбор памяти с агрессивными настройками может быть вполне оправдан. Однако нельзя не сделать важную оговорку о том, что те самые 6 % разницы, которые мы увидели при переходе от максимально вялой схемы 20-20-20-40 к очень бодрым 14-14-14-28, можно было бы получить за счёт увеличения частоты работы памяти на 400-500 МГц. Это создаёт впечатление, что частота памяти – более важная характеристика, нежели её задержки.
Большинство пользователей не занимается тонкой настройкой таймингов памяти, полагаясь на XMP-профили. И это вполне закономерно: профили XMP как раз и были введены в употребление для того, чтобы снять с пользователей груз по подбору идеальных параметров памяти, которые позволят выжать из имеющихся модулей максимум возможного. Однако из-за того, что профили XMP делаются универсальными и способными подойти для совершенно различных систем, предлагаемые ими установки всегда можно улучшить, и нередко – весьма существенно. Это касается как первичных таймингов, которые указываются в спецификациях модулей, так и вторичных параметров, которые в действительности тоже могут сильно повлиять на производительность, – в конечном итоге после тщательной настройки рассчитывать можно как минимум на 5 % дополнительного прироста FPS в играх.
Другое дело, что заниматься подгонкой многочисленных параметров подсистемы памяти, число которых превышает три десятка, захотеть могут лишь только самые отчаянные энтузиасты, которые готовы тратить на идеальную подгонку настроек своей сборки даже не часы, а дни и недели. К счастью, существует довольно простой путь, как можно срезать этот угол, – в этом может помочь полезная утилита DRAM calculator for Ryzen, созданная хорошо известным (в узких кругах) разработчиком Юрием Бублием (1usmus).
Утилита DRAM calculator for Ryzen предлагает заранее подобранные оптимизированные профили настроек для многих распространённых комплектов памяти. Достаточно указать базовые характеристики комплекта – тип чипов, лежащих в его основе, версию печатной платы DIMM, объём модулей и их ранговость, – как программа предложит свою схему рекомендуемых таймингов, которую останется лишь перенести в BIOS Setup. Естественно, стабильность работы при этом не гарантируется, но в большинстве случаев DRAM calculator for Ryzen предлагает дельные варианты, которые, с одной стороны, нормально работают, а с другой – позволяют нарастить производительность на несколько процентов благодаря тщательно подобранным настройкам.
Узнать необходимые характеристики установленного в системе комплекта памяти можно с помощью другой утилиты — Thaiphoon Burner. Она поможет определить лежащие в основе модулей памяти аппаратные компоненты, указывать которые нужно в DRAM calculator for Ryzen.
Утилита DRAM calculator for Ryzen может предложить профили настроек не только для номинальной частоты памяти, но и для повышенной частоты, которые можно применить при разгоне модулей DDR4 SDRAM. Важно лишь предварительно убедиться, что имеющаяся память способна функционировать на такой частоте в принципе.
Как всё это работает и какой вклад вносит в производительность, мы проверили в следующем тесте, в рамках которого протестировали систему на Ryzen 7 5800X с имеющимися модулями DDR4-3600 компании Crucial несколько раз. При этом мы сравнили разные варианты их настройки: базовый – в режиме DDR4-3600 с таймингами, установленными по XMP; тайминги из профиля DRAM calculator for Ryzen и тайминги, подобранные вручную. Причём два последних варианта были использованы дважды: как в номинальном для памяти режиме DDR4-3600, так и при её разгоне до максимальной осмысленной частоты DDR4-3800.
Конкретные значения таймингов, которые получились в каждом таком случае, можно посмотреть при помощи ещё одной полезной утилиты — ZenTimings.
Производительность десктопных процессоров AND Ryzen всё ещё зависит от частоты и таймингов оперативной памяти. К счастью, часто «оперативку» можно разогнать, чтобы увеличить её частоты, снизить тайминги и добавить скорости процессору. В этой статье мы расскажем, как можно это сделать за короткое время, без десятков попыток подобрать оптимальные параметры для разгона. Мы расскажем вам о программе Ryzen DRAM Calculator.
Историческая часть. Как производительность памяти связана с процессорами AMD Ryzen
Первый раздел статьи будет посвящён краткой истории процессоров AMD Ryzen и расскажет о том, почему их производительность зависит от скорости памяти. Если вы уже в курсе технических подробностей, то можете смело его пропускать и переходить дальше.
Десктопные процессоры AMD Ryzen с самого своего появления оказались требовательны к оперативной памяти. Их максимальная производительность зависела от скорости работы оперативки и выставленных таймингов. Однако, если вы подумали, что для полного раскрытия Райзена стоит взять самую быструю память и дело с концом, то вынуждены вас огорчить. У данной темы много подводных камней, которые неочевидны для большинства пользователей.
У первых Райзенов, вышедших в 2017 году и построенных на архитектуре Zen, частота памяти была завязана на скорость работы шины Infinity Fabric, которая отвечала за взаимодействие между ядрами процессора. Иными словами, получить частоты для памяти свыше DDR4-3200 было сложно. Контроллер памяти, встроенный в CPU, оказался привередливым и на высоких частотах мог работать далеко не со всеми чипами. Поэтому стабильная частота RAM для процессоров Zen 1 составляет 2133 – 2400 МГц. Не очень много даже по тем временам.
К сожалению, с выходом новых Ryzen зависимость производительности CPU от частот и таймингов оперативки сохраняется. Сегодня при сборке системы с процессором Ryzen 5000-й серии подбор правильных модулей превратился из сложного квеста в обычный, но множество вопросов, связанных с разгоном остались. Разгон оперативки гораздо более сложная процедура, чем разгон CPU или GPU. Если для базового, самого простого разгона процессора, достаточно подобрать подходящий множитель напряжение, то с памятью ситуация гораздо сложнее. Для её правильного разгона надо подобрать правильные тайминги и множество других параметров. Чтобы сделать разгон оперативки проще, разработчик Юрий Бублий, также известный под ником 1usmus, создал утилиту Ryzen DRAM Calculator, которая рассчитает все параметры для вашей оперативки.
Теоретическая часть. Подготовка к работе с Ryzen DRAM Calculator
Чтобы Ryzen DRAM Calculator смог правильно рассчитать параметры тайминги, напряжения и другие параметры для вашей памяти, программе нужны вводные данные. Сперва необходимо выбрать процессор из выпадающего списка. Точная модель CPU не требуется (хотя её полезно знать), достаточно указать архитектуру. Если вы используете процессор с архитектурой Zen 3, то стоит выбирать пункт «ZEN 2 AM4 / sTRX4».
В следующем пункте «Memory Type» необходимо указать производителя и тип чипов памяти. Если у вашей оперативки нет радиаторов, то достаточно посмотреть на чип и поискать его модель в интернете. Если на планках памяти установлены радиаторы, то не стоит их снимать – это может повлечь за собой потерю гарантии. Тип чипов можно попробовать узнать по коду, напечатанному на наклейке производителя.
За последнее время сообщество пользователей Ryzen научилось распознавать чипы по кодам памяти G.Skill, Corsair и Patriot. Кстати, лучше всего для разгона подходят чипы Samsung B-die и Micron Rev.E.
Далее понадобится выбрать тип печатной платы, в пункте «DRAM PCB revision». Существует несколько ревизий планок, а определить точную версию можно по расположению микросхем на плате.
Если планка закрыта радиаторами, то оценить расположение чипов можно, взглянув на неё сбоку или снизу. На платах на платах А0 чипы располагаются по всей ширине планки и находятся на одинаковом расстоянии друг от друга. Планки A1 чаще всего используются в OEM-сборках и почти не встречаются в магазинах. А у памяти A2 чипы расположены двумя группами по 4 штуки в каждой. Пункты Bad Bin и Manual в данный момент можно не выбирать, если вы не используете самую дешёвую память с чипами, отбор которых на заводе не производился. Если сомневаетесь в своей памяти, то выберете вариант A0/B0. Если разгон будет неудачным, то можно вернуться к этому пункту и выбрать Bad Bin.
Затем нужно указать ранговость. Память может быть как одноранговой, так и двухранговой. Определить ранговость памяти можно при помощи AIDA64, сделав общий отчёт о системе, сохранив его в HTML-файл и выполнить поиск по слову «Ranks».
Затем необходимо выбрать тактовую частоту, которую вы хотите получить, указать количество модулей и выбрать чипсет. Если вы используете процессоры семейства Threadripper, то каждый пункт из подменю «Dimm Modules» нужно умножать на два. Так как платы для «Тредрипперов» рассчитаны не на 4, а на 8 планок оперативки.
После того, как все параметры будут введены, нам остаётся нажать одну из двух кнопок: «Calculate SAFE» или «Calculate FAST». Кнопка «Calculate SAFE» рассчитает наиболее безопасные значения для оперативки – с ними больше вероятности на успешный разгон. Клавиша «Calculate FAST» найдёт самые быстрые тайминги для максимальной производительности. Только стоит учитывать, что полученные результаты не гарантируют успешный разгон. Не каждая материнская плата позволит взять высокую частоту памяти, кроме того многое зависит от самих модулей.
После расчёта Ryzen DRAM Calculator показывает нам высчитанные тайминги, напряжения и остальные параметры системы, которые надо поменять в BIOS. Ещё раз напомним, что выставленные параметры не гарантируют успешного разгона, это всё ещё кремниевая лотерея. Многое зависит от экземпляра процессора и чипов оперативки.
В середине окна Ryzen DRAM Calculator указаны тайминги, которые надо выставить в BIOS. Если вы хотите сравнить их с таймингами, установленными в данный момент, то можно нажать на бирюзовую кнопку «Compare Timings». Выставленные тайминги могут быть окрашены в несколько цветов, в зависимости от своего значения. Красный цвет говорит о том, что используемая величина опасна – может вызвать нестабильный разгон или отказ запуска системы. Оранжевый означает пограничные значения, которые можно попробовать поменять в лучшую сторону. Зелёный цвет означает безопасную зону, а бирюзовый – абсолютную безопасность и стабильность системы.
Справа от таймингов расположены основные напряжения и параметры системы. В разделе Voltage Block (Voltage Range) перечислены основные напряжения системы, которые надо поменять для успешного разгона. Помимо напряжения памяти (DRAM Voltage) необходимо изменить напряжение на контроллере памяти (SOC Voltage), напряжение шины Infinity Fabric для чиплета (VDDG CCD Voltage и VDDG IOD Voltage), а также cLDO VDDP Voltage – напряжение на интерфейсе физического уровня DDR4. Для каждого параметра представлено три вида напряжений: минимальное, рекомендуемое и максимальное. Лучше всего начать с минимальных значений и перейти к рекомендованным, если разгон был неудачным. Особенно стоит обратить внимание на напряжения в красной зоне. Слишком высокое напряжение либо не позволит вам разогнать память, либо в крайнем случае – спалит модули оперативки или контроллер памяти процессора. Красные значения напряжений при любом разгоне используются на ваш страх и риск.
В разделе Misc items перечислены вспомогательные параметры, как можно догадаться из названия раздела. Режим Power Down Mode в выключенном состоянии снижает задержки при работе с памятью, он отвечает за энергопотребление. Gear Down Mode при включении снижает скорость передачи данных в оперативной памяти, и также при выключении позволяет устанавливать нечётные тайминги. BGS и BGS Alt отвечают за способы назначения физических адресов памяти для приложений. Command rate это задержка между этапами работы оперативки, а FCLK – частота шины Infinity Fabric. Последний параметр актуален для процессоров с архитектурой Zen 2 и Zen 3.
Раздел Termination block отвечает за значения терминации сигналов памяти. В нём собраны значения сопротивлений RTT_NOM, RTT_WR, RTT_ PARK. В последнем разделе собраны значения терминации сигналов шины.
Во втором окне под название Advanced содержатся дополнительные настройки. Использовать их или нет – дело личное. Если с разгоном с параметрами из первого окна ничего не выходит, то стоит попробовать поменять параметры из вкладки Advanced.
Блок Main Voltages отвечает за основные напряжения. VTT DDR Voltage min и VTT DDR Voltage max обозначает минимальное и максимальное напряжения, используемые для достижения высокой скорости передачи данных и поддержания целостности сигнала. Boot DRAM Voltage – напряжение «тренировки» DDR при старте системы. Vref обозначает опорное напряжение оперативной памяти, обычно оно составляет половину от установленного напряжения памяти DRAM Voltage.
В блоке Debug Voltages перечислены отладочные напряжения. VDDP Voltage и VPP (VPPM) Voltage обозначают напряжения транзистора, определяющего надёжность доступа к содержимому памяти и напряжение для доступа к строке RAM соответственно. PLL Voltage – напряжение системы питания фазовой автоподстройки частоты. Оно актуально при разгоне системы по шине (BCLK).
Блок CAD_BUS Timings показывает задержки транссивера, который является аналогом блока RTL/IOL от Intel. Блок Memory Interleaving + tweaks отвечает за чередование блоков оперативной памяти. Настройки из последнего блока могут повысить стабильность системы, однако, не все параметры из «калькулятора» могут присутствовать в BIOS.
Последний блок, PMU Training, связан с тренировкой памяти при загрузке. Если память разогнать не получается и другие варианты не помогают, попробуйте установить настройки из данного блока.
Третья вкладка – Advanced Calculators – нужна для точно расчёта таймингов и напряжений. Она пригодится для продвинутых пользователей. И если вы не знаете, какой параметр за что отвечает, то лучше обойти Advanced Calculators стороной.
Раздел Power Supply System отображает текущие параметры питания системы и связанные с ними настройки. Менять или рассчитывать здесь нечего. Указанные настройки нужны для стабильной подачи питания на CPU, RAM и SoC.
Раздел MEMbench – это встроенный бенчмарк для оперативной памяти, созданный на основе одноимённого бенча MEMbench. В блоке Setting задаются параметры тестирования: объём памяти для теста, режим работы бенчмарка. Количество потоков, параметр Task Scope (объем задачи в процентах) и метод завершения теста можно задать если перевести бенчмарк в ручной режим. Встроенный бенчмарк пригодится для оценки работоспособности памяти и проверки разгона.
Окно FreezeKiller – небольшой бонус от автора «калькулятора». При активации «киллера» из игры должны пропасть фризы. Однако результат в 100% автор твика не гарантирует.
Практическая часть. Выбор параметров и разгон памяти
Опробуем Ryzen DRAM Calculator на оперативной памяти DDR4-4000 G.SKILL Trident Z Royal. Комплект состоит из двух планок объёмом 8 Гбайт каждая и может работать на частоте 4000 МГц. Это одноранговая памяти, её планка относится к ревизии A2, а используемые чипы Samsung B-Die обещают высокий разгонный потенциал. Точный состав тестового стенда:
- Процессор: AMD Ryzen 5 5600X;
- Материнская плата: ROG Crosshair VIII Dark Hero;
- Система охлаждения: ROG RYUJIN 360;
- Видеокарта: ROG Strix Radeon RX 6700 XT;
- Накопитель: 1 Тбайт WD Blue SN550 NVMe;
- Блок питания: ROG Thor 1200W Platinum;
- Монитор: ROG Swift PG279Q;
- Операционная система: Windows 11 Pro, 64 bit;
Архитектура Zen 3 устроена таким образом, при частоте оперативки до 3800 МГц, тактовая частота контроллера памяти равна тактовой частоте памяти. Но как только частота оперативки перевалит за 3800 МГц, тактовая частота контроллера делится на два, чтобы система могла запуститься. На практике это приводит к проблемам – система может работать замедленно и нестабильно. К сожалению, во время нашего разгона мы столкнулись с тем, что даже при активной частоте в 3200 МГц частота контроллера делилась на два. Вероятно дело в том, что BIOS опознал DDR4-4000 как быструю память и решил, что она всегда будет работать с частотой в 4000 МГц. После того, как мы принудительно отключили деление частоты у контроллера – всё пришло в норму. Система загружалась с первого раза и работала стабильно даже при частоте DDR4-4400 МГц.
Тестирование проводилась на трёх частотах. Первая – DDR4-3200, которую можно назвать базовой частотой для производительного игрового или рабочего компьютера. Вторая тактовая частота DDR4-3866, считается максимумом для Ryzen DRAM Calculator, а частоту DDR4-4400 мы получили в ходе последующего ручного разгона, при котором увеличивали частоту памяти самостоятельно, не трогая тайминги и другие параметры.
Согласно результатам тестов AIDA64, самый большой прирост производительности случился после перехода с частоты 3200 МГц до 3866 МГц. Дальше, при переходе к частоте DDR4-4400 прирост производительности замедлился. Это можно объяснить тем, что Ryzen DRAM Calculator не высчитывал тайминги для более высокой частоты. Ручной поиск таймингов потребовал бы длительного разгона и тестирования. Прирост производительности в бенчмарках Performance Test, Super Pi и 3DMark был линейным.
Заключение
Успешный разгон памяти это совокупность многих параметров, в том числе, возможностей материнской платы. Но теперь есть утилита Ryzen DRAM Calculator, которая берёт на себя большую часть работы по разгону. Она сама высчитает оптимальное напряжение, тайминги, сопротивления и другие параметры. Единственная сложность кроется в определение параметров вашей оперативной памяти. Но и эту проблему можно решить при помощи программ, упомянутых в данной статье. Таким образом, Ryzen DRAM Calculator не повелитель звезд на вашей карте разгона, но она определенно поможет вам проложить уверенную тропинку, чтобы вы не запутались по дороге в куче незнакомых параметров. Если вы хотите разогнать оперативную память на системе AMD, но не знаете с чего начать, попробуйте программу Ryzen DRAM Calculator, вероятно она поможет решить вашу задачу.
Понравилась статья? Попробуй новые форматы нашего издания
Мы снимаем видеообзоры с живыми эмоциями автора, тестированием игр и розыгрышами!
Привет, GT! Все мы любим новое железо — приятно работать за быстрым компьютером, а не смотреть на всякие прогрессбары и прочие песочные часики. Если с процессорами и видеокартами всё более-менее понятно: вот новое поколение, получите ваши 10-20-30-50% производительности, то с оперативкой всё не так просто.
Где прогресс в модулях памяти, почему цена на гигабайт почти не падает и чем порадовать свой компьютер — в нашем железном ликбезе.
Стандарт памяти DDR4 имеет ряд преимуществ перед DDR3: большие максимальные частоты (то есть пропускная способность), меньшее напряжение (и тепловыделение), и, само собой, удвоенная ёмкость на один модуль.
Комитет инженерной стандартизации полупроводниковой продукции при Electronic Industries Alliance (более известный как JEDEC) трудится над тем, чтобы ваша оперативная память Kingston подходила к материнской плате ASUS или Gigabyte, и по этим правилам играют все. По части электрики, физики и разъёмов всё жёстко (оно и понятно, нужно обеспечить физическую совместимость), а вот в отношении рабочих частот, объёмов модулей и задержек в работе правила допускают некоторую волатильность: хотите сделать лучше — делайте, главное, чтобы на стандартных настройках у пользователей не было проблем.
Именно так получились в своё время модули DDR3 с частотой выше, чем 1600 МГц, и DDR4 с частотами выше 3200 МГц: они превышают базовые спецификации, и могут работать как на «стандартных» параметрах, совместимых со всеми материнскими платами, так и с экстремальными профилями (X.M.P.), протестированными на заводе и зашитыми в BIOS памяти.
Прогресс
Основные улучшения в этой сфере ведутся сразу в нескольких направлениях. Во-первых, производители непосредственно микросхем памяти (Hynix, Samsung, Micron и Toshiba) постоянно улучшают внутреннюю архитектуру чипов в пределах одного техпроцесса. От ревизии к ревизии внутреннюю топологию доводят до совершенства, обеспечивая равномерность нагрева и надёжность работы.
Во-вторых, память потихоньку переходит на новый техпроцесс. К сожалению, здесь нельзя проводить улучшения также быстро, как делают (делали последние лет 10) производители видеокарт или центральных процессоров: грубое уменьшение размеров рабочих частей, то есть транзисторов, потребует соответствующего снижения рабочих напряжений, которые ограничены стандартом JEDEC и встроенными в CPU контроллерами памяти.
Поэтому единственное, что остаётся — не только «поджимать» производственные нормы, но ещё и параллельно увеличивать скорость работы каждой микросхемы, что потребует соответствующего повышения напряжения. В итоге и частоты растут, и объёмы одного модуля.
Примеров такого развития много. В 2009-2010 году нормальным был выбор между 2/4 гигабайтами DDR3 1066 МГц и DDR3 1333 МГц на один модуль (обе были выполнены по 90-нм техпроцессу). Сегодня же умирающий стандарт готов предложить вам 1600, 1866, 2000 и даже 2133 МГц рабочих частот на модулях в 4, 8 и 16 ГБ, правда внутри уже 32, 30 и даже 28 нм.
К сожалению, подобный апгрейд стоит немалых денег (в первую очередь на исследования, закупку оборудования и отладку производственного процесса), так что ждать радикального уменьшения цены 1 ГБ оперативки до выхода DDR5 не придётся: ну а там нас ждёт очередное удвоение полезных характеристик при той же цене производства.
Цена улучшений, разгон и поиски баланса
Растущий объём и скорость работы напрямую влияет на ещё один параметр оперативной памяти — задержки (они же тайминги). Работа микросхем на высоких частотах до сих пор не желает нарушать законы физики, и на различные операции (поиск информации на микросхеме, чтение, запись, обновление ячейки) требуются определённые временные интервалы. Уменьшение техпроцесса даёт свои плоды, и тайминги растут медленнее, чем рабочие частоты, но здесь необходимо соблюдать баланс между скоростью линейного чтения и скоростью отклика.
Например, память может работать на профилях 2133 МГц и 2400 МГц с одинаковым набором таймингов (15-15-15-29) — в таком случае разгон оправдан: при большей частоте задержки в несколько тактов только уменьшатся, и вы получите не только увеличение линейной скорости чтения, но и скорости отклика. А вот если следующий порог (2666 МГц) требует увеличения задержек на 1-2, а то и 3 единицы, стоит задуматься. Проведём простые вычисления.
Делим рабочую частоту на первый тайминг (CAS). Чем выше соотношение — тем лучше:
2133 / 15 = 142,2
2400 / 15 = 160
2666 / 16 = 166,625
2666 / 17 = 156,823
Полученное значение — знаменатель в дроби 1 секунда / Х * 1 000 000. То есть чем выше число, тем ниже будет задержка между получением информации от контроллера памяти и отправкой данных назад.
Как видно из расчётов, наибольший прирост — апгрейд с 2133 до 2400 МГц при тех же таймингах. Увеличение задержки на 1 такт, необходимое для стабильной работы на частоте 2666 МГц всё ещё даёт преимущества (но уже не такие серьёзные), а если ваша память работает на повышенной частоте только с увеличением тайминга на 2 единицы — производительность даже немного снизится относительно 2400 МГц.
Верно и обратное: если модули совершенно не хотят увеличивать частоты (то есть вы нащупали предел для конкретно вашего комплекта памяти) — можно попытаться отыграть немного «бесплатной» производительности, снизив задержки.
На самом деле факторов несколько больше, но даже эти простые расчёты помогу не напортачить с разгоном памяти: нет смысла выжимать максимальную скорость из модулей, если результаты станут хуже, чем на средних показателях.
Практическое применение разгона памяти
В плане софта от подобных манипуляций в первую очередь выигрывают задачи, постоянно эксплуатирующие память не в режиме потокового чтения, а дёргающие случайные данные. То есть игры, фотошоп и всякие программистские задачи.
Аппаратно же системы со встроенной в процессор графикой (и лишённые собственной видеопамяти) получают значительный прирост производительности как при снижении задержек, так и при увеличении рабочих частот: простенький контроллер и невысокая пропускная способность очень часто становится бутылочным горлышком интегрированных GPU. Так что если ваши любимые «Цистерны» еле-еле ползают на встроенной графике старенького компа — вы знаете, что можно попробовать предпринять для улучшения ситуации.
Мэйнстрим
Как не странно, больше всего от подобных улучшений выигрывают среднестатистические пользователи. Нет, безусловно, оверклокеры, профессионалы и игроки с полным кошельком получают свои 0.5% производительности, применяя экстремальные модули с запредельными частотами, но их доля на рынке мала.
Что под капотом?
Белые алюминиевые радиаторы снять достаточно просто. Шаг нулевой: заземляемся об батарею или ещё какой металлический контакт с землёй и даём стечь статике — мы же не хотим дать нелепой случайности убить модуль памяти?
Шаг первый: прогреваем модуль памяти феном или активными нагрузками на чтение-запись (во втором случае вам надо быстренько выключить ПК, обесточить его и снять оперативку, пока она ещё горячая).
Шаг второй: находим сторону без наклейки и аккуратно подцепляем радиатор чем-нибудь в центре и по краям. Использовать печатную плату как основание для рычага можно, но с осторожностью. Внимательно выбираем точку опоры, стараемся избегать давления на на хрупкие элементы. Действовать лучше по принципу «медленно, но верно».
Шаг третий: открываем радиатор и разъединяем замки. Вот они, драгоценные чипы. Распаяны с одной стороны. Производитель — Micron, модель чипов 6XA77 D9SRJ.
8 штук по 1 Гб каждый, заводской профиль — 2400 МГц @ CL16.
Правда, дома снимать теплораспределители не стоит — сорвёте пломбу и плакала ваша пожизненная 1 гарантия. Да и родные радиаторы отлично справляются с возложенными на них функциями.
Попробуем измерить эффект от разгона оперативки на примере комплекта HyperX Fury HX426C16FW2K4/32. Расшифровка названия даёт нам следующую информацию: HX4 — DDR4, 26 — заводская частота 2666 МГц, C16 — задержки CL16. Далее идёт код цвета радиаторов (в нашем случае — белый), и описание комплекта K4/32 — набор из 4 модулей суммарным объёмом 32 ГБ. То есть уже сейчас видно, что оперативка незначительно разогнана ещё при производстве: вместо штатных 2400 прошит профиль 2666 МГц с теми же таймингами.
Помимо эстетического удовольствия от созерцания четырёх «Белоснежек» в корпусе вашего ПК этот набор готов предложить весомых 32 гига памяти и нацелен на пользователей обычных процессоров, не особо балующихся разгоном CPU. Современные Intel’ы без буквы K на конце окончательно лишились всех возможных способов получения бесплатной производительности, и практически не получают никаких бонусов от памяти с частотой выше 2400 МГц.
В качестве тестовых стендов мы взяли два компьютера. Один на базе Intel Core i7-6800K и материнской плате ASUS X99 (он представляет платформу для энтузиастов с четырёхканальным контроллером памяти), второй с Core i5-7600 внутри (этот будет отдуваться за мэйнстримовое железо со встроенной графикой и отсутствующим разгоном). На первом проверим разгонный потенциал памяти, а на втором будем измерять реальную производительность в играх и рабочем софте.
Разгонный потенциал
Со стандартными профилями JEDEC и заводским X.M.P. память имеет следующие режимы работы:
DDR4-2666 CL15-17-17 @1.2V
DDR4-2400 CL14-16-16 @1.2V
DDR4-2133 CL12-14-14 @1.2V
Легко заметить, что настройки таймингов под 2400 МГц делают память не такой отзывчивой, как профили 2133 и 2666 МГц.
Лучший результат, который удалось достичь с тестовым комплектом из 4 модулей — 2666 МГц при таймингах CL13-14-13. Это существенно увеличит скорость доступа к случайным данным (2666 / 13 = 205.07) и должно показать неплохое улучшение результатов в игровом бенчмарке. В двухканальном режиме память разгоняется лучше: специалисты из oclab ухитрились довести комплект из двух 16 Гб модулей до частоты 3000 МГц @ CL14-15-15-28 с подъёмом напряжения до 1.4 Вольта — отличный результат.
Натурные испытания
Для нашего i5 со встроенной графикой в качестве бенчмарка мы выбрали GTA V. Игра не молодая, использует API DirectX 11, который давно известен и отлично вылизан в драйверах Intel, любит потреблять оперативную память и нагружает систему сразу по всем фронтам: GPU, CPU, Ram, чтение с диска. Классика. Вместе с этим GTA V использует т.н. «отложенный рендеринг», благодаря которому время расчёта кадра меньше зависит от сложности сцены, то есть методика испытания будет чище, а результаты — нагляднее.
За средний FPS возьмём значения, укладывающиеся в нормальное течение игры: пролёт самолёта, езда в городе, уничтожение супостатов имеют равномерный профиль нагрузки. По таким сценам (отбросив 1% лучших и худших результатов из массива данных) и получим средне-игровой FPS.
Просадки определим по сценам со взрывами и сложными эффектами (водопад под мостом, закатные пейзажи) аналогичным образом.
Подлагивания и неприятные фризы при резкой смене окружения (переключение от одного тестируемого случая к другому) случаются даже на монструозной GTX 1080Ti, постараемся их отметить, но в результаты не возьмём: в игре оно не встречается, и это, скорее, косяк самого бенчмарка.
Конфигурация демо-стенда
CPU: Intel Core i5-7500 (4c4t @ 3.8 ГГц)
GPU: Intel HD530
RAM: 32 GB HyperX Fury White (2133 МГц CL12, 2666 МГц CL15 и 2666 МГц CL13)
MB: ASUS B250M
SSD: Kingston A400 240 GB
Для начала выставим стандартные частоты X.M.P.-профиля: 2666 МГц с таймингами 15-17-17. Встроенный бенчмарк GTA V выдаёт идентичный FPS и одинаковые просадки на минимальных и средних настройках в разрешении 720p: в большинстве сцен счётчик колеблется в районе 30–32, а в тяжёлых сценах и при смене одной локации на другую FPS проседает.
Причина очевидна — мощностей GPU достаточно, а вот блоки растеризации просто не успевают собрать и отрисовать большее число кадров в секунду. На «высоких» настройках графики результаты стремительно ухудшаются: игра начинает упираться непосредственно в скромные вычислительные возможности интегрированной графики.
2133 МГц CL12
Собственной памяти у GPU нет, и он вынужден постоянно дёргать системную. Пропускная способность DDR4 в двухканальном режиме на частоте 2133 МГц составит 64 бит (8 байт) × 2 133 000 000 МГц × 2 канала — порядка 34 Гб/с, с небольшими (до 10%) накладными потерями.
Для сравнения, пропускная способность подсистемы памяти у самой скромной дискретной карточки NVIDIA GTX 1030 — 48 Гб/с, а GTX 1050 Ti (которая легко выдаёт в GTA V 60 FPS на максимальных настройках в FullHD) — уже 112 Гб/с.
На заднем плане виден тот самый водопад под мостом, просаживающий FPS во внутриигровом бенчмарке.
Результаты бенчмарка просели до 28 FPS в среднем, а лаги при смене локаций и взрывах их ненапряжных просадок превратились в неприятные микрофризы.
2666 МГц CL13
Снижение таймингов значительно сократило время ожидания ответа от памяти, а стандартные результаты с данной частотой у нас уже есть: можно будет сравнить три бенчмарка и получить наглядную картину. Пропускная способность для 2666 МГц уже 21.3 Гб/с ×2 канала
40 Гб/с, сравнимо с младшей NVIDIA.
Максимальный FPS практически не вырос (0.1 не показатель и находится на грани погрешности измерений) — здесь мы всё ещё упираемся в скромные возможности ROP’ов, а вот все просадки стали менее заметны. В сценах с водопадом из-за высокой вычислительной нагрузки результат не изменился, во всех остальных — то есть на прогрузках, взрывах и прочих радостях, замедлявших работу видеоядра вырос в среднем на 10-15%. Вместо 25–27 кадров в нагруженных событиями эпизодах — уверенные 28–29. В целом игра стала ощущаться значительно комфортнее.
TL;DR и результаты
Нельзя оценивать скорость работы оперативной памяти по одной только частоте. У DDR4 достаточно большие тактовые задержки, и при прочих равных стоит выбирать память не только удовлетворяющую потребности вашего железа по рабочей частоте и объёму, но и уделять внимание этому параметру.
Проведённые тесты показали, что компьютеры на базе Intel Core i-серии со встроенной графикой получают заметный прирост производительности при использовании высокоскоростной памяти с низкими задержками. Видеоядро не имеет собственных ресурсов для хранения и обработки данных и пользуется системными отлично отвечает (до определённого предела) на рост частоты и снижение таймингов, так как от скорости доступа к памяти напрямую зависит время отрисовки кадра со множеством объектов.
Самое важное! Линейка Fury выпускается в нескольких цветах: белом, красном и чёрном — можно подобрать не только быструю память, но и подходящую по стилю к остальным комплектующим, как делают специалисты из HyperPC.
Закон Кирхгоффа и немного магии школьного образования позволяют утверждать, что память с чёрными радиаторами несколько будет холоднее в работе, чем другие варианты. Ну а для неверующих в свяфтую Физику есть замечательный пруф на образовательном канале МИФИ.
Если с мэйнстримовыми решениями всё понятно, то в топовом сегменте, где каждый системник — маленькое произведение искусства применение памяти и накопителей HyperX из обычных продуктовых линеек — как знак качества. При создании каждого кастомного проекта приходится учитывать множество факторов: тепловые нагрузки, пожелания капризного клиента, распределение воздушных потоков, акустические вопросы (мощный компьютер и тихий мощный компьютер — задачи, отличающиеся по сложности на порядок). HyperPC постоянно совершенствуют свои технологические процессы и остаются верны надёжным комплектующим — отсюда и превосходные результаты в их уникальных сборках. Но если вы предпочитаете готовым компьютерам — самобсор, то подобный комплект или одиночные модули HyperX Fury DDR4 можно приобрести в сети Юлмарт.
На этом всё, но мы не прощаемся. Прохладному лету — горячие темы, подписывайтесь на наш блог и все интересности не пройдут мимо.
1 — Из-за особенностей российского законодательства «пожизненная» гарантия будет действовать всего 10 лет со дня приобретения. Впрочем, в масштабах компьютерного железа с текущими темпами развития технологий и 10 лет срок не малый, а там и законодательство может измениться.
Читайте также: