Что такое odt памяти
В последние годы индустрия DRAM выглядит одной из наиболее скандальных отраслей hi-tech, по напряженности конкуренции сравнявшись с битвами процессорных гигантов. Почти все компании-производители чипов памяти балансируют на грани рентабельности, а некоторые — сводят концы с концами лишь благодаря миллиардным кредитам (которые рано или поздно придется отдавать).
Прогноз на 2003 год вновь показывает значительное превосходство предложения над спросом (6%), что не может не провоцировать ценовые войны и вытекающие из них проблемы для производителей. В этой ситуации в выигрыше оказываются те, кто предлагает на рынке наибольший спектр решений, получая более высокий доход от продажи высокопроизводительных типов памяти, не обязательно имеющих высокую себестоимость. Известно, что производство чипов SDR и DDR SDRAM обходится компаниям примерно в одинаковую сумму, но рыночная конъюнктура такова, что цены на DDR почти вдвое выше. В таких условиях многие производители чипов негативно относятся к технологиям пусть даже весьма быстрой и технически продвинутой памяти, но дорогой в производстве, особенно когда за каждый изготовленный чип приходится платить лицензионные отчисления (пример — DRDRAM). Между тем разрыв между производительностью процессоров и RAM продолжает увеличиваться. Сравнение мультимедиа-компьютера класса hi-end на базе Pentium MMX 233 с памятью PC66 SDRAM (1997 год) и современного монстра с Pentium 4 3,06 ГГц и PC2700 DDR показывает, что если частота процессоров выросла в тринадцать раз, то время доступа к оперативной памяти уменьшилось только в 2,5 раза, а скорость передачи данных возросла лишь впятеро. В целом ситуация с течением времени ухудшается, что ясно видно на примере эволюции процессорных тестов: если ранние тестовые программы использовали очень малые объемы памяти и давали хорошую оценку быстродействия компьютеров на реальных задачах, то современные тесты (например, SPEC CPU2000), претендующие на объективность, все больше и больше зависят не столько от скорости самого процессора, сколько от мощи его подсистемы памяти. Большинство компьютеров не могут рассчитывать на десятки мегабайт высокоскоростной и дорогостоящей SRAM в качестве кэша энного уровня или на контроллеры, объединяющие пропускную способность множества каналов памяти, как у их двоюродных братьев из мира hi-end-серверов. Единственный выход — создание быстродействующей, компактной и недорогой оперативной памяти. Таким образом, производители процессоров кровно заинтересованы в появлении новых, все более быстрых типов RAM и в ряде случаев оказывают значительное влияние на продвижение более перспективных стандартов. В действительности любой современный стандарт DRAM представляет собой компромисс между потребностью в высокоскоростной оперативной памяти и возможностями/желаниями ее производителей, во многом обусловленными рыночной конъюнктурой. Сейчас Intel и многие ведущие компании-производители микросхем памяти (Samsung, Micron, Elpida и другие) пришли к согласию относительно выбора наследницы DDR SDRAM — с их точки зрения, в 2004-05 годах DDRII должна стать доминирующим типом памяти для настольных компьютеров, серверов и рабочих станций.
Попробуем разобраться, почему же эта технология так важна и что принесет нам новая память DDRII SDRAM, не забывая при этом, что чаще всего побеждают не самые быстрые и совершенные технологии, а наиболее целесообразные экономически.
На первый взгляд, DDRII выглядит просто как улучшенная DDR SDRAM — с увеличенными частотами, уменьшенным энергопотреблением и набором новых функций (ключевые характеристики DDRII и DDR SDRAM приведены в таблице ниже). Но в действительности под привычными очертаниями скрывается совершенно иная архитектура.
Сравнительная характеристика DDRII и DDR SDRAM | ||
DDRII SDRAM | DDR SDRAM | |
Скорость передачи данных (на рязряд), Мбит/с | 400/553/(667) | 200/266/333/(400) |
Частота работы ядра, МГц | 200/266/333 | 100/133/166/(200) |
Размер предвыборки, бит | 4 | 2 |
Длина пакета | 4/8 | 4/8 |
Строб данных | дифференциальный | одиночный |
Напряжение питания, В | 1,8 | 2,5 |
Интерфейс ввода-вывода | SSTL _ 18 | SSTL _ 2 |
Энергопотребление (max), мВт | 304 (на 533 Мбит/с) | 418 (на 266 Мбит/с) |
Упаковка чипов | FBGA (без свинца) | TSOP(II) |
Тайминги, набор команд | то же, что и у DDR SDRAM | — |
Предвыборка 4 бит (4-bit Prefetch)
Идея такова: при неизменной внутренней частоте ядра памяти частота буферов ввода-вывода удваивается; при этом за каждый такт передается два блока данных (как в обычной DDR). Получается, что по сравнению с частотой синхронизации ядра ввод-вывод данных осуществляется на четырехкратной скорости. Гениальное изобретение, позволяющее одним махом решить все проблемы микроэлектронной промышленности? Не совсем. Хотя благодаря этому ухищрению скорость потокового ввода-вывода действительно учетверяется, латентность преимущественно определяется собственной частотой ядра, а она для 400-МГц DDRII, как и для PC1600 DDR SDRAM и бабушки PC100 SDRAM, по-прежнему равна 100 МГц. Становятся понятными необычно большие тайминги (тройка CL, tRCD, tRP) DDRII: как вам 4-4-4 схема работы DDRII 400?! Все задержки приводятся для частоты буферов, то есть той частоты, с которой память общается с контроллером (чипсетом), а она в нашем случае в два раза больше реальной частоты ядра. Поэтому 4-4-4 для DDRII 400 соответствует 2-2-2 для DDR PC1600 или SDR PC100, что составляет 20 нс. Разумеется, увеличивать частоту буферов, занимающих несколько процентов общей площади кристалла, проще, чем поднимать скорость всей памяти. Проще , как обычно, значит дешевле — и совсем не обязательно для нас с вами. Фактически производители чипов памяти в очередной раз получили прекрасную возможность продать PC100 в новой упаковке по цене DDRII 400 . Немного утешает, что энергопотребление модулей будет меньше (об этом ниже) и в массовое производство почти наверняка пойдет более быстрая память — уже DDRII 533 по сумме характеристик сегодня выглядит весьма привлекательно. На настоящий момент доступны 512-мегабитные чипы DDRII 400 и DDRII 533 4-4-4 от Samsung и Elpida; пиковая пропускная способность (недостижимая по ряду фундаментальных причин) модулей, собранных из них, составит примерно 3200 и 4300 Мбайт/с (как у 32-разрядных RIMM и QBM SDRAM). Заметим, что латентность 3-3-3 DDR400 SDRAM (PC3200) примерно соответствует латентности 4-4-4 DDRII 533. DDRII 400 — явный аутсайдер.
Я хочу обратить особое внимание на важные термины , такие как «procODT», «RTT» и «CAD_BUS», описать, на что они влияют, как их настраивать и что они могут нам рассказать.
Как я упоминал ранее, пользователи столкнулись с огромным количеством проблем, когда вышло первое поколение процессоров Zen. В обзорах была паника, а на форумах было очень мало настоящих экспертов. Единственная тема, которая была — «память плохо разгоняется». Через некоторое время появились первые пресеты от уважаемого Stilt, они стали чудом для сообщества AMD, но, тем не менее, секреты и зависимости не были раскрыты.
Один из самых частых вопросов, который можно найти в форумах о системах Ryzen: «От чего зависит разгон памяти?».
Итак, давайте разбираться. В нашем случае успех разгона зависит от трех компонентов: материнской платы, IMC (контроллера памяти) и самой памяти.
Материнская плата
Большинство плат на базе чипсетов AMD 300 серии имеют T-топологию, и максимальная тактовая частота памяти в большинстве случаев ограничена 3466 МГц. Но есть «фишка», которая позволить нам незначительно подвинуть этот предел. Настройка САПР.
Если нам удастся настроить САПР, то мы сможем получить 3600 МГц. Чтобы понять, почему разгон ограничен такой довольно низкой частотой, нужно взглянуть на печатную плату материнской платы.
Каждая сигнальная трасса на печатной плате является проводником, сигнальной линией, которая может повлиять на другие сигнальные линии. Кроме того, существует вероятность паразитных связей (паразитная индуктивность и высокочастотные помехи). Чтобы бороться с отрицательными связями, каждый разработчик материнской платы должен правильно спроектировать все сигнальные трассы.
Выше изображено такое изменение конструкции, которое добавляет «кривую», заменяя прямую линию. Это изменение может кардинально изменить возможности сигнальной линии.
Также форм-фактор, количество слоев печатной платы и состав проводников влияют на качество материнской платы. Для плат более дорогого сегмента часто выделяется больше времени на разработку и обычно используются более качественные базовые компоненты. Еще одним ключевым отличием материнских плат на чипсетах серии «X» является увеличенное количество слоев PCB (вместо 3–4 слоев мы имеем 6–8). Это, безусловно, влияет на те самые «паразитные связи». Зачастую на каждой мат плате на одном из краев будет набита надпись, которая свидетельствует о количестве слоев.
Умные слова это, конечно, интересно, но как распознать качественную материнскую плату? procODT. И чем ниже рабочий procODT, тем лучше результаты разгона, которые вы можете получить на этой материнской плате. Специально для лучшего понимания я создал несколько таблиц, которые могут продемонстрировать вам различия.
В результате мы видим колоссальную разницу между материнскими платами. Я считаю это одной из главных проблем пользователей. И в их выборе, я думаю, виноваты рецензенты материнских плат. За последние два года я не видел обзоров на YouTube, где были рассмотрены топология материнской платы и ее возможности. Рассматривалась коробка, ее содержимое, режимы RGB, как выглядит охлаждение VRM или какая красивая футболку надета на рецензента.
Нет обзоров, в которых вы найдете реальные расчеты возможностей VRM. Вместо этого используются числа, которые существуют только в даташитах при идеальных тестовых условиях и при 25 °C, с идеальным поверхностным монтажом. Одно значение умножается на другие. Вот и весь обзор. Но вернемся к нашей теме.
В качестве бонуса у меня есть еще две рекомендации для вас, на что стоит обратить внимание при покупке материнской платы:
- Это шаг напряжения для DRAM и шаг VTT DDR. Существуют платы с шагом VDRAM 0,01 В, а некоторые имеют 0,005 В. То есть в первом случае мы получаем 1,35 В, 1,36 В и т.д., а во втором случае получаем 1,35 В, 1,355 В, 1,36 В. Во втором случае мы значительно увеличим шансы на стабилизацию DRAM, так как у нас увеличилась гранулярность.
- Напряжение DRAM, которое вы устанавливаете в UEFI, не всегда будет точным. Это может быть ниже, это может быть выше. Иногда возникают ситуации, когда VTT DDR не соответствует половине реального напряжения DRAM. Вам нужно будет настроить другие значения соответственно. Напомним формулу VTT DDR = 1/2 * vDRAM. Платы с большей гранулярностью автоматически получают преимущество.
Оперативная память
Я часто слышу на форумах «там есть Samsung B-die, но они работают на низкой частоте и с огромным напряжением, этого не может быть, виновато AMD». Я объясню. Модуль RAM состоит не только из микросхем от конкретного производителя, но и из печатной платы (она тоже имеет определённое количество слоев), на которой мы найдем сотни сигнальных линий. Конденсаторы (обвязка) и, конечно, чип-биннинг оказывают огромное влияние.
Например, мы можем найти в магазинах оперативную память от Corsair — Vengeance RGB Pro 3600MHz C16, которая использует тот самый знаменитый B-die, но мы не найдем рекордов на этом продукте. Рассмотрим другой пример — G.Skill Sniper X F4-3400C16D, который не выглядит «вкусным» по сравнению с предыдущим комплектом от Corsair. Однако, если мы сравним результаты разгона, то получится что-то вроде 3200–3466 МГц с CL14 против 3666–3733 МГц с CL14 в пользу набора G.Skill. Поэтому при выборе оперативной памяти советую посетить форумы.
Нюанс. Так как модуль памяти несет на себе несколько чипов памяти, может возникнуть ситуация, когда один из чипов будет иметь иные вольт-частотные характеристики. Такие чипы могут потребовать на несколько шагов больше напряжения для стабилизации на определенной частоте, чем их братья и сестры. При этом другие микросхемы могут стать нестабильными из-за повышенного напряжения. Идеальным вариантом для пользователя является покупка набора с заводским разгоном более 3600 МГц. Это даст вам дополнительную гарантию того, что все чипы могут достигать целевой частоты (заводской бининг все же штука полезная).
Контроллер памяти
Оба поколения контроллеров памяти Ryzen в большинстве случаев ограничены частотой UCLK 1733–1766 МГц (от DDR-3466 до DDR-3525). Безусловно есть случаи, когда контроллер может работать и на более высоких частотах. Чтобы упростить жизнь нашему контроллеру памяти, можно использовать модули, способные работать с очень низким procODT, что значительно меняет согласование сигналов. Рабочий диапазон procODT, по словам AMD, находится в диапазоне 40–60 Ом. 68 Ом уже за пределами зеленой зоны. Стабильность в этой области будет сильно зависеть от настроек САПР (CAD_BUS) и качества материнской платы.
В приведенной выше таблице показано, как procODT / RTT может меняться с ростом частоты DRAM.
Дабы улучшить восприятие этой информации, представьте циферблаты механических часов. procODT будет считать часы, RTT_PARK будет считать минуты, а CAD будет действовать как секундная стрелка. Для каждой частоты циферблаты на часах будут показывать разные результаты. Но есть нюанс, так как AMD очень любит менять настройки контроллера памяти с каждым последующим микрокодом, есть вероятность, что наши «механические часы» сломаются.
Чтобы быть готовы к подобному повороту событий, мы должны проверить сначала соседние значения RTT_PARK и только затем попытаться изменить procODT. В большинстве случаев кардинальных изменений в прошивках PMU (контроллера памяти) нет. Так же вам не следует спешить менять САПР, поскольку в нем слишком много переменных, и вы можете потерять много времени, пытаясь стабилизировать систему. Существует несколько алгоритмов выбора САПР, но на данный момент я не могу с уверенностью сказать, насколько они эффективны. Я считаю, что САПР не может иметь кардинальных отличий от базовых значений 24-24-24-24, и в большинстве случаев одно из значений можно перемещать вверх или вниз. То есть опция 24-30-24-24 может иметь дополнительный запас безопасности для частоты 3466+ МГц.
Из моих предпочтений это 20-20-20-20, в данном режиме присутствует чуть больший запас «прочности», когда оперативная память подбирается к 52 градусам.
В будущем я постараюсь дополнить эту статью поиском идеального САПР.
Зависимость рабочего напряжения DRAM от procODT и RTT
Я провел небольшой тест, в котором использовал разные настройки для напряжения procODT и DRAM. Идея состоит в том, чтобы установить минимально возможное значение DRAM Voltage и избежать BSOD во время теста.
На основании результатов, полученных в этом простом и коротком тесте, мы можем сделать вывод: после изменения procODT стабильное рабочее напряжение DRAM может измениться. Также имеется небольшое влияние RTT на рабочее напряжение памяти.
Холодная загрузка или двойной старт
Нет пользователей процессоров Ryzen, которые не сталкивались с холодным или двойным стартом (иногда даже с тройным). Я могу сразу заверить вас, что в этом нет ничего плохого. Это тесно связано с тренировкой памяти. Когда система не может запуститься в первый раз, запускается алгоритм, который изменяет некоторые параметры, недоступные пользователю, и пытается запустить систему снова. На это явление могут влиять procODT, RTT и CAD.
Иногда внешний BCLK генерируют двойной старт (система тренируется на внутреннем BCLK, а затем на внешнем ). В любом случае, попробуйте следовать рекомендациям калькулятора.
Так же львиная доля успешной тренировки отводится CAD_BUS Timings. Это сложное название является настройкой задержек приемо-передатчика. Формулами я вас томить не буду, конкретные значения будут предлагаться калькулятором, начиная с версии 1.5.2.
Предупреждение 1: В данной статье не будет подробных материалов по настройке ODT, RTT и прочих параметров не относящихся к настройке таймингов и частоты, т.к. эти параметры индивидуальны для каждой системы и, как показывает практика, полезны лишь тем людям, которые готовы потратить много времени на их настройку вручную, чтобы получить максимум скорости ОЗУ.
реклама
Предупреждение 2: Не забывайте про опасность чрезмерного повышения напряжения, уровень рабочего напряжения индивидуален для каждого модуля ОЗУ, некоторые модули ОЗУ не терпят повышение напряжения выше номинального, и повышение напряжения на такие модули памяти может плохо сказаться на стабильности.
Предупреждение 3: Модули памяти не любят высокие температуры, при сильном разгоне следует организовать охлаждение для памяти, иначе неизбежно будут ошибки в работе, и не получится достичь максимальных результатов.
Дешевая 3070 Gigabyte Gaming - успей пока не началосьПредупреждение 5: Предыдущее предупреждение потерялось, оно не хотело брать ответственность за свои действия.
реклама
var firedYa28 = false; window.addEventListener('load', () => < if(navigator.userAgent.indexOf("Chrome-Lighthouse") < window.yaContextCb.push(()=>< Ya.Context.AdvManager.render(< renderTo: 'yandex_rtb_R-A-630193-28', blockId: 'R-A-630193-28' >) >) >, 3000); > > >);Вот и закончились предупреждения, время начать сначала, а именно с момента когда я собственно и пришел к универсальному методу разгона ОЗУ.
Данную предысторию можно пропустить при желании.
В далеком 2016 году у меня появился один интересный модуль, имя его: GeIL 16GB GP416GB2400C16SC (далее сокращенно GEIL), так же была еще Crucial 8GB CT8G4DFD8213, в те времена у меня была система Z170+6700K и опыта в разгоне DDR4 особого не было, мои результаты разгона были 2600 МГц для GEIL и 3100 МГц для Crucial.
Внешний вид GeIL 16GB GP416GB2400C16SC
После в 2017 году я перешел на B350+R5 1600 BOX, на первых биосах GEIL отказалась вообще работать, в то время как Crucial легко и просто взяла те же "3100 МГц" (3066 МГц) как и в паре с 6700K, после я прошил последний биос, который был на тот момент, и GEIL без проблем заработала, взяв по частоте 2666 МГц.
Уже в начале 2018 года я смог выжать из GEIL - 2933 МГц, благодаря настройке ODT, для GEIL требовалось ODT на уровне 80 Ом. Crucial даже с ручной настройкой ODT выше "3100 МГц" не получилось разогнать.
реклама
Сохранившиеся старые скриншоты GEIL 16GB + Crucial 8GB, 6700K Gammax 300 и R5 1600 BOX.
В том же 2018 году я перешел на 2600X и научился разгонять память по своему, калькуляторы вообще никак не могли помочь с разгоном GEIL, они всегда давали нерабочие параметры, с которыми GEIL не могла работать, советы других людей тоже ничем не помогали в разгоне таймингов (частотный потолок я ведь уже нашел).
Сложность разгона GEIL заключалась в том, что эта память имела 8 двухслойных чипов общим объемом 16GB, и любое ручное отклонение по таймингам от того, что контроллер подобрал на автомате, приводило обычно к нестабильности или вовсе невозможности запустить систему.
реклама
Сохранившаяся информация о модуле памяти GeIL 16GB GP416GB2400C16SC
Я обратил внимание на то, что система в автоматическом режиме на разных частотах устанавливает разные вторичные тайминги, и подумал: Почему бы не использовать тайминги от более низкой частоты на более высокой частоте? И мне это удалось.
После я предлагал друзьям и знакомым свой метод разгона памяти попробовать, в целом результаты положительные, если все правильно сделать, особенно если в системе установлена память, которую никто не обозревает, непонятно что за она, и чего ждать от нее (таких комплектующих, увы, большинство на рынке, по которым найти информацию крайне тяжело, либо невозможно по причине "скрытности" производителей некоторых).
Теперь можно перейти к принципу разгона:
Всего 5 этапов, 4 из них обязательны.
1) Поиск максимальной стабильной частоты ОЗУ.
- На данном этапе необходимо подобрать рабочее напряжение, найти максимальную частоту, при которой стабильно работает, ODT установить подходящее.
-RTT сопротивления можно проигнорировать и оставить на авто, мы ведь не собираемся максимум выжимать из памяти, потратив много времени.
- Тайминги на Авто, при необходимости поднять CL выше 16, бывает такое, что система не поднимает сама CL выше 16.
- Этот этап нужен просто для экономии времени в будущем.
2) Откат частоты ОЗУ от максимальной стабильной на 3-4 множителя.
- ODT и напряжение уже установлены, частота максимальная стабильная найдена, допустим, это будет 2933 МГц при 1.35в и 80 Ом ODT.
- Откат делаем, например, до частоты в 2666 МГц при 1.35в и 80 Ом ODT.
- Если разница частоты слишком большая, например, максимальная стабильная 3333 МГц, а откат нужно делать до 2666 МГц, то возможно потребуется изменить ODT, но это не точно.
- Не забываем делать перезагрузку перед следующим этапом!
3) Зафиксировать тайминги автоматически установленные.
- Мы сделали откат на более низкую частоту, в нашем случае 2666 МГц, теперь самое время записать/сфотографировать все тайминги, получившиеся на данной частоте.
- Устанавливаем все тайминги в биосе, кроме tRFC и таймингов без значения или со значением 0.
- И еще раз: tRFC и тайминги "без значения" / "установленные в 0" НЕ трогать на данном этапе! Это важно!
- Не забываем делать перезагрузку перед следующим этапом!
4) Поднять частоту ОЗУ обратно вверх.
- Мы установили все тайминги кроме tRFC и "без значения", теперь нам осталось только найти максимальную частоту, при которой все это дело будет работать.
- Первый этап нам сейчас экономит очень много времени, т.к. мы уже знаем максимальную частоту, выше которой не прыгнуть.
5) Ужимаем тайминги.
- Проверяем стабильность, по желанию ужимаем tRFC и тайминги уже вручную, для достижения более хороших результатов.
С теорией пожалуй разобрались, теперь начнем практику.
В качестве подопытного будет участвовать система:
CPU: AMD Ryzen 3 1200 @ 3849 MHz, 1.38v
Cooler: Кастомный на основе Titan TTC-NK34TZ/RF(BX), наполовину пассивный режим работы.
RAM: 2 x Samsung M378A1G43TB1-CTD
MB: MSI B450-A Pro Max (MS-7B86)
Дата выпуска модулей памяти: Неделя 47 / 2018 и Неделя 12 / 2019 (покупались в разное время)
Маркировка чипов памяти: SEC 910 K4A4G085WT BCTD
Испытуемые модули памяти без "радиаторов"
Подробная информация о модулях памяти Samsung M378A1G43TB1-CTD
*физически модули памяти установлены в слотах A2 и B2
Внешний вид системы на момент проведения разгона.
С информацией о модулях памяти и системе закончили, теперь поэтапный разгон на практике.
Внимание: т.к. я уже знаю максимальную стабильную частоту ОЗУ при заниженных таймингах, я не буду показывать максимальные частоты, на которых память нестабильно запускалась и работала.
Так же я не буду объяснять про настройку ODT и RTT, т.к. это не входит в рамки данной статьи, но для полноты картины я покажу конкретные значения на фото, конкретно для моей системы, с которыми все работает нормально у меня.
1 Этап:
- Мы нашли максимальную рабочую частоту стабильную, установили ODT для этой частоты, так же установили напряжения подходящие
- Для экономии времени сохраним в профиль разгона параметры, чтобы в случае последующих неудач сэкономить много времени, просто восстановив из профиля настройки.
- Проверяем, что все работает нормально
2 Этап:
- Делаем откат частоты, в моем случае 2866 МГц.
- Все настроенные параметры напряжений и ODT / RTT трогать не надо
3-4 Этап:
- Фиксируем тайминги, которые система автоматически установила для частоты 2866 МГц.
- tRFC и тайминги "без значения" не трогаем!
- Поднимаем частоту вверх, т.к. я уже знаю предел рабочий, я могу поднять частоту сразу до 3333 МГц используя тайминги от 2866 МГц.
- Проверяем стабильность, и если все нормально, то повышаем частоту выше.
- В моем случае разница частоты получается 466 МГц при неизменных таймингах.
- В любом другом случае разница частоты может оказаться другой, в зависимости от возможностей модулей памяти, системной платы и процессора, это нужно проверять индивидуально.
5 Этап:
- Поджимаем первичные тайминги, tRFC и, если позволяют модули памяти, можно поджать субтайминги (модули с двухслойными чипами памяти обычно не позволяют просто так это сделать)
- Проверяем стабильность и, если все нормально, то жмем дальше, либо правим параметры для достижения стабильности.
На этом разгон успешно завершен, никакие калькуляторы использовать не пришлось, и расчеты производить тоже необязательно, потому что мы работаем с параметрами, которые система подготовила сама.
Теперь перейдем к сводке результатов, которые во время разгона были собраны:
Итого мы получаем:
Разница частоты на автоматических таймингах между 2866 МГц и 3333 МГц достигает 16.3%, в то время как пропускная способность по данным AIDA64 поднимается всего лишь на
6%, не густо как-то.
Но картина полностью меняется, если зафиксировать тайминги на частоте 2866 МГц и поднять частоту до уровня 3333 МГц, в таком случае разница пропускной способности между 2866 АВТО и 3333 с таймингами от 2866 достигает уже
16%!
Еще больше разница выходит после ручного "дожима" таймингов на последнем этапе, уже целых
17% разница по отношению к 2866 МГц! И это при разнице частоты в
Преимущества данного метода разгона:
1) Не требуется калькулятор с формулами под рукой для расчета таймингов.
2) Отличные результаты, по сравнению с автоматической установкой таймингов контроллером памяти на высоких частотах.
3) Вероятность ошибки минимальна - мы просто используем то, что система сама настроила стабильно.
4) Не нужно прибегать к помощи программ-калькуляторов, которые, как правило, бесполезны во многих случаях и тратят очень много времени, заставляя перебирать скорее всего нерабочие параметры, которые могут не подходить в конкретном случае.
5) Метод работает всегда, разве что требует внимательности, чтобы не допустить ошибку на одном из этапов разгона.
А теперь немного полезной информации:
- ODT для двухранговой памяти обычно выше чем для одноранговой, в моем случае двухранговая память и рабочие значения у меня 60-68.6 Ом, в вашем случае могут быть другие значения в зависимости от системной платы, от модулей ОЗУ, от процессора.
Например, на Gigabyte B450 Aorus M рабочее значение ODT подходило к 50 Ом с этой же памятью. Поэтому не пытайтесь копировать значения ODT и RTT, оно индивидуально в каждом конкретном случае! И на данный момент я не могу ничего посоветовать универсального с настройкой данных параметров.
- Температура: модули памяти могут давать ошибки при сильном нагреве, именно поэтому у меня стоит над видеокартой 12см куллер, он одновременно сгоняет нагретый воздух с зоны врм, и подгоняет воздух к модулям памяти для охлаждения, так же он в радиатор процессора подгоняет дополнительно воздух.
По факту тройная польза от одного косо-установленного вентилятора на низких оборотах, не говоря уже о том, что он дополнительно обдувает текстолит видеокарты.
Воздушный поток кулера процессора направлен в зону передней панели*
| |
- Чистота и порядок: Иногда мешать разгону могут окисления на контактах ОЗУ, решение проблемы кроется в старом добром ластике.
Проектирование электронных устройств с применением быстрых модулей оперативной памяти DDR SDRAM требует особого внимания к проблеме целостности сигнала. В статье рассказывается о современном инструменте моделирования для решения такого рода задач.
Сегодня практически вся современная электроника оснащается модулями памяти. Серверы, компьютеры, смартфоны, игровые консоли, GPS-навигаторы и большинство других устройств спроектированы на основе процессоров и ПЛИС. Такие устройства требуют наличия высокоскоростной памяти с большой пропускной способностью каналов или памяти с двойной частотой передачи данных (DDR). С каждым новым поколением DDR SDRAM (синхронная динамическая память с произвольным доступом и удвоенной скоростью передачи данных) увеличивается скорость обмена данными, ёмкость, снижается энергопотребление памяти.
При проектировании печатных плат устройств с DDR памятью может возникать ряд сложностей, одной из которых является проблема целостности сигналов. В данной статье рассматриваются вопросы обеспечения целостности сигналов в устройствах, использующих DDR память.
Шумы и фазовое дрожание цифрового сигнала данных
При приёме/передаче тактового сигнала шины памяти от контроллера к микросхеме могут возникать различные помехи, обусловленные собственным джиттером передатчиков и приёмников, потерями в линиях передачи, шумами и наводками. Всё это приводит к появлению джиттера и искажению формы цифрового интерфейсного сигнала.
В качестве шума можно рассматривать любую нежелательную энергию, добавляемую к идеальному сигналу. Он может быть вызван наводками от соседних линий, плохо спроектированным каналом передачи, несогласованным импедансом и другими факторами, которые приводят к размыванию фронта импульсов. При отсутствии шума фактический сигнал идентичен идеальному.
Любое отклонение от идеальной формы сигнала влияет на его целостность. Отклонения по времени (джиттер) и отклонения амплитуды/напряжения (шум) также влияют на производительность системы. Если не обеспечить целостность сигналов, то система DDR будет использовать неверную информацию, что значительно увеличит интенсивность битовых ошибок BER (Bit Error Rate). В конечном итоге система будет работать некорректно и неэффективно.
Рассмотрим конкретный пример. Если инженер подключит передатчик к несогласованному приёмнику, находящемуся на некотором расстоянии от него, то форма сигнала будет похожа на ту, что представлена на рисунке 1a: здесь отчетливо видны «звон» на уровне 0,86 В и паразитные повышающие выбросы на уровне 1,75 В при сигнале 1,2 В. Все это может привести к сбою в работе логики DDR4 и, если печатную плату спроектировать с такой топологией, то со 100% вероятностью возникнут ошибки в потоке данных, что, в свою очередь может привести к некорректной работе системы.
Теоретически, можно решить проблемы со «звоном» и выбросами, сократив длину линии передачи, но, к сожалению, это редко работает на практике. Наиболее эффективным способом является согласование приёмника/передатчика по импедансу, в результате чего уменьшается уровень шумов, и форма сигнала становится значительно лучше (см. рис.1б).
Рис. 1. Топология, имеющая проблемы с качеством сигнала: а) до согласования б) после согласования
В связи с этим возникает вопрос, какой номинал согласования использовать и как его рассчитать, ведь даже небольшое изменение номинала может существенно повлиять на производительность системы. Единственный способ решить данную задачу – это симуляция, в частности, с помощью интерактивных помощников настройки согласования, используемых в HyperLynx.
Проблемы тайминга в DDRx
Поскольку параллельные шины, работающие на гигагерцовых частотах, такие как DDR3/4, всё чаще и чаще используются при проектировании печатных плат, проблемы целостности сигнала стоят особо остро. DDR3 SDRAM, например, существенно отличается в плане скорости работы и показателей частоты от DDR2: максимальная тактовая частота DDR2 составляет 800 МГц, а максимальная частота DDR3 – 1600 МГц. Благодаря снижению напряжения питания ячеек, создателям нового типа ОЗУ удалось снизить её энергопотребление на целых 15%, что, учитывая впечатляющие показатели DDR2, можно назвать настоящим прорывом. DDR3 использует сетевую «Fly-by» топологию командной/адресной/управляющей шины с внутримодульным (ODT) согласованием. В то же время DDR3 создает новые проблемы обеспечения целостности сигнала, в частности, связанные со схемами ODT, более высокими скоростями передачи данных и временнЫми искажениями.
Несмотря на то, что существуют контроллеры, которые выполняют автоматическую калибровку чтения/записи, оптимизируя временнЫе интервалы, разработчику необходимо обеспечить правильный тайминг. Временные границы в интерфейсах DDR3 настолько малы, что эмпирического подхода к оптимизации уже недостаточно, и для того, чтобы гарантировать работу интерфейса на высоких скоростях, необходим подробный анализ схемы.
Такие сложные временнЫе соотношения достаточно трудно проанализировать без помощи дополнительных инструментов. Чтобы идентифицировать и устранить возможные проблемы в целом или рассчитать сложные временнЫе соотношения, инженеры должны провести анализ причинно-следственных связей, что является сложной и трудозатратной задачей.
Анализ целостности сигналов DDR SDRAM систем
Комитетом инженерной стандартизации полупроводниковой продукции JEDEC утверждён список требований, которые должны соблюдаться при разработке качественных продуктов. Очень важно, чтобы DDR SDRAM соответствовали этим требованиям для обеспечения правильной работы и предотвращения проблем с целостностью сигнала. Однако проведение всех необходимых измерений и расчётов зачастую сопряжено со многими трудностями.
Иногда этих расчётов можно вообще избежать, строго следуя инструкциям по компоновке, предоставленным поставщиком контроллера. Но что, если такие рекомендации не могут быть выполнены из-за различных ограничений в конкретных проектах? Что делать, если на то, чтобы убедиться, соответствует ли проект всем рекомендациям и требованиям понадобится очень много времени? В таких ситуациях необходимо пользоваться инструментами для быстрой проверки проекта перед запуском его в производство.
С помощью HyperLynx DDR (см. рис.2) можно смоделировать весь канал DDR за одну итерацию. Для этого необходимо лишь привязать соответствующие модели устройств, которые доступны на сайтах производителей. После этого время настройки симуляции займет всего десять минут, что позволит в дальнейшем проводить моделирование без задержек.
Рис. 2. Моделирование с помощью интерактивного помощника HyperLynx DDR
Процесс настройки интуитивно прост, так как все параметры, необходимые для настройки имитации, запрашиваются помощником в интерактивном режиме. Пользователь просто вводит релевантную информацию, такую как выбор IBIS-моделей для контроллеров и устройств памяти, значения скорости передачи для циклов чтения/записи, ODT и др. Все созданные конфигурации могут быть сохранены для дальнейшего использования, что позволит сократить время настройки в будущих проектах. Моделирование может выполняться до или после трассировки, помогая определять требования к стэкапу печатной платы.
Анализ результатов моделирования
Моделирование включает в себя анализ целостности сигналов и синхронизацию всей шины DDR. По завершении процесса симуляции создаётся отчёт, который включает в себя данные о прохождении (не прохождении) проверок, в соответствии с информацией о конфигурации и данными, которые были введены в интерактивном помощнике. Результаты можно отфильтровать и должным образом организовать для внимательного изучения тайминга и проблемы целостности сигнала в циклах чтения/записи данных, в адресной и командной шинах или дифференциальных цепях. Все результаты отчёта привязаны к соответствующим данным моделирования, для быстрого доступа к средству просмотра графических осциллограмм сигналов.
Данные моделирования в пакетном режиме, созданные мастером DDRx, могут быть сохранены на диск, что позволяет использовать осциллограф HyperLynx для одновременной симуляции нескольких цепей и подробного изучения проблем целостности сигналов в автономном режиме.
Заключение
Память DDR SDRAM открывает новые возможности в разработке электронных устройств. Как и в случае с другими высокоскоростными интерфейсами, применение памяти DDR имеет ряд особенностей. Проблему целостности сигналов необходимо тщательно изучать для того, чтобы избежать лишних и дорогостоящих итераций при производстве изделий. Моделирование – отличный способ решения данной задачи, позволяющий учитывать эффекты на уровне платы, такие как изменения импеданса и задержки по времени, обеспечивая всесторонний контроль над интерфейсом памяти. Мощные инструменты анализа помогут добиться соответствия проектов рекомендациям JEDEC и быть уверенными в том, что конечный продукт будет работать с высокой производительностью и надёжностью.
HyperLynx DDR может использоваться совместно многими САПР проектирования печатных плат, включая PADS и Xpedition.
Оперативная память в сокращении может называться ОЗУ. Ее также называют оперативным запоминающим устройством, памятью с произвольным доступом, RAM. ОЗУ также можно ласково назвать «оперативкой». RAM логически состоит из ячеек памяти. Каждая ячейка хранит количество бит, равное степени двойки. 2^3=8 бит, 2^4=16 бит, 2^5=32 бит, 2^6=64 бит. У каждой ячейки памяти есть свой адрес. Адрес ячейки «оперативки» выглядит следующим образом: FFFFFFFFF.
Регистровой памятью (Registered DIMM, RDIMM) называют модули ОЗУ, которые имеют на «борту» отдельный регистр для адресов «оперативки» и команд.
Контроллер ОЗУ в процессоре обращается к регистрам, регистры же направляют информацию в микросхемы памяти. Такая организация «оперативки» позволяет увеличить количество модулей на канал RAM за счет снижения электрической нагрузки на контроллер памяти. Контроллер находится либо в северном мосту материнской платы, либо в процессоре. Также вдвое уменьшается емкость модулей памяти, если модуль содержит два регистра.
Регистровая память отличается от обычной, небуферизованной «оперативки», более высокими задержками при чтени и записи информации в модулях ОЗУ. Это происходит из-за того, что модули содержат дополнительный промежуточный узел — буфер. Чтение/запись производит контроллер памяти в процессоре или северном мосту материнской платы. Работа с этим узлом, естественно, требует дополнительного времени работы. Но при этом отметим то, что уменьшается нагрузка на процессор, так как буфер отвечает за непосредственную работу с банками памяти.
Каждый модуль ОЗУ содержит микросхему SPD (Serial Presence Detect). Данная микросхема содержит прошивку модуля памяти. Эта прошивка определяет работу более простых микросхем.
Регистровая и буферизованная память — одно и то же
Регистровая память — это буферизованная память. Как было обозначено выше — регистр — это буфер для адресов и команд при работе с памятью. Процессор или северный мост материнской платы отправляют данные, адреса ячеек памяти и команды. Регистры выполняют команды по указанным адресам.
Такая память стоит дороже обычной, небуферизованной памяти. Используется она исключительно в серверах, потому что позволяет получить больший объем памяти на один процессор в сервере.
Что такое FB-DIMM
FB-DIMM, Full Buffered Dual Inline Memory Module — полностью буферизованная DIMM — это планки ОЗУ DDR2. Плашки ОЗУ при этом используют последовательный интерфейс передачи данных между модулями памяти и контроллером «оперативки». В отличие от стандартных модулей RAM, они используют не 240-pin, а 96-pin из 240 возможных пинов. Такая организация работы позволяет организовывать с помощью контроллеров памяти большее количество каналов на материнской плате. Вплоть до 6 каналов. Данные модули памяти несовместимы с обычными планками «оперативки».
Последовательный интерфейс — это интерфейс передачи данных, при работе которого данные передаются по одному проводу или дорожке на печатной плате друг за другом. Таких проводов (дорожек) может быть несколько, но принцип передачи данных при этом не меняется.
Advanced Memory Buffer, AMB — микросхема, которая организует работу модулей памяти FB-DIMM. Эта микросхема располагается прямо на планке «оперативки».
В один канал памяти при такой организации работы модулей ОЗУ возможна установка до 8 планок «оперативки». Это позволяет, в случае с RAM DDR2, добиться емкости ОЗУ до 192 Гигабайт на один сервер.
В связи с тем, что микросхема AMB добавляет свои задержки в работу модуля памяти, данные плашки работают несколько медленнее модулей RDIMM, регистровой ОЗУ. Но, так как общее количество памяти в данном случае возрастает, то общая производительность системы также возрастает.
Краткая история оперативной памяти
Ниже приводится краткая история развития типов ОЗУ. Начинаем мы ее со времени выпуска памяти SDRAM. Это произошло в 1996 году. Пропускная способность данной RAM составила 1.1 GBps.
Следующей памятью в таблице указана память RDRAM. Она была выпущена в 1998 году. Это была абсолютно новая архитектура ОЗУ. Совершенно новый стандарт от фирмы Rambus. Было выпущено несколько поколений памяти. Она отличалась более высокими частотами, стабильными таймингами, вот только при этом задержки функционирования памяти были немного выше. К сожалению, данная память не выдержала конкуренции на рынке и вынуждена была сойти со сцены рынка памяти.
Следующими в таблице указаны линейки RAM DDR. Double Data Rate Synchronous Dynamic Random Access Memory — синхронная динамическая память с произвольным доступом и удвоенной скоростью передачи данных. Этот стандарт ОЗУ был выпущен на рынок в 2000 году. Данная память используется и на текущий момент. При этом развивается стандарт для достижения более высоких скоростей функционирования.
Последним типом RAM DDR, выпущенным на рынок, на данный момент является память DDR4.
Читайте также: