Hbm память что это
Память хранит визуальные ассеты, такие как текстуры и другую информацию, которую необходимо обработать графическому процессору, чтобы отобразить готовый кадр. В отличие от ГПУ, скорость работы и производительность видео памяти или VRAM может повышаться не так значительно, и сегодня мы расскажем о новейшем типе VRAM, под названием GDDR6X.
Видеопамять нового поколения
GDDR6X должна прийти на смену GDDR6, и еще более старой GDDR5 в видеокартах высшего ценового сегмента. Хотя обычная GDDR6 и появилась относительно недавно, вместе с картами RTX серии 2000 от NVIDIA и картами RX 5000 от AMD, новая, улучшенная версия видеопамяти разработана специально, чтобы не отставать от постоянно растущих требований к ГП. Причина, по которой производительность видеопамяти настолько важна, заключается в том, что вы можете иметь самый мощный в мире ГПУ, но, чтобы отрисовывать кадры достаточно быстро, ему нужно с чем-то работать.
Как работает видеопамять и почему GDDR6X изменит видеоигры?Поэтому, если VRAM не сможет достаточно быстро передать визуальные ассеты и другие критичные данные вашему ГП, то вы можете столкнуться с тормозами или даже вылетами. Как правило, более высокие разрешения и настройки графики, требуют большего количества видео памяти, для того чтобы хранить больше дополнительной информации. Вот почему вы можете часто видеть в рекомендациях для пользователей, стремящихся играть в разрешении 4K, выбирать версии карт с большим объемом VRAM.
При помощи PAM4 можно передавать сразу 2 бита информации за такт. Технология NRZ, в GDDR6 имеет всего два состояния - 0 и 1. PAM4 имеет четыре состояния 00, 01, 10 и 11. При помощи PAM4 можно передавать сразу 2 бита информации за такт.Но вместе с тем, также важна и высокая скорость для перемещения всех этих данных к ГП и от него, где в дело и вступает GDDR6X. В отличие от привычных каналов передачи данных, называемых шинами, которые передают данные по одному биту за раз, GDDR6X использует технологию под названием PAM4, которая представляет собой метод, позволяющий передавать сразу два бита информации при помощи четырех уровней амплитудно-импульсной модуляции.
Увеличенная пропускная способность
Передача двух битов одновременно, значительно увеличивает пропускную способность памяти. И поскольку только старшие графические решения могут обеспечить достаточное количество кадров в секунду при большом разрешении, то и GDDR6X используется во флагманских NVIDIA RTX 3090 и 3080, которые нацелены на разрешения 4Kи даже 8K.
Исходя из того, как много информации каждый модуль GDDR6X может хранить, пропускная способность RTX 3090 может составлять около 1 терабайта в секунду, в то время как 3080 обеспечивает все еще поразительные 760 гигабайт в секунду. Да, бОльшая емкость обеспечивает бОльшую пропускную способность.
Вместе с тем, в теории, технология PAM4 должна быть более энергоэффективна, поскольку она предполагает отправку двух бит за один такт. Это означает, что в будущем, игры в высоком разрешении будут не столь требовательны к блокам питания.
ГП и HBM память размещаются на одном интерпозере, через который могут взаимодействовать напрямую. ГП и HBM память размещаются на одном интерпозере, через который могут взаимодействовать напрямую.А что же с HBM памятью, которую называли технологией будущего? HBM или память с высокой пропускной способностью действительно выглядела так, как будто собиралась захватить рынок графических решений штурмом некоторое время назад, но она оказалась более сложной для производства, чем различные версии GDDR. Поэтому AMD, которая и разработала такой тип памяти, решила отказаться от нее в сериях карт RX 5000 и RX 6000.
Тем не менее, это не означает, что будущие варианты HBM не могут посоперничать с GDDR, ведь производители все еще работают над улучшением этой технологии. И в какой-то момент времени она может стать достаточно дешевой, чтобы вновь появится в потребительских решениях, а не в крупных дата центрах, которые используют ГПУ для неграфических задач, таких как машинное обучение. Однако сейчас, GDDR6X выглядит королем потребительских видеокарт.
HBM - High Bandwidth Memory - память с высокой пропускной способностью
Высокопроизводительный интерфейс ОЗУ для DRAM с многослойной компоновкой кристаллов в микросборке от компаний AMD и Hynix , применяемая в высокопроизводительных видеокартах и сетевых устройствах; основной конкурент технологии Hybrid Memory Cube от Micron . AMD Fiji и AMD Arctic Islands являются первыми видеопроцессорами, использующими НВМ .
HBM была стандартизирована JEDEC в октябре 2013 года как JESD235 , HBM2 стандартизована в январе 2016 года под кодом JESD235a . На середину 2016 года сообщалось о работах над HBM3 и более дешёвым вариантом HBM .
Компания AMD , как и компания ATI в годы своей жизни, в последние несколько лет была лидером по освоению новых типов графической памяти. Хотя продукты с поддержкой GDDR2 и GDDR3 первыми выпустили не они, но именно эта компания первой оснастила свои решения видеопамятью последних двух существующих стандартов ( GDDR4 и GDDR5 ). А новейший GDDR6 использовала первым Nvidia.
AMD начала разработку HBM в 2008 году чтобы решить проблему постоянно растущего энергопотребления и уменьшения форм-фактора памяти. Среди прочего, группой сотрудников AMD во главе с Брайаном Блэком разработана технологии упаковки интегральных схем в стек. Партнеры: SK Hynix , UMC , Amkor Technology и ASE были также вовлечены в разработку. Массовое производство началось на заводах Hynix в Ичхоне в 2015 году.
HBM обеспечивает более высокую пропускную способность при меньшем расходе энергии и существенно меньших размерах по сравнению с DDR4 или GDDR5 . Это достигается путём объединения в стек до восьми интегральных схем DRAM (включая опциональную базовую схему с контроллером памяти), которые соединены между собой с помощью сквозных кремниевых межсоединений и микроконтактных выводов.
Шина НВМ -памяти обладает существенно большей шириной по сравнению с памятью DRAM , в частности, НВМ- стек из четырёх кристаллов DRAM ( 4-Hi ) имеет два 128 -битных канала на кристалл — в общей сложности 8 каналов и ширину в 1024 бита, а чип с четырьмя 4-Hi-НВМ- стеками будет иметь ширину канала памяти в 4096 бита (притом ширина шины GDDR -памяти — 64 бита на один канал)
Видеокарта, которая использует HBM в разрезе. Сверху: видеопроцессор и многокристальные микросборки памяти HBM расположены на общем кремниевом пассивном кристалле « silicon interposer », который реализует электрическую связь процессора и памяти. Interposer через Package Substrate припаян к печатной плате графического ускорителя (внизу).
Разработка специального слоя, который способен вместить соединения большой плотности — кремниевой подложки (interposer). Этот слой похож на обычный кремниевый кристалл, в котором вместо некоей внутренней логики размещены исключительно металлические слои для передачи сигналов и питания между различными компонентами — этакий переходник. При производстве interposer используются возможности современных литографических процессов, позволяющих разместить очень тонкие проводники, которые практически невозможно вместить на традиционных печатных платах.
Использование такого слоя-переходника решает часть фундаментальных проблем по размещению широкой шины памяти, а также дает и другие преимущества. Так, вместе с решением проблемы маршрутизации проводников, эта кремниевая подложка позволяет разместить чипы памяти очень близко к GPU , но не прямо на кристалле, как применяется в случаях мобильных систем-на-чипе, например. Ведь подобное решение (package on package, или PoP) попросту невозможно для выделяющих значительное количество тепла графических процессоров.
А если поместить микросхемы памяти близко к графическому чипу, то и длинных соединений между ними не требуется, что упрощает конструкцию и предъявляет менее жесткие требования по питанию. Помещение чипов памяти вместе с основной логикой также выигрывает в повышении степени интеграции — большее количество функциональной логики можно собрать в одной упаковке, что уменьшает количество необходимой внешней обвязки. А достижение высокой степени интеграции — давний тренд в индустрии. Все постепенно интегрировалось в кристаллы: сначала кэш -память и FPU , затем чипсетная логика и графические ядра, а теперь вот и память перебирается поближе к вычислительным ядрам.
Еще один важный технологический момент в присоединении чипов HBM -памяти друг к другу заключается в создании соединений типа through-silicon vias (TSV). Если interposer решает задачу маршрутизации широкой ширины памяти для GPU , то этот тип соединений позволяет соединить стопку микросхем памяти в единый 1024 -битный стек. Причины для такого объединения нескольких чипов просты — облегчение производства и снижение количества отдельных устройств в системе. Главная сложность в том, что традиционные методы соединений, какие используются в упаковке PoP , не способны обеспечить достаточную плотность соединений, их должно быть очень много и они очень маленькие.
Поэтому проблема объединения стопки чипов DRAM была решена при помощи TSV-соединений. Обычные типы соединений позволяют соединить два слоя вместе, а TSV расширяет эти возможности, соединяя и дальнейшие кремниевые слои. С точки зрения производственного процесса, соединения типа TSV сложнее в производстве и объединение чипов DRAM в стеки является непростой технологической задачей. К стопке чипов памяти снизу присоединено еще и логическое ядро, которое отвечает за работу всех чипов DRAM в стеке и управляет шиной HBM между стеком и GPU .
Ну для начала давайте прочтем термин и разберемся, что такое видеопамять и о ее некоторых отличиях от ОЗУ , а также её разновидностях.
Это внутренняя оперативная память, отведённая для хранения данных, которые используются для формирования изображения на экране монитора.
При этом в видеопамяти может содержаться как непосредственно растровый образ изображения (экранный кадр), так и отдельные фрагменты как в растровой (текстуры), так и в векторной (многоугольники, в частности треугольники) формах.
Как правило, чипы оперативной памяти современной видеокарты припаяны прямо к текстолиту печатной платы, в отличие от съёмных модулей системной памяти, которые вставляются в стандартизированные разъёмы ранних видеоадаптеров.
При изготовлении видеокарт уже достаточно давно используется память GDDR3 . На смену ей пришла GDDR4 , которая имеет более высокую пропускную способность, чем GDDR3 ; однако GDDR4 не получила широкого распространения вследствие плохого соотношения «Цена-производительность» и ограниченно использовалась лишь в некоторых видеокартах верхнего ценового сегмента (например Radeon X1950XTX, HD 2900 XT, HD3870 ). Далее появилась память GDDR5 , которая по состоянию на 2012 год является наиболее массовой, GDDR3 используется в бюджетном сегменте. В 2018 году в топовых видеокартах устанавливается память типа HBM и HBM2 , GDDR5X и GDDR6 .
Также видеопамять отличается от «обычной» системной ОЗУ более жёсткими требованиями к ширине шины.
Графическая шина данных — это магистраль, связывающая графический процессор и память видеокарт.
Имеет значение соотношение количества памяти, её типа и ширины шины данных: 512 МБ DDR2 , при ширине шины данных в 128 бит , будет работать медленнее и гораздо менее эффективно, чем 256 МБ GDDR3 при ширине шины в 128 бит и т. п. По понятным причинам, 256 МБ GDDR3 с шириной шины 256 бит лучше, чем 256 МБ GDDR3 с шириной шины в 128 бит и т. п.
Также стоит учитывать, что из-за относительно невысокой стоимости видеопамяти многие производители видеокарт устанавливают избыточное количество видеопамяти ( 4, 6 и 8 Гбайт ) на слабые видеокарты с целью повышения их маркетинговой привлекательности .
GDDR5 более подробно
GDDR5 — 5-е поколение памяти DDR SDRAM, спроектированной для приложений, требующих более высокой рабочей частоты. Как и её предшественник (GDDR4), GDDR5 основана на памяти DDR3, которая имеет удвоенные, по сравнению с DDR2, DQ (Digital Quest) каналы связи, но у GDDR5 также есть буферы предварительной выборки шириной 8 битов, как у GDDR4.
Кто принял участие в разработке и как долго она длилась?
В разработке стандарта, вместе со всеми основными производителями памяти ( Hynix , Qimonda и Samsung ) и JEDEC , активно участвовала и компания AMD . Разработка этого типа памяти заняла около трёх лет от начала разработок, до окончательной спецификации, а в AMD — ещё больше.
Производство
Первые чипы, поддерживающие напряжение 1,5 В (в отличие от 2,0 В для GDDR3 ) и имеющие плотность 0.5—2 Гбит , предлагали скорость передачи до 1000*4=4,0 ГГц . В дальнейшем этот параметр увеличился до 7 ГГц .
В ноябре 2009 г. компания Elpida Memory представила микросхему памяти GDDR5 плотностью 1 Гб , обеспечивающую передачу данных со скоростью 6 Гб/с ; в июне 2010 она представила микросхему памяти GDDR5 плотностью 2 Гб , изготовленной по нормам 50 нм с применением медных внутренних соединений.
В начале 2015 г . компания Samsung Electronics объявила о начале серийного выпуска первых в мире микросхем памяти GDDR5 плотностью 8 Гб ( предназначена для графических карт , используемых в ПК и суперкомпьютерах , для игровых консолей и ноутбуков ); память выпускается по 20-нм технологии. Компания Samsung Electronics , являющаяся крупнейшим поставщиком микросхем памяти, осенью 2010 объявила о расширении инициативы « Green Memory » («Зеленая память», с пониженным энергопотреблением) и на графическую память для ПК ; теперь инициативы, наряду с памятью DRAM и твердотельными накопителями ( SSD ), распространяется также и на память Samsung LPDDR2 и GDDR5.
Частота
GDDR5 использует две тактовые частоты, CK и WCK , последняя в два раза больше первой. Команды передаются в режиме SDR (стандартная тактовая частота) на частоте CK ; адресная информация передаётся в режиме DDR на частоте CK ; а данные передаются в режиме DDR на частоте WCK . Интерфейс GDDR5 передает два информационных слова шириной 32 бита за тактовый цикл ( WCK ) через выводы микросхемы памяти. Соответствуя 8n предварительной выборке, единичный доступ для чтения или записи состоит из двух передач данных шириной 256 бит за тактовый цикл ( CK ) внутри ядра памяти и восьми с оответствующих половинных передач данных шириной 32 бита за тактовый цикл ( WCK ) на выводах микросхемы памяти.
Например, для GDDR5 со скоростью передачи данных 5 Гб/с ( Gbps ) на вывод CK подается тактовая частота 1,25 ГГц , а WCK c частотой 2,5 ГГц . Также часто употребляется эффективная частота ( QDR ), поскольку, как написано выше, данные передаются на частоте WCK в режиме DDR . В приведенном примере эта частота составляет 5 GHz .
В связи с наличием двух частот ( CK, WCK ) производители изделий использующих GDDR5 могут указывать разные частоты для памяти, хотя скорость передачи данных может не отличаться. Nvidia указывает частоту WCK , AMD — частоту CK .
Почему не GDDR3? Шина памяти
Память типа GDDR5 обеспечивает вдвое большую пропускную способность по сравнению с GDDR3 . Для повышения пропускной способности у памяти GDDR3 приходилось использовать 512 -битную шину, это приводило к тому, что увеличивается и чип , и его упаковка . Это увеличивало себестоимость , да и сами карты становились больше и сложнее, потребляя больше энергии. Переход на использование GDDR5 позволяет увеличить производительность (при 128/256 -битной шине) в 2—3 раза при даже меньших размерах чипов и меньшем потреблении энергии. Новый дизайн интерфейса памяти вызывает значительное увеличение эффективности использования полосы пропускания.
Несмотря на то, что чипы памяти GDDR5 стали дороже, чем GDDR3 , особенно в начале её широкого применения, узкая ширина шины памяти позволяет упростить дизайн ПП , что дает преимущество, так что это перспективное решение.
Перспективы, которые длятся более 10 лет для GDDR5
С момента выхода первого графического ускорителя, использующего память GDDR5 ( ATI Radeon HD 4870 , июнь 2008 ) прошло более десяти лет — больше, чем продержались другие типы графической памяти. Но расти далее уже особо и некуда — из возможностей GDDR «выжато» почти все. В стандарте GDDR5 нынешний тип памяти достиг своего предела, и хотя небольшие возможности для роста ПСП ещё есть, но они требуют слишком больших усилий и не изменят ситуацию кардинально. Но самое главное — вопрос высокого энергопотребления не решился до сих пор (при этом энергоэффективность — главный параметр для любого современного чипа) — даже текущие поколения GDDR5 -памяти уже потребляют слишком много энергии из-за сложных механизмов тактования и работы на очень высокой частоте, а любые улучшения её производительности связаны с дальнейшим повышением частоты и сложности чипов, а значит, и энергопотребления.
Также чипы GDDR5 занимают слишком много места на плате видеокарты и требуют применения нескольких каналов памяти, что усложняет сам графический процессор (особенно если говорить о топовых GPU с 384/512 -битной шиной памяти).
Для решения этих и других проблем был анонсирован (компаниями AMD и Hynix в 2011 г.) а впоследствии разработан и внедрен новый стандарт памяти — High Bandwidth Memory (HBM).
Что будет с этим типом памяти?
Вероятнее всего с конца 2020 - начала 2021 года, эта память будет использоваться только в бюджетных или возможно средних видеокартах до 4 гб, ради решений быстрого видеоадаптера, но бюджетного варианта.
Производители видеокарт постоянно находятся в поиске новых решений. В гонке за максимальную энергоэффективность и пропускную способность видеопамяти участвуют традиционная GDDR5 и новая HBM. Для чего понадобился новый вид памяти и почему не обойтись использованием GDDR5 вы узнаете в переводе статьи с портала bit-tech.
Память GDDR5 долгое время оставалась выбором №1 для самых высокопроизводительных решений. Сегодня её продолжают использовать в потребительских видеокартах, а также в игровых приставках PlayStation 4 и Xbox One X. Тем не менее с увеличением пропускной способности GDDR5 увеличился и уровень потребления энергии. Большой расход на подпитку памяти приводит к нехватке питания для самого процессора и падению производительности.
GDDR5 также препятствует дальнейшему уменьшению форм-фактора видеокарт. Интерфейс GDDR5 требует большого количества логики для достижения высокой производительности. Это съедает место на печатной плате. Достаточно большое пространство занимают и модули питания, которые должны справляться с большим энергопотреблением памяти.
Подобные проблемы GDDR5 могли бы быть решены за счёт уменьшения и интеграции компонентов в один чип. Однако не всё так просто: процессоры и DRAM настолько различаются по своему устройству и решаемым задачам, что их не удаётся реализовать на одном кристалле. Полупроводниковые пластины для процессоров очень дороги и не предназначены для использования в DRAM.
Требовалось найти более эффективное решение. Им стала базовая соединительная подложка (base logic die). Благодаря такой подложке графический процессор и DRAM являются единым чипом, сохраняя при этом необходимые производственные различия. Это позволило увеличить скорость передачи данных, уменьшить рабочие частоты и, как следствие, уменьшить энергопотребление устройств.
Новый тип памяти, названный High Bandwidth Memory (HBM), обеспечивает высокую пропускную способность не столько за счёт частоты, как GDDR5, но и за счёт большей ширины шины. Это достигается путём использования трёхмерной компоновки: каждая интегральная схема памяти располагается поверх предыдущей. Поэтому полупроводниковые пластины также должны быть и очень тонкими, порядка 100 микрон.
Таким образом, HBM-память успешно решает две главные проблемы GDDR5: низкая пропускная способность на ватт и низкая пропускная способность на миллиметр печатной платы. Новый дизайн памяти является более производительным и потребляет гораздо меньше энергии. Так, пропускная способность чипа с 1 ГБ HBM-памяти в 4 раза выше, чем чипа с 8 гигабайтами GDDR5.
На основе HBM-памяти построены следующие модели графических карт NVIDIA: Tesla P100, NVIDIA Titan V, Quadro GP100, Quadro GV100 и Tesla V100, которая используется в нашей услуге ««Выделенные серверы с GPU».
Читайте также: