Smr hdd что это
Сегодня рост объема данных на человека растет в геометрической прогрессии, а компании, предлагающие решения для хранения этих данных, стремятся сделать все возможное, чтобы увеличить доступную емкость своих устройств. Технология черепичной магнитной записи Seagate SMR (Shingled Magnetic Recording) позволяет повысить плотность записи, за счет чего емкость диска увеличивается на 25%. Это возможно благодаря увеличению количества дорожек на каждой пластине и сокращению расстояния между ними. Дорожки размещаются друг над другом (как черепица на крыше), что позволяет записать больше данных, не увеличивая площади пластины. При записи новых данных дорожки частично накладываются друг на друга, или «усекаются». Ввиду того, что считывающий элемент на дисковой головке меньше записывающего, он может считывать данные даже с усеченной дорожки, не нарушая их целостности и достоверности.
Однако с технологией SMR связана следующая проблема: чтобы перезаписать или обновить информацию, необходимо переписать не только требуемый фрагмент, но и данные на последних дорожках. Из-за того, что записывающий элемент шире, он захватывает данные на граничащих дорожках, поэтому необходимо перезаписать и их. Таким образом, при изменении данных на нижней дорожке нужно скорректировать данные на ближайшей наложенной дорожке, потом на следующей, и так далее, пока не будет переписана вся пластина.
По этой причине дорожки SMR-диска объединены в небольшие группы, называемые лентами. Накладываются друг на друга, соответственно, только дорожки в пределах одной ленты. Благодаря такому группированию в случае обновления некоторых данных перезаписывать придется не всю пластину, а лишь ограниченное количество дорожек, что существенно упрощает и ускоряет процесс. Для каждого типа дисков разрабатывается своя архитектура ленты с учетом сферы его применения. Каждая линейка продуктов Seagate рассчитана на определенную сферу применения и конкретные условия работы, и технология SMR позволяет достичь при правильном использовании наилучших результатов.
Seagate SMR — это технология, позволяющая удовлетворить постоянно растущий спрос на дополнительную емкость. На сегодняшний день она активно совершенствуется и в сочетании с другими инновационными методами может быть использована для повышения плотности записи на жестких дисках следующих поколений.
Но прежде всего, необходимо разобраться в некоторых нюансах ее применения.
Выделяют три типа устройств, поддерживающих черепичную запись:
Автономные (Drive Managed)
Работа с этими устройствами не требует никаких изменений в программном обеспечении хоста. Вся логика записи/чтения организована самим устройством. Значит ли, что мы можем просто установить их и расслабиться? Нет.
Диски, в которых реализована Drive Managed технология записи, обычно обладают большим объемом write-back кэша (от 128МБ на диск). При этом последовательные запросы обрабатываются в режиме write-around. Основные сложности, c которыми сталкиваются разработчики устройств и СХД, основанных на данной технологии записи, следующие:
1. Размер кэша лимитирован и по мере его заполнения мы можем получить непредсказуемую производительность устройств.
2. Иногда возникают значительные уровни задержек при интенсивном сбросе кэша.
3. Определение последовательностей — далеко не всегда тривиальная задача, и в сложных случаях мы можем ожидать деградацию производительности.
Основным достоинством данного подхода является полная обратная совместимость устройств с существующими ОС и приложениями. Хорошо понимая вашу задачу, вы можете уже сейчас покупать Drive Managed устройства и получать преимущества от использования технологии. Дальше в статье вы увидите результаты тестирования подобных устройств и сможете определиться, насколько они вам подходят.
Управляемые хостом (Host Managed)
В данных устройствах используется набор расширений к ATA и SCSI для взаимодействия с дисками. Это устройство другого типа (14h), которое требует серьезных изменений во всем Storage Stack и несовместимо с классическими технологиями, то есть без специальной адаптации приложений и операционных систем вы не сможете использовать эти диски. Хост должен выполнять запись на устройства строго последовательно. При этом производительность устройств на 100% предсказуема. Но необходима корректность работы более высокоуровневого ПО для того, чтобы производительность подсистемы хранения была действительно предсказуемой.
Поддерживаемые хостом (Host Aware)
Это гибридные решения, объединяющие преимущества Device Managed и Host Managed технологий. Приобретая такие диски, мы получаем поддержку обратной совместимости с возможностью использования специальных расширений ATA и SCSI для оптимальной работы с SMR-устройствами. То есть мы можем, как просто выполнять запись на устройства, как делали это раньше, так и делать это наиболее оптимальным образом.
Для того, чтобы обеспечить работу с Host Managed и Host Aware устройствами, разрабатывается пара новых стандартов: ZBC и ZAC, которые входят в T10/T13. ZBC является расширение SCSI и ратифицируется T10. Стандарты разрабатываются для SMR дисков, но в будущем могут быть применены и для других устройств.
ZBC/ZAC определяют логическую модель устройств, где основным элементом является зона, которая отображается как диапазон LBA.
Стандарты задают три типа логических зон, на которые разбиты устройства:
1. Conventional zone — зона, с которой мы можем работать традиционным образом, как с обычными жесткими дисками. То есть, можем писать последовательно и случайно.
2. Два типа Write Pointer Zone:
2.1. Sequential write preferred — основной тип зон для Host Aware устройств, отдается предпочтение последовательной записи. Случайная запись на устройства обрабатывается как в Device Managed устройствах и может стать причиной потери производительности.
2.2. Sequential write only — основной тип зон для Host Manged устройств, возможна только последовательная запись. Случайная запись недопустима, при попытках её произвести будет возвращена ошибка.
Каждая зона обладает своим Write Pointer и своим статусом. Для всех устройств, поддерживающих HM тип записи, первый LBA следующей команды записи обязательно должен соответствовать положению Write Pointer. Для HA устройств Write Pointer является информационным и служит для оптимизации работы с диском.
Кроме новой логической структуры в стандартах появляются и новые команды:
REPORT_ZONES является основным методом, благодаря которому можно получить информацию о существующих зонах на устройстве и их статусе. Диск в ответ на эту команду сообщает о существующих зонах, их типах (Conventional, Sequential Write Required, Sequential Write Preferred), состоянии зон, размере, информацию о нахождении Write Pointer.
RESET_WRITE_POINTER является преемником команды TRIM для ZBC устройств. При ее вызове происходит стирание зоны и перемещение Write Pointer на начало зоны.
Для управления статусом зоны используются 3 опциональные команды:
OPEN_ZONE
CLOSE_ZONE
FINISH_ZONE
В VPD страницах появилась новая информация, включая максимальное количество открытых зон, обеспечивающее лучшую производительность и максимальное количество зон, доступных для случайной записи с лучшей производительностью.
Производителям СХД необходимо позаботиться о поддержке устройств HA/HM, внося изменения на всех уровнях стека: библиотеки, планировщики, RAID engine, логические тома, файловые системы.
Кроме того, нужно обеспечить два типа интерфейсов для работы приложений: традиционный интерфейс, организовав массив как device managed устройство, а также реализацию виртуального тома как HOST AWARE устройства. Это необходимо, так как ожидается появление приложений, работающих с HM/HA устройствами напрямую.
В общем виде алгоритм работы с HA устройствами выглядит следующим образом:
1. Определите конфигурацию устройства, использую REPORT_ZONES
2. Определите зоны для случайной записи
2.1. Количество ограничено возможностями устройства
2.2. В этих зонах нет необходимости отслеживать положение Write Pointer
3. Используйте остальные зоны для последовательной записи и используя информацию о положении Write-Pointer и выполняя только последовательную запись
4. Контролируйте количество открытых зон
5. Используйте сборку мусора для высвобождения пула зон
Некоторые техники записи можно применять из имеющихся all-flash СХД, для которых решались проблемы предстательной последовательной записи и сборки мусора.
Компания RAIDIX провела тестирование SMR дисков Seagate у себя в лаборатории и дает несколько рекомендаций по их использованию. Эти диски отличаются тем, что являются Device Managed и не требуют никаких серьезных изменений в работе приложений.
При тестировании была сделана попытка проверить ожидания производительности таких дисков и понять, для чего мы можем их использовать.
В тестах участвовали два диска Seagate Archive HDD объемом 8000GB.
Тестирование выполнялось на операционной системе Debian версии 8.1
CPU Intel i7 c частотой 2,67 MHz
16 GB RAM
Диски имеют интерфейс SATA 3, мы включили контроллер в режим AHCI.
Для начала мы приводим информацию об устройствах, выполнив Inquiry запрос.
Для этого мы использовали набор утилит sg3-utils. sg_inq /dev/sdbstandard INQUIRY:
PQual=0 Device_type=0 RMB=0 version=0x05 [SPC-3]
[AERC=0] [TrmTsk=0] NormACA=0 HiSUP=0 Resp_data_format=2
SCCS=0 ACC=0 TPGS=0 3PC=0 Protect=0 BQue=0
EncServ=0 MultiP=0 [MChngr=0] [ACKREQQ=0] Addr16=0
[RelAdr=0] WBus16=0 Sync=0 Linked=0 [TranDis=0] CmdQue=0
[SPI: Clocking=0x0 QAS=0 IUS=0]
length=96 (0x60) Peripheral device type: disk
Vendor identification: ATA
Product identification: ST8000AS0002-1NA
Product revision level: AR13
Unit serial number: Z84011LQ
sg_inq /dev/sdb -p 0x83
VPD INQUIRY: Device Identification page
Designation descriptor number 1, descriptor length: 24
designator_type: vendor specific [0x0], code_set: ASCII
associated with the addressed logical unit
vendor specific: Z84011LQ
Designation descriptor number 2, descriptor length: 72
designator_type: T10 vendor identification, code_set: ASCII
associated with the addressed logical unit
vendor id: ATA
vendor specific: ST8000AS0002-1NA17Z Z84011LQ
Ничего особенного мы не увидели. Попытки прочитать информацию о зонах обернулись неудачей.
RAIDIX делает ПО для СХД, работающих в различных индустриях, и мы стремились не использовать специализированные или платные бенчмарки.
Начинаем с того, что проверяем потоковую производительность дисков на внутренних и внешних дорожках. Результаты тестов дадут максимальную ожидаемую производительность устройства и соответствуют в первую очередь таким задачам, как архивирование данных.
Настройки блочной подсистемы мы не трогали. Выполняем тестирование, записывая на диски данные блоками 1 мегабайт. Для этого мы используем бенчмарк fio v.2.1.11.
Джобы (Jobs) отличаются друг от друга только смещением от начала устройства и запускаются один за другим. В качестве библиотеки ввода-вывода выбрана libaio.
Результаты представляются неплохими:
Производительность на внешних и внутренних дорожках отличается практически в 2 раза.
Мы видим периодические провалы производительности. Они не критичны для архивирования, но могут стать проблемой для других задач. При корректной работе write-back кэша СХД мы предполагаем, что не будем наблюдать подобной ситуации. Мы провели схожий опыт, создав массив RAID 0 из обоих дисков, выделив 2ГБ RAM кэша на каждый диск, и не увидели провалов производительности.
При чтении провалов не видно. И последующие тесты покажут, что на операциях чтения SMR диски по производительности ничем не отличаются от обычных.
Теперь мы проведем более интересные тесты. Запустим 10 потоков c разными offset одновременно. Это мы делаем для того, чтобы проверить корректность буферизации и посмотреть, как диски будут работать на задачах CCTV, Video Ingest и подобных.
На графиках приведена суммарная производительность по всем работам:
Диск неплохо справился с нагрузкой!
Производительность держится на уровне 90 МБ/с, равномерно распределена по потокам, и не наблюдается серьезных провалов. График на чтение абсолютно аналогичен, только приподнят на 20 МБ. Для хранения и раздачи видеоконтента, обмена большими файлами производительность подходящая и практически не отличается от производительности обычных дисков.
Как и ожидалось, диски неплохо показали себя на операциях потоковых чтения и записи, а работа в несколько потоков стала для нас приятным сюрпризом.
Переходим к «случайным» чтению и записи. Посмотрим, как диски поведут себя в классических задачах предприятий: хранение файлов СУБД, виртуализация и пр. Кроме того, в «случайные» операции подпадают частая работа с метаданными и, например, включённая дедупликация на массиве.
Тестирование мы проводим блоками 16 килобайт и по-прежнему верны fio.
В тесте мы настроили несколько джобов с разной глубиной очереди, но полностью результаты приводить не будем. Показательно только начало теста.
Первые 70,5 секунд мы видим нереальные для жесткого диска 2500 IOps. При этом происходят частые провалы. Видимо, в этот момент происходит запись в буфер и его периодический сброс. Потом происходит резкое падение до 3 IOps, которые держатся до конца теста.
Если подождать несколько минут, то после того, как сбросится кэш, ситуация повторится.
Можно ожидать, что при наличии небольшого числа случайных операций диск будет вести себя неплохо. Но если мы ожидаем интенсивную нагрузку на устройство, лучше воздержаться от использования SMR дисков. RAIDIX рекомендует при возможности выносить всю работу с метаданными на внешние устройства.
А что же со случайным чтением?
В этом тесте мы ограничили время отклика 50 мс. Наши устройства справляются неплохо.
Чтение оказывается в промежутке 144-165 IOPs. Сами числа неплохи, но немного пугает разброс в 20 IOPs. Ориентируйтесь на нижнюю границу. Результат неплохой, на уровне классических дисков.
Несколько изменим подход. Давайте еще взглянем на работу с большим количеством файлов.
С этим нам поможет утилита frametest от SGI. Этот бенчмарк создан для проверки производительности СХД при выполнении монтажа несжатого видео. Каждый фрейм является отдельным файлом.
Мы создали файловую систему xfs и смонтировали ее со следующими параметрами:
-o noatime,nodiratime,logbufs=8,logbsize=256k,largeio,inode64,swalloc,allocsize=131072k,nobarrier
Запускаем frametest со следующими параметрами:
./frametest -w hd -n 2000 /test1/
Бенчмарк создает 2000 файлов размером 8МБ.
Начало теста проходит неплохо:
Averaged details:
Open I/O Frame Data rate Frame rate
Last 1s: 0.028 ms 79.40 ms 79.43 ms 100.37 MB/s 12.6 fps
5s: 0.156 ms 83.37 ms 83.53 ms 95.44 MB/s 12.0 fps
Но после записи 1500 фреймов ситуация значительно ухудшается:
Averaged details:
Open I/O Frame Data rate Frame rate
Last 1s: 0.035 ms 121.88 ms 121.92 ms 65.39 MB/s 8.2 fps
5s: 0.036 ms 120.78 ms 120.83 ms 65.98 MB/s 8.3 fps
Дальше все хуже:
Averaged details:
Open I/O Frame Data rate Frame rate
Last 1s: 0.036 ms 438.90 ms 438.94 ms 18.16 MB/s 2.3 fps
5s: 0.035 ms 393.50 ms 393.55 ms 20.26 MB/s 2.5 fps
Проведем тест на чтение:
./frametest -r hd -n 2000 /test1/
В течение всего теста производительность отличная:
Averaged details:
Last 1s: 0.004 ms 41.09 ms 41.10 ms 193.98 MB/s 24.3 fps
5s: 0.004 ms 41.09 ms 41.10 ms 193.98 MB/s 24.3 fps
Сейчас ведется работа над специализированными файловыми системами для SMR дисков.
Seagate разрабатывает основанную на ext4 SMR_FS-EXT4. Можно обнаружить несколько log-structured файловых систем, спроектированных специально для Device Managed SMR дисков, но ни одну из них нельзя назвать зрелым, рекомендуемым к внедрению продуктом. Также Seagate ведется разработка поддерживаемой хостом (Host Aware) версии SMR диска, которая должна быть завершена до конца года.
Какие мы можем сделать выводы по результатам замеров производительности?
Device Managed устройства можно смело использовать для задач, не отличающихся интенсивной записью. Они очень неплохо справляются с задачами однопоточной и многопоточной записи. Для чтения данных они подходят отлично. Периодические “случайные” запросы к дискам при обновлении метаданных поглощаются большим кэшем.
Для решения задач, отличающихся интенсивной “случайной” записью или обновлением большого количества файлов такие устройства не очень подходят, как минимум, без использования дополнительных технических средств.
Параметр MTBF протестированных дисков составляет 800 000 часов, что в 1,5 раза ниже, чем у, например, NAS-дисков. Большой объем дисков значительно увеличивает время восстановления и делает практически невозможным регулярный media-скан. Мы рекомендуем при проектировании хранилища с такими дисками полагаться на RAID с количеством parity, большим чем 2 и/или подходах позволяющих сократить время восстановления (Например, Parity Declustering).
С каждым днем становится все больше жестких дисков, использующих технологию записи данных SMR. Однако многочисленные тесты показывают невысокую скорость случайной записи и не вызывают особого энтузиазма у пользователей. Многие предпочитают приобретать диски с традиционной технологией записи PMR/CMR, а другие вовсе отказываются от использования HDD в пользу SSD. Давайте разберемся, жесткий диск с SMR для домашнего ПК — это зло, или же его «просто не умеют готовить».
Что такое «черепичная» магнитная запись?
Shingled Magnetic Recording — «черепичная» магнитная запись. В жестких дисках с перпендикулярной магнитной записью (CMR) треки записываются на пластину параллельно, не пересекаясь с другими. А в жестких дисках с «черепичной» магнитной записью (SMR) каждый последующий трек при записи частично накладывается на предыдущий, как черепица на крыше. Однако такой подход имеет один весьма существенный недостаток. При перезаписи данных даже в одном-единственном треке необходимо перезаписать трек по соседству с ним, затем соседний с тем треком… и так далее по цепочке. В конечном итоге, нам придется перезаписать всю пластину, и все это ради изменившихся данных в единственном треке.
Чтобы этого избежать, треки группируют в так называемые ленты небольшого размера, поэтому при изменении данных будут перезаписаны только треки, относящиеся к одной или нескольким лентам, а не весь диск целиком. Производители не разглашают фактический размер лент, но очевидно, что он должен быть таким, чтобы одна или несколько лент могли целиком уместиться в кэш жесткого диска. А кэш у дисков с SMR довольно внушительный: типичный размер — 256 Мб и больше. Кстати говоря, именно большой размер кэша HDD является одним из косвенных признаков того, что перед вами диск с «черепичной» записью.
Но один лишь дисковый кэш не поможет, если данные будут литься непрерывным потоком. Здесь в игру вступает медиа-кэш: данные из дискового кэша поступают в медиа-кэш, а затем контроллер диска распределяет эти данные по нужным лентам. Физически медиа-кэш представляет собой одну или несколько выделенных областей на жестком диске, использующих традиционную перпендикулярную запись. Эти области имеют размер в десятки гигабайт и располагаются в самом начале диска (за пределами LBA-пространства), либо равномерно распределены по всей поверхности.
Управление данными при записи на диск с SMR может осуществляться как хостом (системой), так и самим устройством. В зависимости от реализации, диски с SMR обычно делят на три типа:
- Device-Managed SMR (DMSMR) — все нюансы работы с таким диском ложатся на плечи контроллера, для хоста диск с DM-SMR выглядит так же, как и любой другой.
- Host-Managed SMR (HMSMR) — чтение и запись полностью контролируются хостом, для работы с устройством используются специальные наборы команд. Данные записываются строго последовательно, как в ленточных накопителях.
- Host-Aware SMR (HASMR) — комбинация предыдущих двух. Хост может работать с HA-SMR, как с обычным не-SMR, но в то же время может использовать спецкоманды и последовательную запись для более оптимизированного ввода-вывода.
Впрочем, для рядового пользователя шансы столкнуться с последними двумя типами ничтожно малы, так как подавляющее большинство всех выпускаемых дисков с SMR — это DMSMR диски.
Плюсы и минусы SMR
Как и у любой технологии, у «черепичной» магнитной записи и дисков на ее основе есть свои плюсы и минусы.
Плюсы:
- Благодаря наложению треков удается достичь более высокой плотности записи, чем в обычных дисках, а значит, размещать больший объем информации на одной пластине.
- Более плотная запись позволяет набирать тот же самый объем диска меньшим количеством пластин, за счет чего SMR-диск потребляет меньше энергии, становится легче, тише, холоднее и относительно дешевле CMR-диска той же емкости.
Минусы:
- Даже при изменении данных в одном секторе, приходится перезаписывать всю ленту целиком. Это влияет на скорость записи диска не самым лучшим образом, особенно, если запись производится не на пустой, а на частично заполненный диск.
- Если объем передаваемых данных велик и производится множественная «случайная» запись (в некоторых сценариях использования), в этом случае происходит быстрое заполнение медиа-кэша и, как следствие, критическое падение производительности диска. Контроллер будет вынужден срочно заняться распределением данных из медиа-кэша по лентам, в результате чего скорость записи падает практически до нуля, а время отклика может увеличиться вплоть до десятков секунд.
Сравнительные тесты производительности SMR vs. CMR
Неужели технология SMR выглядит привлекательно лишь в теории, но не на практике? Чтобы выяснить это, проанализируем результаты тестов накопителей с SMR и CMR в популярных бенчмарках и специальных испытаниях. В качестве подопытных были выбраны два четырехтерабайтника серии Red от Western Digital — SMR-диск (WD40EFAX) и вариант c CMR (WD40EFRX). Для большей наглядности добавим к сравнению еще один диск на 4 Тб с CMR — Seagate Ironwolf ST4000VN008. Все диски изначально пусты.
Наш испытуемый с SMR демонстрирует неплохие показатели в программах HD Tune Pro и PCMark 8. Эти результаты достигаются не только за счет более вместительного кэша, но и благодаря последовательному характеру нагрузок, используемому в данных бенчмарках — последовательные чтение/запись оптимальны для дисков с SMR.
Следующее испытание представляет более реалистичный сценарий использования. Диски заполняются на 3/4, а затем удаляется 1 Тб данных. Сразу после этого копируются файлы общим объемом 125 Гб, и далее незамедлительный прогон теста чтения/записи в CrystalDiskMark 7, чтобы не дать дискам успеть «прийти в себя».
Здесь SMR-диск уже не так хорош, как его CMR-собратья. Причина проста: контроллер диска отчаянно ищет свободное место в заполненном медиа-кэше для вновь поступающих данных, при этом пытаясь разбросать по лентам те данные, что там уже имеются. Ситуацию усугубляет еще и тот факт, что в дисках с «черепичной» магнитной записью расположение логических секторов может не соответствовать их физическому расположению (используется дополнительный слой трансляции адресов). В результате — падение производительности почти в полтора раза даже на такой средней нагрузке.
Финальное испытание — восстановление «упавшего» RAIDZ-массива из четырех CMR-дисков. Для этого из набора извлекается диск и заменяется на один из тестируемых образцов, после чего запускается процесс восстановления. Перед началом испытания массив был заполнен примерно на 60 %, а контроль его целостности отключен.
Пересборка RAIDZ отправила WD40EFAX в настоящий нокдаун. Время выполнения процесса восстановления с этим диском просто обескураживает — тот же WD40EFRX справился в 15,5 раз быстрее. Тем не менее, сам процесс завершился без единой ошибки, поскольку RAIDZ — это программный массив дисков, и тестируемый диск был полностью исправен. А если бы это был массив уровня RAID 5/6 с аппаратным контроллером, в случае длительной задержки ответа со стороны SMR-диска, контроллер вполне мог посчитать такой диск неисправным и исключить его из пула, что привело бы к деградации RAID.
Как показали результаты тестов, применение дисков с технологией записи SMR в высоконагруженных сценариях может удивить крайне неприятным образом и потому нецелесообразно. С точки же зрения сегмента домашних ПК (которым, скажем прямо, RAID-массивы не особо и нужны), использование SMR-дисков в слабонагруженных сценариях приветствуется, а при средней нагрузке — терпимо (не каждый «домашний» пользователь будет каждый день гонять туда-сюда терабайты данных).
Практические советы — готовим SMR правильно!
Как мы уже выяснили, для дисков с «черепичной» магнитной записью наиболее оптимальными являются последовательные чтение и запись, а идеальный режим доступа отвечает концепции WORM (Write Once, Read Many) — «один раз записал, много раз считал». Исходя из этого, дадим несколько полезных советов, которые могут помочь сделать работу с SMR-дисками максимально комфортной.
- Минимальные требования к системе с SMR-диском: от 16 Гб оперативной памяти и/или наличие твердотельного накопителя. Чем больше оперативной памяти в системе, тем менее острой становится необходимость использования файла подкачки (свопа), который обычно размещают на HDD. А 16 Гб RAM — это как раз тот объем памяти в домашнем ПК, начиная с которого своп можно полностью отключить, либо оставить какой-то минимальный размер (это может быть необходимо для некоторых программ). Большой объем памяти также позволит выделить ОС больше места под системный кэш, за счет чего может сократиться число обращений к диску. Снизить нагрузку на жесткий диск поможет и установка SSD. На него можно установить операционную систему и разместить те файлы, которые чаще всего требуется модифицировать.
- Отделяйте статический контент от динамического. Помочь в этом может простое разбиение диска на логические разделы. Еще 20 лет назад, когда типичный размер HDD не превышал 20 Гб, несколько разделов на одном физическом диске, в основном, были не нужны. Однако в наш век терабайтных накопителей такое разбиение все-таки имеет смысл, особенно в случае SMR-дисков. Основная цель — на уровне разделов обеспечить разделение статического и динамического контента. Разделение диска не потребуется, если он целиком выделяется под однотипный контент, например, архивы. Но в случае единственного жесткого диска «для всего» иметь один гигантский раздел со смешанным контентом — не самая лучшая идея по многим причинам.
- Кэширование и еще раз кэширование. Для обеспечения последовательной записи на SMR-диск применяйте кэширование при записи везде, где это возможно. И речь здесь идет не только о возможностях системного кэша. Допустим, нужно объединить несколько файлов в один. Вы можете создать результирующий файл на быстром RAM-диске, либо SSD при его наличии, а затем переместить этот файл на SMR-диск.
Производители жестких дисков все еще продолжают экспериментировать с перспективными технологиями записи, и SMR на данный момент является единственной альтернативой традиционной CMR. Несмотря на некоторые присущие технологии SMR недостатки, устройства на ее основе можно смело назвать хорошим выбором для пользователей, которые хотят заполучить терабайты хранения для своих данных за умеренную цену. Так или иначе, выбор остается за покупателем.
Первый в мире жесткий диск, IBM RAMAC 305, увидевший свет в 1956 году, вмещал лишь 5 МБ данных, а весил при этом 970 кг и по габаритам был сопоставим с промышленным рефрижератором. Современные корпоративные флагманы способны похвастаться емкостью уже в 20 ТБ. Только представьте себе: 64 года назад, для того чтобы записать такое количество информации, потребовалось бы свыше 4 миллионов RAMAC 305, а размеры ЦОДа, необходимого для их размещения, превысили бы 9 квадратных километров, тогда как сегодня для этого будет достаточно маленькой коробочки весом около 700 грамм! Во многом добиться столь невероятного повышения плотности хранения удалось благодаря совершенствованию методов магнитной записи.
В это сложно поверить, однако принципиально конструкция жестких дисков не меняется вот уже почти 40 лет, начиная с 1983 года: именно тогда свет увидел первый 3,5-дюймовый винчестер RO351, разработанный шотландской компанией Rodime. Этот малыш получил две магнитные пластины по 10 МБ каждая, то есть был способен вместить вдвое больше данных, чем обновленный ST-412 на 5,25 дюйма, выпущенный Seagate в том же году для персональных компьютеров IBM 5160.
Rodime RO351 — первый в мире 3,5-дюймовый винчестер
Несмотря на инновационность и компактные размеры, на момент выхода RO351 оказался практически никому не нужен, а все дальнейшие попытки Rodime закрепиться на рынке винчестеров потерпели фиаско, из-за чего в 1991 году компания была вынуждена прекратить свою деятельность, распродав практически все имеющиеся активы и сократив штат до минимума. Однако стать банкротом Rodime оказалось не суждено: в скором времени к ней начали обращаться крупнейшие производители винчестеров, желающие приобрести лицензию на использование запатентованного шотландцами форм-фактора. В настоящее время 3,5 дюйма является общепринятым стандартом производства как потребительских HDD, так и накопителей корпоративного класса.
LMR, PMR, CMR и TDMR: в чем разница?
Принцип работы жестких дисков достаточно прост. Тонкие металлические пластины, покрытые слоем ферромагнитного материала (кристаллического вещества, способного сохранять намагниченность даже при отсутствии воздействия на него внешнего магнитного поля при температуре ниже точки Кюри) движутся относительно блока пишущих головок на большой скорости (5400 оборотов в минуту или более). При подаче электрического тока на пишущую головку возникает переменное магнитное поле, которое изменяет направление вектора намагниченности доменов (дискретных областей вещества) ферромагнетика. Считывание данных происходит либо за счет явления электромагнитной индукции (перемещение доменов относительно сенсора вызывает в последнем возникновение переменного электрического тока), либо за счет гигантского магниторезистивного эффекта (под действием магнитного поля изменяется электрическое сопротивление датчика), как это реализовано в современных накопителях. Каждый домен кодирует один бит информации, принимая логическое значение «0» или «1» в зависимости от направления вектора намагниченности.
Долгое время жесткие диски использовали метод продольной магнитной записи (Longitudinal Magnetic Recording, LMR), при котором вектор намагниченности доменов лежал в плоскости магнитной пластины. Несмотря на относительную простоту реализации, данная технология имела существенный недостаток: для того чтобы побороть коэрцитивность (переход магнитных частиц в однодоменное состояние), между треками приходилось оставлять внушительную буферную зону (так называемое guard space — защитное пространство). Вследствие этого максимальная плотность записи, которой удалось добиться на закате данной технологии, составляла всего 150 Гбит/дюйм 2 .
В 2010 году LMR была практически полностью вытеснена PMR (Perpendicular Magnetic Recording — перпендикулярная магнитная запись). Главное отличие данной технологии от продольной магнитной записи состоит в том, что вектор магнитной направленности каждого домена располагается под углом 90° к поверхности магнитной пластины, что позволило существенно сократить промежуток между треками.
За счет этого плотность записи данных удалось заметно увеличить (до 1 Тбит/дюйм 2 в современных устройствах), при этом не жертвуя скоростными характеристиками и надежностью винчестеров. В настоящее время перпендикулярная магнитная запись является доминирующей на рынке, в связи с чем ее также часто называют CMR (Conventional Magnetic Recording — обычная магнитная запись). При этом надо понимать, что между PMR и CMR нет ровным счетом никакой разницы — это всего лишь другой вариант названия.
Изучая технические характеристики современных жестких дисков, вы также можете наткнуться на загадочную аббревиатуру TDMR. В частности, данную технологию используют накопители корпоративного класса Western Digital Ultrastar 500-й серии. С точки зрения физики TDMR (что расшифровывается как Two Dimensional Magnetic Recording — двумерная магнитная запись) ничем не отличается от привычной нам PMR: как и прежде, мы имеем дело с непересекающимися треками, домены в которых ориентированы перпендикулярно плоскости магнитных пластин. Разница между технологиями заключается в подходе к считыванию информации.
В блоке магнитных головок винчестеров, созданных по технологии TDMR, на каждую пишущую головку приходятся по два считывающих сенсора, осуществляющих одновременное чтение данных с каждого пройденного трека. Такая избыточность дает возможность контроллеру HDD эффективно фильтровать электромагнитные шумы, появление которых обусловлено межтрековой интерференцией (Intertrack Interference, ITI).
Решение проблемы с ITI обеспечивает два чрезвычайно важных преимущества:
- снижение коэффициента помех позволяет повысить плотность записи за счет уменьшения расстояния между треками, обеспечивая выигрыш по общей емкости вплоть до 10% по сравнению с обычной PMR;
- в сочетании с технологией RVS и трехпозиционным микроактуатором, TDMR позволяет эффективно противостоять ротационной вибрации, вызванной работой винчестеров, что помогает добиться стабильного уровня производительности даже в наиболее сложных условиях эксплуатации.
Что такое SMR и с чем его едят?
Размеры пишущей головки примерно в 1,7 раза больше по сравнению с размерами считывающего сенсора. Столь внушительная разница объясняется достаточно просто: если записывающий модуль сделать еще более миниатюрным, силы магнитного поля, которое он сможет генерировать, окажется недостаточно для намагничивания доменов ферромагнитного слоя, а значит, данные попросту не будут сохраняться. В случае со считывающим сенсором такой проблемы не возникает. Более того: его миниатюризация позволяет дополнительно снизить влияние упомянутой выше ITI на процесс считывания информации.
Данный факт лег в основу черепичной магнитной записи (Shingled Magnetic Recording, SMR). Давайте разбираться, как это работает. При использовании традиционного PMR пишущая головка смещается относительно каждого предыдущего трека на расстояние, равное ее ширине + ширина защитного пространства (guard space).
При использовании черепичного метода магнитной записи пишущая головка смещается вперед лишь на часть своей ширины, поэтому каждый предыдущий трек оказывается частично перезаписан последующим: магнитные дорожки накладываются друг на друга подобно кровельной черепице. Такой подход позволяет дополнительно повысить плотность записи, обеспечивая выигрыш по емкости до 10%, при этом не отражаясь на процессе чтения. В качестве примера можно привести Western Digital Ultrastar DC HC 650 — первые в мире 3.5-дюймовые накопители объемом 20 ТБ с интерфейсом SATA/SAS, появление которых стало возможным именно благодаря новой технологии магнитной записи. Таким образом, переход на SMR-диски позволяет повысить плотность хранения данных в тех же стойках при минимальных затратах на модернизацию IT-инфраструктуры.
Несмотря на столь значительное преимущество, SMR имеет и очевидный недостаток. Поскольку магнитные дорожки накладываются друг на друга, при обновлении данных потребуется перезапись не только требуемого фрагмента, но и всех последующих треков в пределах магнитной пластины, объем которой может превышать 2 терабайта, что чревато серьезным падением производительности.
Решить данную проблему помогает объединение определенного количества треков в обособленные группы, называемые зонами. Хотя такой подход к организации хранения данных несколько снижает общую емкость HDD (поскольку между зонами необходимо сохранять достаточные промежутки, препятствующие перезаписи треков из соседних групп), это позволяет существенно ускорить процесс обновления данных, так как теперь в нем участвует лишь ограниченное количество дорожек.
Черепичная магнитная запись предполагает несколько вариантов реализации:
- Drive Managed SMR (SMR, управляемая диском)
Недостаток этого подхода заключается в изменчивости уровня производительности, в связи с чем Drive Managed SMR оказывается неподходящей для корпоративных приложений, в которых постоянство быстродействия системы является критически важным параметром. Тем не менее такие диски хорошо показывают себя в сценариях, предоставляющих достаточное время для выполнения фоновой дефрагментации данных. Так, например, DMSMR-накопители WD Red, оптимизированные для использования в составе малых NAS на 8 отсеков, станут отличным выбором для системы архивирования или резервного копирования, предполагающей долговременное хранение бэкапов.
- Host Managed SMR (SMR, управляемая хостом)
При использовании HMSMR весь доступный объем накопителя разделяется на зоны двух типов: Conventional Zones (обычные зоны), которые используются для хранения метаданных и произвольной записи (по сути, играют роль кэша), и Sequential Write Required Zones (зоны последовательной записи), занимающие большую часть общей емкости жесткого диска, в которых данные записываются строго последовательно. Неупорядоченные данные сохраняются в области кэширования, откуда затем могут быть перенесены в соответствующую зону последовательной записи. Благодаря этому все физические сектора записываются последовательно в радиальном направлении и перезаписываются только после циклического переноса, что позволяет добиться стабильной и предсказуемой производительности системы. При этом HMSMR-диски поддерживают команды произвольного чтения аналогично накопителям, использующим стандартный PMR.
Host Managed SMR реализована в жестких дисках enterprise-класса Western Digital Ultrastar HC DC 600-й серии.
Линейка включает в себя SATA- и SAS-накопители высокой емкости, ориентированные на использование в составе гипермасштабных центров обработки данных. Поддержка Host Managed SMR существенно расширяет сферу применения таких винчестеров: помимо систем резервного копирования, они прекрасно подойдут для облачных хранилищ, CDN или стриминговых платформ. Высокая емкость жестких дисков позволяет существенно повысить плотность хранения (в тех же стойках) при минимальных затратах на апгрейд, а низкое энергопотребление (не более 0,29 Ватта на каждый терабайт сохраненной информации) и тепловыделение (в среднем на 5 °C ниже, чем у аналогов) — дополнительно сократить операционные расходы на обслуживание ЦОДа.
Единственным недостатком HMSMR является сравнительная сложность имплементации. Все дело в том, что на сегодняшний день ни одна операционная система или приложение не умеют работать с подобными накопителями «из коробки», в силу чего для адаптации IT-инфраструктуры требуются серьезные изменения стека программного обеспечения. В первую очередь это касается, конечно же, самой ОС, что в условиях современных ЦОД, использующих многоядерные и многосокетные сервера, является достаточно нетривиальной задачей. Узнать подробнее о вариантах реализации поддержки Host Managed SMR можно на специализированном ресурсе ZonedStorage.io, посвященном вопросам зонального хранения данных. Собранные здесь сведения помогут предварительно оценить степень готовности вашей IT-инфраструктуры для перевода на зональные системы хранения.
- Host Aware SMR (SMR, поддерживаемая хостом)
Подобно Host Managed SMR, Host Aware SMR использует два типа зон: Conventional Zones для произвольной записи и Sequential Write Preferred Zones (зоны, предпочтительные для последовательной записи). Последние, в отличие от упомянутых выше Sequential Write Required Zones, автоматически переводятся в разряд обычных в том случае, если в них начинает вестись неупорядоченная запись данных.
Реализация SMR с поддержкой хоста предусматривает внутренние механизмы восстановления после непоследовательной записи. Неупорядоченные данные записываются в области кэширования, откуда диск может переносить информацию в зону последовательной записи, после того как будут получены все необходимые блоки. Для управления неупорядоченной записью и фоновой дефрагментацией диск использует таблицу косвенного обращения. Однако, если корпоративным приложениям требуется предсказуемая и оптимизированная производительность, достичь этого по-прежнему можно лишь в случае, когда хост берет на себя полное управление всеми потоками данных и зонами записи.
Пока 2020-й год подкидывал сюрпризы вроде коронавируса, цен на нефть, беспорядков в США и возможных НЛО, в мире компьютерных комплектующих случился другой сюрприз. Как оказалось, Seagate и Western Digital, два лидера на рынке жестких дисков, уже несколько лет продают HDD с использованием технологии SMR, никому об этом не сказав. Это метод так называемой черепичной записи, которая с одной стороны позволяет увеличить емкость жестких дисков на 15 – 20%, но при этом имеет более низкую скорость чтения и записи, которая важна при использовании в бытовых, рабочих и игровых ПК. В этом материале мы подробнее расскажем, откуда растут ноги этой проблемы, чем хороши и в чем плохи SMR HDD и как отличить их от обычных PMR/CMR «хардов».
Как жесткий диск записывает данные: LMR и CMR
Как правило нормальные люди выбирают жесткие диски по нескольким привычным параметрам:
- Размер: ноутбучный 2.5 или стандартный 3.5
- Емкость жесткого диска. От 1 ТБ до 16 ТБ.
- Скорость вращения шпинделя, фактически соотношение скорости работы диска к его долговечности. Для домашних ПК стандартом являются 5400 и 7200 оборотов в минуту. Для серверных, где важна непрерывность процесса, чаще покупают винчестеры с 10 и 15 тысячами оборотов в минуту.
- Реже смотрят на размер буфера обмена.
О том, как именно диск производит запись и что там под капотом, большинство из нас не интересует. Но тут придется немного углубиться в матчасть. Изначально производители жестких дисков использовали систему продольной магнитной записи LMR, когда магнитные домены располагались параллельно плоскости пластины диска.
Затем в середине нулевых появилась перпендикулярная магнитная запись (или PMR/CMR), в которой домены развернулись вертикально по отношению к пластинам. Но идея осталась той же, что и с LMR: головки чтения и записи выполняют запись на необходимую дорожку, не затрагивая соседние.
Ради обновления пришлось полностью перестроить головки чтения и записи, однако профит того стоил: плотность записи выросла в три раза в сравнении с обычным LMR. Активный переход на PMR позволил компаниям вроде Toshiba и Seagate значительно поднять емкость обычных HDD выше их потолка. Говоря о современных винчестерах большинство из нас подразумевает как раз PMR HDD, которые для упрощения часто называют CMR или «conventional magnetic recording», что в переводе с английского означает «обычную магнитную запись».
Что такое SMR и чем это отличается от обычного PMR?
Ради уменьшения расстояния между дорожками была придумана аналогия с обычной черепицей. Как и в кровле дорожки при записи на жесткий диск накладываются друг на друга, увеличивая плотность покрытия «крыши». Профит — увеличение объема памяти жесткого диска. Из-за разных размеров головок чтения и записи при записи целевой дорожки часть информации записывается на соседнюю дорожку. И на другую соседнюю. И если информацию нужно переписать, то придется разбираться с таким «перехлестом» данных, который в некоторых случаях может даже привести к необходимости переписывать все дорожки зоны.
Но это полбеды. SMR HDD оснащаются дисковым кэшем на быстрых внешних дорожках, который дополняет традиционный кэш контроллера. Принцип работы в чем-то похож на SSD: при поступлении новых данных контроллер отправляет их в быстрый кэш, а потом записывает на сам диск. И если данных много, то кэш постоянно заполнен и не успевает быстро обновляться. А пока он не очистится и не отдышится, скорость записи приходится снижать. Поэтому при копировании больших массивов данных SMR HDD значительно снижают скорость записи в лучших традициях дешевых SSD с небольшим кэшем. Только одно дело говорить о «твердотельнике», который спускается с привычных 550 Мб/c до, например, 150 Мб/c. Другое дело — это жесткий диск, который и в лучшие времена не блистал скоростью, а тут буксует как застрявший в песочнице трехколесный велик.
Проблема в том, что нам врут
Как видим, SMR ― это обычная сделка технологий, за увеличение объема при той же цене пользователи получили падение скорости. Однако проблема тут совсем в другом. Официально, «черепичная» запись применяется в ДАТА-центрах и центрах обработки данных когда исповедуется принцип WORM (write once, read many). То есть когда данные именно хранятся на диске для регулярного чтения, но практически не перезаписываются. Чтобы понять возмущение покупателей таких дисков, представьте, что вы купили быструю и красивую Теслу, чтобы позже узнать, что в ней нет автопилота, а вместо двигателя на электрической тяге используется мощный ДВС от Ford Mustang. Рвет такой будь здоров, но тачку-то вы покупали совсем другую.
Как раскопали ребята из издания Blocks & Files, Seagate и Western Digital уже несколько лет хитрят, продавая SMR HDD под видом обычных CMR. По словам исследователя Кристиана Франке, который был далеко не первым, кто заметил след SMR, из-за особенностей этой технологии использование дисков с SMR совместно с «обычными» HDD со временем приводит к деградации массивов и выпадению из них дисков с SMR.
Что еще хуже, бренды-производители выбрали тактику «сам дурак», еще сильнее разозлив покупателей. На прямой вопрос о том, используется ли технология SMR в накопителях WD Red представители компании ответили, что не разглашают особенности внутреннего функционирования дисков конечным потребителям. На вопросы других энтузиастов, включая Франке, представители компании ответили тем же вежливым «идите лесом», но в других вариациях. Дошло даже до приглашения в видеоконференцию от ребят из технического отдела WD, но она так и не состоялась.
После публикации расследования от Blocks & Files ребята из WD выдавили из себя, что да, в дисках семейства WD Red таки используется SMR (хотя, раньше это отрицали), но мы решили не говорить вам об этом, так как тесты не показали никаких проблем с перестроением RAID из-за SMR. В свое оправдание в WD заявили, что в типичном сетевом хранилище для дома или малого бизнеса нагрузки скачкообразны и у системы остается куча времени на уборку «мусора». Журналисты справедливо заметили, что все люди разные, хранилище хранилищу рознь и вы, например, можете сутками туда-сюда гонять видео-исходники, снятые в 4K или 8K, создавая огромную нагрузку на дисковый массив.
Так чем плох SMR?
Как мы уже говорили, по своему принципу работы SMR-накопители с буфером похожи на SSD: вся память довольно медленная, но ее часть используется для быстрой буферизации записей в качестве псевдо-SLC-кеша. И вот сидите включаете вы какой-нибудь CrystalDiskMark и видите совершенно обычные для этого диска цифры. Сюрпризы начинаются тогда, когда объем записанных данных превышает размер области CMR. Или что еще хуже, заполняется весь диск и накопителю приходится оперативно «утрамбовывать информацию». SMR-де-факто становится узким бутылочным горлышком RAID-массива.
К примеру, при использовании массива RAID 5 с контрольными суммами, при записи большого объема данных вроде создания резервной копии, скорость системы со временем резко упадет. Порой даже на один-два порядка. Как писал один пользователь Reddit, время перестроения массивов SHR 1 и RAID 5 заняло у него порядка 4 суток. В комментариях некоторые писали, что это цветочки, как тебе 8 суток на бэкап, а Илон Маск? У некоторых пользователей перестроение и вовсе не получилось, в конце операции вылезала ошибка, а новый диск попросту исключался из массива как неисправный.
Также у SMR менее устойчивая производительность записи, чем у обычного CMR HDD. А это потенциальные проблемы при ресильвере (прим: процесс ресинхронизации и восстановления содержимого поврежденного устройства с использованием данных с уцелевших устройств) или других подобных операций с интенсивной записью. И на этом моменте многие задались справедливым вопросом, а кому вообще нужен медленный и ненадежный RAID-массив? Ким Кардашьян — самая популярная женщина мира, тысячи людей верят в плоскую землю, а все больше людей уверены, что биологический пол — это социальный конструкт. Разве у человечества мало проблем, а Western Digital?
Какие HDD используют черепичную запись?
По итогам того скандала WD сдалась и выкатила список HDD с SMR. В него вошли по 2 модели из линейки Blue, 4 винчестера Red и один Black. Чтобы не путаться в названиях и годах производства, советуем обращать внимания на артикули.
В отличие от WD, Seagate никогда не скрывала, что давно использует SMR в ноутбучных HDD и архивных Archive. Также Seagate никогда не использовала черепичную запись в линейках IronWolf для NAS, и вообще не рекомендует использовать такие варианты при работе с хранилищами. Впрочем, уехать вдаль на белом коне у них не получилось, про черепичную запись в некоторых десктопных винчестерах Barracuda все же мало кто знал.
Естественно, трясти начали буквально каждого производителя жестких дисков. Кто-то предпочел отмолчаться, кто-то пошел на повинную как Toshiba, впрочем сдавать жетон и пистолет никто не спешил. В итоге силами умельцев в сети собрался довольно внушительный список популярных жестких дисков, использующих черепичную запись.
Действительно ли SMR зло и как его распознать?
Очевидно, что список дисков с SMR со временем будет пополняться, а черепичная запись из-за своей дешевизны имеет большие шансы закрепиться на рынке. Проблемы с ними в первую очередь касается NAS-систем и RAID-массивов. Если же речь идет о бытовом компьютере, перед которым не требуется постоянно выполнять сложные операции чтения и записи, то вы можете даже не заметить, что используете такой накопитель. Особенно, если его получилось урвать по выгодной цене, а он используется чисто как довесок к основному SSD.
Тем не менее, сценарий «установил и забыл» подойдет не многим. В таком случае возникает вопрос, как распознать SMR, если производитель молчит? Тем более, что жесткие диски SMR из-за особенностей архитектуры могут вести себя по разному, усложняя расследование.
Во-первых, можно использовать фильтр SMR у нас на e-katalog. Во-вторых, воспользоваться той самой базой данных (на скрине сверху). Если вы уже купили подозрительный накопитель, то проще всего будет прогнать его через условный CrystalDiskMark и посмотреть на просадки скорости. Если график похож на пилу с множеством просадок-зубьев, то с большой долей вероятности это наш клиент.
Если диск еще не куплен, то советуем смотреть на размер буфера записи. Чем он больше — тем выше вероятность, что тут используется черепичная запись. Второй косвенный признак — это объем самого диска. Пока что «черепицу» нет особого смысла использовать в небольших моделях на 1 ТБ и ниже. Логичнее применять SMR в емких моделях от 4 и выше ТБ.
Впрочем, в списке выше вы можете увидеть модели от WD, Seagate и Toshiba на 1 – 2 ТБ с SMR. Их как бы немного, но они есть. Поэтому третье классическое правило — всегда ищите информацию в свежих обзорах. Судя по всему, официальные сайты в этот раз не помощники.
Читайте также: