Какой raid самый быстрый
«Какой уровень RAID самый надежный?» Все знают, что наиболее распространенным является уровень RAID5, однако он отнюдь не лишен серьезных недостатков, которые неочевидны для неспециалистов.
RAID 0, RAID 1, RAID 5, RAID 10 или что такое уровни RAID?
В своей статье я попытаюсь охарактеризовать самые популярные уровни RAID, а затем сформулирую рекомендации по использованию этих уровней. Для иллюстрации статьи я построил диаграмму, на которой поместил эти уровни в трехмерном пространстве надежности, производительности и ценовой эффективности.
JBOD (Just a Bunch of Disks) – это простое объединение (spanning) жестких дисков, которое уровнем RAID формально не является. Томом JBOD может быть массив из одного диска или объединение нескольких дисков. Контроллеру RAID для работы с таким томом не требуется проведение каких-либо вычислений. На нашей диаграмме диск JBOD служит в качестве «ординара» или отправной точки – его значения надежности, производительности и стоимости совпадают с соответствующими показателями единичного жесткого диска.
RAID 0 (“Striping”) избыточности не имеет, а информацию распределяет сразу по всем входящим в массив дискам в виде небольших блоков («страйпов»). За счет этого существенно повышается производительность, но страдает надежность. Как и в случае JBOD, за свои деньги мы получаем 100% емкости диска.
Поясню, почему уменьшается надежность хранения данных на любом составном томе – так как при выходе из строя любого из входящих в него винчестеров полностью и безвозвратно пропадает вся информация. В соответствии с теорией вероятностей математически надежность тома RAID0 равна произведению надежностей составляющих его дисков, каждая из которых меньше единицы, поэтому совокупная надежность заведомо ниже надежности любого диска.
Хороший уровень – RAID 1 (“Mirroring”, «зеркало»). Он имеет защиту от выхода из строя половины имеющихся аппаратных средств (в общем случае – одного из двух жестких дисков), обеспечивает приемлемую скорость записи и выигрыш по скорости чтения за счет распараллеливания запросов. Недостаток заключается в том, что приходится выплачивать стоимость двух жестких дисков, получая полезный объем одного жесткого диска.
Изначально предполагается, что жесткий диск – вещь надежная. Соответственно, вероятность выхода из строя сразу двух дисков равна (по формуле) произведению вероятностей, т.е. ниже на порядки! К сожалению, реальная жизнь – не теория! Два винчестера берутся из одной партии и работают в одинаковых условиях, а при выходе из строя одного из дисков нагрузка на оставшийся увеличивается, поэтому на практике при выходе из строя одного из дисков следует срочно принимать меры – вновь восстанавливать избыточность. Для этого с любым уровнем RAID (кроме нулевого) рекомендуют использовать диски горячего резерва HotSpare. Достоинство такого подхода – поддержание постоянной надежности. Недостаток – еще большие издержки (т.е. стоимость 3-х винчестеров для хранения объема одного диска).
Зеркало на многих дисках – это уровень RAID 10. При использовании такого уровня зеркальные пары дисков выстраиваются в «цепочку», поэтому объем полученного тома может превосходить емкость одного жесткого диска. Достоинства и недостатки – такие же, как и у уровня RAID1. Как и в других случаях, рекомендуется включать в массив диски горячего резерва HotSpare из расчета один резервный на пять рабочих.
RAID 5, действительно, самый популярный из уровней – в первую очередь благодаря своей экономичности. Жертвуя ради избыточности емкостью всего одного диска из массива, мы получаем защиту от выхода из строя любого из винчестеров тома. На запись информации на том RAID5 тратятся дополнительные ресурсы, так как требуются дополнительные вычисления, зато при чтении (по сравнению с отдельным винчестером) имеется выигрыш, потому что потоки данных с нескольких накопителей массива распараллеливаются.
Недостатки RAID5 проявляются при выходе из строя одного из дисков – весь том переходит в критический режим, все операции записи и чтения сопровождаются дополнительными манипуляциями, резко падает производительность, диски начинают греться. Если срочно не принять меры – можно потерять весь том. Поэтому, (см. выше) с томом RAID5 следует обязательно использовать диск Hot Spare.
Помимо базовых уровней RAID0 - RAID5, описанных в стандарте, существуют комбинированные уровни RAID10, RAID30, RAID50, RAID15, которые различные производители интерпретируют каждый по-своему.
Суть таких комбинаций вкратце заключается в следующем. RAID10 – это сочетание единички и нолика (см. выше). RAID50 – это объединение по “0” томов 5-го уровня. RAID15 – «зеркало» «пятерок». И так далее.
Таким образом, комбинированные уровни наследуют преимущества (и недостатки) своих «родителей». Так, появление «нолика» в уровне RAID 50 нисколько не добавляет ему надежности, но зато положительно отражается на производительности. Уровень RAID 15, наверное, очень надежный, но он не самый быстрый и, к тому же, крайне неэкономичный (полезная емкость тома составляет меньше половины объема исходного дискового массива).
RAID 6 отличется от RAID 5 тем, что в каждом ряду данных (по английски stripe) имеет не один, а два блока контрольных сумм. Контрольные суммы - "многомерные", т.е. независимые друг от друга, поэтому даже отказ двух дисков в массиве позволяет сохранить исходные данные. Вычисление контрольных сумм по методу Рида-Соломона требует более интенсивных по сравнению с RAID5 вычислений, поэтому раньше шестой уровень практически не использовался. Сейчас он поддерживается многими продуктами, так как в них стали устанавливать специализированные микросхемы, выполняющие все необходимые математические операции.
Согласно некоторым исследованиям, восстановление целостности после отказа одного диска на томе RAID5, составленном из дисков SATA большого объема (400 и 500 гигабайт), в 5% случаев заканчивается утратой данных. Другими словами, в одном случае из двадцати во время регенерации массива RAID5 на диск резерва Hot Spare возможен выход из строя второго диска. Отсюда рекомендации лучших RAIDоводов: 1) всегда делайте резервные копии; 2) используйте RAID6!
Недавно появились новые уровни RAID1E, RAID5E, RAID5EE. Буква "Е" в названии означает Enhanced.
RAID level-1 Enhanced (RAID level-1E) комбинирует mirroring и data striping. Эта смесь уровней 0 и 1 устроена следующим образом. Данные в ряду распределяются точь-в-точь так, как в RAID 0. То есть ряд данных не имеет никакой избыточности. Следующий ряд блоков данных копирует предыдущий со сдвигом на один блок. Таким образом как и в стандартном режиме RAID 1 каждый блок данных имеет зеркальную копию на одном из дисков, поэтому полезный объем массива равен половине суммарного объема входящих в массив жестких дисков. Для работы RAID 1E требуется объединение трех или более дисков.
Мне очень нравится уровень RAID1E. Для мощной графической рабочей станции или даже для домашнего компьютера - оптимальный выбор! Он обладает всеми достоинствами нулевого и первого уровней - отличная скорость и высокая надежность.
Перейдем теперь к уровню RAID level-5 Enhanced (RAID level-5E). Это то же самое что и RAID5, только со встроенным в массив резервным диском spare drive. Это встраивание производится следующим образом: на всех дисках массива оставляется свободным 1/N часть пространства, которая при отказе одного из дисков используется в качестве горячего резерва. За счет этого RAID5E демонстрирует наряду с надежностью лучшую производительность, так как чтение/запись производится параллельно с бОльшего числа накопителей одновременно и spare drive не простаивает, как в RAID5. Очевидно, что входящий в том резервный диск нельзя делить с другими томами (dedicated vs. shared). Том RAID 5E строится минимум на четырех физических дисках. Полезный объем логического тома вычисляется по формуле N-2.
Как ни странно, никаких упоминаний об уровне RAID 6E на просторах Интернета я не нашел - пока такой уровень никем из производителей не предлагается и даже не анонсируется. А ведь уровень RAID6E ( или RAID6EE? ) можно предложить по тому же принципу, что и предыдущий. Диск HotSpare обязательно должен сопровождать любой том RAID, в том числе и RAID 6. Конечно, мы не потеряем информацию при выходе из строя одного или двух дисков, но начать регенерацию целостности массива крайне важно как можно раньше, чтобы скорее вывести систему из "критического" режима. Поскольку необходимость диска Hot Spare для нас не подлежит сомнению, логичным было бы последовать дальше и "размазать" его по тому так, как это сделано в RAID 5EE, чтобы получить преимущества от использования бОльшего количества дисков (лучшая скорость на чтении-записи и более быстрое восстановление целостности).
Уровни RAID в "числах".
В таблицу я собрал некоторые важные параметры почти всех уровней RАID, чтобы можно было сопоставить их между собой и четче понять их суть.
Произво дительность записи
Все "зеркальные" уровни — RAID 1, 1+0, 10, 1E, 1E0.
Давайте еще раз попробуем досконально разобраться, чем же различаются эти уровни?
RAID 1.
Это - классическое "зеркало". Два (и только два!) жестких диска работают как один, являясь полной копией друг друга. Выход из строя любого из этих двух дисков не приводит к потере ваших данных, так как контроллер продолжает работу с оставшимся диском. RAID1 в цифрах: двукратная избыточность, двукратная надежность, двукратная стоимость. Производительность на запись эквивалентна производительности одного жесткого диска. Производительность чтения выше, так как контроллер может распределять операции чтения между двумя дисками.
RAID 10.
Суть этого уровня в том, что диски массива объединяются парами в "зеркала" (RAID 1), а затем все эти зеркальные пары в свою очередь объединяются в общий массив с чередованием (RAID 0). Именно поэтому его иногда обозначают как RAID 1+0. Важный момент - в RAID 10 можно объединить только четное количество дисков (минимум - 4, максимум - 16). Достоинства: от "зеркала" наследуется надежность, от "нуля" - производительность как на чтение, так и на запись.
RAID 1Е.
Буква "E" в названии означает "Enhanced", т.е. "улучшенный". Принцип этого улучшения следующий: данные блоками "чередуются" ("striped") на все диски массива, а потом еще раз "чередуются" со сдвигом на один диск. В RAID 1E можно объединять от трех до 16 дисков. Надежность соответствует показателям "десятки", а производительность за счет большего "чередования" становится чуть лучше.
RAID 1Е0.
Этот уровень реализуется так: мы создаем "нулевой" массив из массивов RAID1E. Следовательно, общее количество дисков должно быть кратно трем: минимум три и максимум - шестьдесят! Преимущество в скорости при этом мы вряд ли получим, а сложность реализации может неблагоприятно отразиться на надежности. Главное достоинство - возможность объединить в один массив очень большое (до 60) количество дисков.
Сходство всех уровней RAID 1X заключается в их показателях избыточности: ради реализации надежности жертвуется ровно 50% суммарной емкости дисков массива.
Технология объединения физических дисков в логический том — RAID — имеет огромное количество вариаций. Практическую реализацию в системах хранения данных и серверном оборудовании можно встретить у следующих спецификаций: RAID 0, 1, 3, 4, 5, 6, DP, 10, 50, 60, однако в коммерческом применении как правило используются только некоторые из них.
Таблица сравнения коммерчески используемых типов RAID
Тип RAID | Производительность в IOPS при операциях записи | Производительность во время цикла восстановления (Rebuild) | Время восстановления RAID | Эффективность использования дискового пространства |
RAID 5 | Хорошая | Плохая | Плохое | Очень хорошая |
RAID 6 | Плохая | Хорошая | Плохое | Хорошая |
RAID 10 | Лучшая | Лучшая | Лучшее | Плохая |
RAID DP | Очень хорошая | Очень хорошая | Хорошее | Хорошая |
RAID TEC | Хорошая | Хорошая | Хорошее | Очень хорошая |
RAID 0
RAID 0 — массив дисков с чередованием данных (страйп). При использовании RAID 0 блоки данных записываются по очереди на каждый диск, что существенно увеличивает производительность операций чтения и записи. Избыточность данных отсутствует, поэтому выход из строя любого диска ведет к потере данных всей RAID-группы.
Использование:
Рекомендуется использовать RAID 0 для быстрого доступа к неважным или временным данным, когда требуется высокая производительность и имеется возможность в случае сбоя восстановить информацию. Типичным сценарием использования можно назвать пост-обработку видео или кэширование данных.
-
Преимущества:
- самая высокая скорость чтения и записи;
- 100% эффективность использования дискового пространства.
-
Недостатки:
- самая низкая надежность хранения данных.
Формула эффективности:
S * N, где N — количество дисков в массиве, S — объем наименьшего диска.
RAID 1
RAID 1 — зеркалированный массив дисков (зеркало). Блоки данных записываются на все диски одновременно, поэтому допустим выход из строя всех дисков, кроме одного. Данная конфигурация обладает наименьшей эффективностью использования дискового пространства, и, как следствие, наибольшей стоимостью при использовании трех и более дисков.
Использование:
Рекомендуется использовать RAID 1 для максимального повышения надежности хранения и доступности данных. Наиболее частым сценарием является зеркалирование двух системных дисков серверов.
-
Преимущества:
- самая высокая степень надежности при использовании трех и более дисков;
- самая высокая скорость чтения за счет параллельных запросов ко всем дискам сразу.
-
Недостатки:
- самая низкая эффективность использования дискового пространства при трех и более дисках;
- незначительное снижение скорости записи в IOPS по сравнению с RAID 0, DP, 10.
Формула эффективности:
S, где S — объем наименьшего диска.
RAID 3
RAID 3 — массив дисков с побайтным чередованием с одним выделенным диском четности на группу. Байты данных записываются поочередно на все диски, кроме одного. Отдельный диск выделяется для хранения информации о четности.
Использование:
Из-за побайтового чередования RAID 3 подходит для работы с большими файлами, однако на практике не используется в коммерческих задачах в связи с невысокой надежностью.
-
Преимущества:
- значительное повышение скорости чтения по сравнению с дисками, не объединенными в RAID;
- высокая эффективность использования дискового пространства по сравнению с RAID 1, 6, DP, 10;
- базовый уровень надежности, допустим выход из строя одного диска.
-
Недостатки:
- снижена скорость записи в IOPS по сравнению с RAID 0, DP, 10;
- высокая нагрузка на диск четности и, как следствие, снижение его срока эксплуатации;
- в случае выхода из строя диска четности, процесс восстановления (rebuild) RAID-группы резко повышает нагрузку на диски, что может спровоцировать выход второго диска внутри группы и привести к потере данных;
- низкая скорость работы с блоками малого размера.
Формула эффективности:
S * (N - 1), где N — количество дисков в массиве, S — объем наименьшего диска.
RAID 4
RAID 4 — массив дисков с поблочным чередованием с одним выделенным диском четности на группу. Принцип работы похож на RAID 3, но данные разбиваются не на байты, а на блоки. Это увеличивает производительность при работе с небольшими файлами. Слабым местом RAID 4 является диск четности, на который ложится большая нагрузка в RAID-группе. Как следствие, диск четности почти всегда первым выходит из строя.
Использование:
RAID 4 ранее использовался в дисковых массивах NetApp серии FAS, где недостаток надежности компенсировался принципом записи файловой системы WAFL (Write Anywhere File Layout). Рекомендуется только для временных и неважных данных. На данный момент RAID 4 в СХД NetApp вытесняется RAID DP.
В соответствии с рекомендациями компании NetApp, оптимальный размер RAID группы для NL-SAS составляет 7 дисков; для SAS или SSD — от 8 до 14 дисков.
-
Преимущества:
- значительное повышение скорости чтения по сравнению с дисками, не объединенными в RAID;
- высокая эффективность дискового пространства по сравнению с RAID 1, 6, DP, 10;
- базовый уровень надежности, допустим выход из строя одного диска.
-
Недостатки:
- высокая нагрузка на диск четности и, как следствие, снижение срока эксплуатации (за исключением использования в системах NetApp серии FAS);
- в случае выхода из строя диска четности, процесс восстановления (rebuild) RAID-группы резко повышает нагрузку на диски, что может спровоцировать выход второго диска внутри группы и привести к потере данных.
Формула эффективности:
S * (N - 1), где N — количество дисков в массиве, S — объем наименьшего диска.
RAID 5
RAID 5 — массив дисков с поблочным чередованием с одной контрольной суммой. При построении RAID 5 для контрольных сумм не выделяется отдельный диск, как в RAID 4, вместо этого данные циклически записываются на все диски. Аналогично RAID 4, RAID 5 позволяет производить параллельную запись, что существенно увеличивает производительность. Нагрузка на диск четности равномерно распределяется по всем дискам в массиве.
Использование:
RAID 5 широко применяется в реальных бизнес-задачах. Типовым сценарием является использование в серверах в области хранения данных для пользовательских приложений и выполнения транзакций. Использовать в СХД рекомендуется в первую очередь для маловажной информации с небольшой нагрузкой на диски, например, в системах видеонаблюдения.
-
Преимущества:
- значительное повышение скорости чтения по сравнению с дисками, не объединенными в RAID;
- высокая эффективность использования дискового пространства в сравнении с RAID 1, 6, DP, 10;
- базовый уровень надежности, допустим выход из строя одного диска.
-
Недостатки:
- в случае выхода из строя одного диска, процесс восстановления (rebuild) RAID-группы резко повышает нагрузку на диски, что может спровоцировать выход второго диска внутри группы и привести к потере данных;
- незначительное снижение скорости записи в IOPS по сравнению с RAID 0, DP, 10.
Формула эффективности:
S * (N - 1), где N — количество дисков в массиве, S — объем наименьшего диска.
RAID 6
RAID 6 — массив дисков с поблочным чередованием с двумя контрольными суммами. Данные распределяются по дискам массива по очереди, в качестве информации для восстановления используется схема двойной четности. RAID 6 может выдержать отказ двух дисков одновременно, однако низкая производительность по операциям ввода-вывода (IOPS) ограничивает область применения.
Использование:
Сценарии применения RAID 6 аналогичны RAID 5 с уклоном в более надежное хранение информации. RAID 6 широко применяется в системах хранения данных, где не важна высокая транзакционная производительность — архивное хранение, видеонаблюдение стратегических объектов, использование в системах безопасности, а также для надежного хранения критически важных данных.
-
Преимущества:
- значительное повышение скорости чтения по сравнению с дисками, не объединенными в RAID;
- высокая степень надежности по сравнению с RAID 5, допустим выход из строя двух дисков.
-
Недостатки:
- самая низкая скорость записи в IOPS;
- эффективность использования дискового пространства ниже, чем у RAID 5.
Формула эффективности:
S * (N - 2), где N — количество дисков в массиве, S — объем наименьшего диска.
RAID DP
RAID DP — массив дисков с двойной четностью в линейке продукции FAS компании NetApp. Под контрольные суммы выделяются два отдельных диска. Благодаря использованию файловой системы WAFL транзакционная производительность выше, чем в RAID 5 и RAID 6.
Использование:
Является основным типом RAID в оборудовании NetApp линейки FAS. Рекомендуется для SSD дисков, SATA/NL-SAS дисков объемом менее 6TB (для дисков большего объема рекомендуется RAID-TEC).
В соответствии с рекомендациями компании NetApp, оптимальный размер RAID группы — от 14 до 20 дисков.
-
Преимущества:
- высокая скорость чтения по сравнению с дисками, не объединенными в RAID;
- высокая скорость записи в IOPS по сравнению с RAID 5 и RAID 6, приближается к RAID 10;
- высокая степень надежности по сравнению с RAID 5, допустим выход из строя двух дисков.
-
Недостатки:
- данный RAID используется только в дисковых массивах NetApp серии FAS;
- эффективность использования дискового пространства ниже чем у RAID 5.
Формула эффективности:
S * (N - 2), где N — количество дисков в массиве, S — объем наименьшего диска.
RAID TEC
RAID TEC — массив дисков с тройной четностью в линейке продукции FAS компании NetApp. Данный тип RAID разработан для медленных объемных дисков с устойчивой производительностью во время восстановления.
Использование:
Рекомендуется для SATA/NL-SAS дисков объемом 6TB и более.
В соответствии с рекомендациями компании NetApp, оптимальный размер RAID группы — от 20 до 29 дисков.
-
Преимущества:
- высокая скорость чтения по сравнению с дисками, не объединенными в RAID;
- высочайшая степень надежности в сочетании с хорошей эффективностью хранения (около 89% при RAID группе в 29 дисков).
-
Недостатки:
- данный RAID используется только в дисковых массивах NetApp серии FAS.
Формула эффективности:
S * (N - 3), где N — количество дисков в массиве, S — объем наименьшего диска.
RAID 10
RAID 10 — массив дисков с зеркалированием и чередованием. Представляет собой массив RAID 0 из нескольких массивов RAID 1. В реализации RAID 10 на практике каждый подмассив RAID 1 состоит из двух дисков, поэтому допускается выход из строя не более одного диска в каждом подмассиве. RAID 10 обладает самой высокой производительностью и надежностью, при этом эффективность использования дискового пространства составляет 50%.
Использование:
Основным сценарием применения является использование для работы с базами данных (Oracle, SAP HANA, SQL) и другими высокотранзакционными нагрузками.
-
Преимущества:
- самая высокая скорость чтения и записи среди коммерчески используемых типов RAID;
- повышенная надежность по сравнению с RAID 5.
-
Недостатки:
- эффективность использования дискового пространства 50%.
Формула эффективности:
S * N / 2, где N — количество дисков в массиве, S — объем наименьшего диска.
RAID 50
RAID 50 — массив дисков, состоящий из чередования массивов RAID 5. Реализуется построением страйпа (RAID 0) из RAID 5. Допускается отказ не более одного диска в каждом подмассиве. Производительность RAID 50 выше, чем при использовании RAID 5, и стремится к RAID10, но надежность недостаточна для применения в реальных бизнес-задачах.
Использование:
Поддерживается ограниченным количеством производителей, т.к. не рекомендуется к использованию ввиду низкой надежности. Возможная модель использования предполагает хранения временных или неважных данных.
-
Преимущества:
- значительное повышение скорости чтения по сравнению с дисками, не объединенными в RAID;
- высокая эффективность использования дискового пространства по сравнению с RAID 1, 6, DP, 10.
-
Недостатки:
- незначительное снижение скорости записи в IOPS по сравнению с RAID 0, DP, 10;
- недостаточная надежность для коммерческого использования.
Формула эффективности:
S * (N - 2), где N — количество дисков в массиве, S — объем наименьшего диска.
RAID 60
RAID 60 — массив дисков, состоящий из чередования массивов RAID 6. Реализуется построением страйпа (RAID 0) из RAID 6. Допускается отказ до двух дисков в каждом подмассиве. Обладает базовой надежностью и невысокой эффективностью используемого пространства . Для построения минимальной RAID-группы требуется 8 дисков.
Использование:
Поддерживается ограниченным количеством производителей, т.к. не обладает явными преимуществами по сравнению с использованием других типов RAID. Область практического применения ограничена.
-
Преимущества:
- значительное повышение скорости чтения по сравнению с дисками, не объединенными в RAID;
- базовая надежность хранения.
-
Недостатки:
- невысокая эффективность использования дискового пространства по сравнению с RAID 5, 6, DP.
- скорость записи в IOPS ниже, чем у RAID 0, DP, 10.
Формула эффективности:
S * (N - 4), где N — количество дисков в массиве, S — объем наименьшего диска.
Цель данного тестирования — выяснить, с какой реальной скоростью смогут работать виртуальные машины в raw файловых образах, если разместить их на 4-х производительных SSD-дисках. Тестирование будет производится в 32 потока, чтобы приблизительно создать условия работы реального гипервизора.
Замеры будем производить при помощи инструмента fio.
Для mdadm+ext4 были выбраны опции --buffered=0 --direct=1. ZFS не умеет работать с этими опциями, поэтому ожидается, что результат ZFS будет несколько выше. Для сравнения я также отключу эти опции в одном из тестов и для варианта с mdadm.
Мы будем проводить тест с файлом размером в 10ГБ. Предположительно, что этого размера достаточно, чтобы оценить производительность файловой системы при выполнении рутинных операций. Разумеется, если увеличить объем тестовых данных, то общие цифры по всем тестам будут значительно ниже, так как мы сведем на нет все дополнительные средства кеширования и предсказания на файловых системах. Но такой цели нет. Нам нужны не сухие цифры синтетического тестирования, а что-то более приближенное к реальной жизни.
В качестве тестового стенда используем следующую конфигурацию:
Производитель:
Supermicro X9DRT-HF+
Процессоры:
2x Intel® Xeon® CPU E5-2690 0 @ 2.90GHz C2
Техпроцесс — 32 нм
Количество ядер — 8
Количество потоков — 16
Базовая частота процессора — 2,90 ГГц
Максимальная турбо частота — 3,80 ГГц
Кэш 20 МБ SmartCache
Скорость шины — 8 GT/s QPI
TDP — 135 Вт
Оперативная память:
16x 16384 MB
Тип: DDR3 Registered (Buffered)
Частота: 1333 MHz
Производитель: Micron
Дисковый контроллер:
LSI SAS 2008 RAID IT mode
Твердотельные диски:
4x 1.92Tb SSD Sandisk CloudSpeed ECO Gen. II
SSD, 2.5", 1920 Гб, SATA-III, чтение: 530 Мб/сек, запись: 460 Мб/сек, MLC
Заявленный IOPS произвольного чтения/записи 76000/14000 IOPS
Время наработки на отказ 2000000 ч.
Версия ZFS:
v0.7.3-1
Планировщик IO:
Тестовый инструмент:
fio-2.16
Параметры сборки массивов
Под arc выделено 1/4 всей памяти или 52 ГБ
Результаты
В тесте на чтение явно видно влияние буфера ARC на работу файловой системы ZFS. ZFS демонстрирует ровную и высокую скорость во всех тестах. Если выключить --buffered=0 --direct=1 скорость на mdadm raid10 + ext4 по ZFS оказывается в 3 раза медленнее и в 10 раз медленнее по части задержек и IOPS.
Наличие дополнительных дисков в zraid не дает существенного прироста скорости для ZFS. ZFS 0+1 — это так же медленно, как и zraid.
Вот тут ARC никак не спасает ZFS. Цифры наглядно показывают положение дел.
Опять же, буферы помогают ZFS давать ровный результат на всех массивах. mdadm raid6 явно пасует перед raid5 и raid10. Буферизированный и кэшированный mdadm raid10 дает вдвое лучший результат через все варианты на ZFS.
Картина аналогичная и по случайному чтению. ZFS не помогают его буферы и кеши. Он сливает со страшной силой. Особенно пугает результат одиночного диска на ZFS и в целом результаты по ZFS отвратительные.
По mdadm raid5/6 все ожидаемо. Raid5 медленный, raid6 еще медленней, а raid10 примерно на 25-30 % быстрее одиночного диска. Raid10 с буферизацией уносит массив в космос.
Выводы
Как всем известно, ZFS не быстр.
Он содержит десятки других важных возможностей и достоинств, но это не отменяет того факта, что он существенно медленнее, чем mdadm+ext4, даже с учетом работы кешей и буферов, систем предсказаний и так далее. По этой части неожиданностей нет.
ZFS версий v0.7.x не стал существенно быстрее.
Возможно, быстрее чем v0.6.x, но далек до mdadm+ext4.
Можно найти информацию, что zraid/2 — это улучшенная версия raid5/6, но не по части производительности.
Использование zraid/2 или 0+1 не позволяет добиться более высокой скорости от массива, чем одиночный диск ZFS.
В лучшем случае, скорость будет не ниже или совсем немного выше. В худшем, наличие дополнительных дисков замедлит общую скорость работы. Raid для ZFS — это средство повышения надежности, но не производительности.
Наличие большого ARC не позволит компенсировать отставание ZFS по производительности относительно того же ext4.
Как вы можете увидеть, даже буфер размером в 50 ГБ не способен существенно помочь ZFS не отставать от младшего брата EXT4. Особенно на операциях случайной записи и чтения.
Вы не знаете, какой выбрать между Raid 10 и Raid 5? Если да, то узнайте ответ здесь, прежде чем выбрать правильную конфигурацию. В этой статье мы собираемся сравнить эти два уровня, чтобы определить, какая версия подойдет для вашего хранилища данных и потребностей сервера.
Во-первых, мы определим эти уровни отдельно, а затем перейдем к Рейд 10 против Рейда 5 сравнение. Это руководство поможет вам выбрать правильное решение для ваших требований. Кроме того, взгляните на сравнительную таблицу этих двух уровней в этой статье.
Что вы имеете в виду под Raid 5?
В конце концов, жесткие драйверы на выделенных серверах выходят из строя. Нет никакого смысла в этом факте. Все уровни Raid, за исключением Raid 0, снижают вероятность потери данных и простоев с поврежденного жесткого диска на выделенном сервере. Решение Raid повышает производительность ввода-вывода благодаря значительным улучшениям скорости записи и чтения. Рейд 0 только используется для производительности ввода-вывода. Этот уровень не помогает с избыточностью, как другие уровни рейда.
Сервер Raid 5 - это исправление, специально разработанное как хранилище. Его конфигурация увеличивает пространство за счет использования четности для достижения чередования данных. Это означает, что в случае отказа любого из жестких дисков система не пострадает. В случае отказа двух жестких дисков пользователи могут потерять свои данные.
Если вам интересно, как это происходит, продолжайте читать. В конфигурации Raid 5 есть три диска. Предположим, что один из жестких дисков выходит из строя, тогда Raid 5 работает как самоисцелитель. Эта технология гарантирует, что восстановление данных начинается немедленно из-за паритета среди доступных запасных дисков. Как указано выше, если два из этих жестких дисков перестанут работать одновременно, ваши данные будут потеряны, к сожалению.
Из-за чередования конфигурация Raid 5 предлагает улучшение производительности в два раза для функций чтения. Тем не менее, вы должны рассмотреть несколько моментов, прежде чем выбрать Рейд 5. Итак, взгляните на эти проблемы сейчас!
- Рейд 5 занимает около нескольких дней, чтобы восстановить большие диски размером более 2 ТБ. Период перестроения подвергает риску данные, поскольку сервер усердно работает для расчета недостающих данных. Когда ваш сервер работает усердно, он работает очень медленно и даже становится непригодным для использования во время перестроения. Таким образом, вы должны учитывать это при переходе на Raid 5.
- Если URE (Неисправимая ошибка чтения) происходит во время перестроения, тогда все ваши данные будут потеряны. Нельзя восстановить эти данные, и, следовательно, они исчезли навсегда только потому, что массив поврежден из-за URE.
преимущества
- Отличный баланс цены, производительности, эффективности хранения и отказоустойчивости
- Быстро читает
Недостатки бонуса без депозита
- Медленный процесс восстановления после сбоя
- Терпеть только отказ одного диска
Имея эти риски под рукой, Raid 5 рекомендуется для пользователей, у которых есть небольшие диски с низким URE. Теперь вы получите представление о Raid 5; пришло время перейти к другому.
Что вы имеете в виду под Raid 10?
Raid 10 подходит для хостинга и производственных серверов. Это потому, что этот массив увеличивает производительность в пространстве. Из-за высокого баланса между безопасностью и производительностью данных большинство коммерческих операций обычно предпочитают решение Raid 10. По этой причине Raid 10 оказывается надежным массивом для выделенных серверных систем. Если сайт сильно зависит от базы данных, Raid 10 будет работать лучше, чем Raid 5 для вас.
Raid 10 сочетает в себе характеристики Raid 0 и Raid 1, имея чередование и зеркалирование. Здесь чередование повышает производительность ввода-вывода, так как распределяет данные между несколькими дисками и дисками. Кроме того, зеркалирование гарантирует безопасность данных.
Стоит отметить, что в Raid 10 с четырьмя дисками может произойти сбой двух дисков без потери данных, если диски не были в аналогичном зеркальном массиве. В случае, если у вас есть восемь дисков в Raid 10, четыре диска могут выйти из строя без потери данных, если умирают нужные диски. Итак, в этом главное отличие Raid 10 от Raid 5, как и с массивом Raid 5; если два диска выйдут из строя, то игра закончится независимо от того, сколько дисков у вас есть.
Пользователи могут представить себе, как любой веб-сайт, использующий большое количество баз данных и запросов, будет работать лучше с Raid 10. Имея только четыре диска, конфигурация Raid 10 обеспечит 2-кратную скорость записи и 4-кратное увеличение скорости чтения. Принимая во внимание, что Raid 5 с тремя дисками обеспечит не запись, а увеличение скорости чтения в 2 раза.
преимущества
- Быстро пишет и читает
- Быстрое восстановление после сбоя
- Лучше отказоустойчивый, чем Raid 5
Недостатки бонуса без депозита
Рейд 10 против Рейда 5: Ключевые различия
Теперь вы знаете, что означают Рейд 10 и Рейд 5, настало время перейти к нашему сравнению Рейд 10 и Рейд 5. Основное различие между ними заключается в процедуре, которой они следуют для восстановления дисков, если один из них сдулся. Raid 10 прочтет оставшиеся в живых и скопирует содержимое на новый диск, который вы добавите в этот массив при замене поврежденного диска.
Тем не менее, Raid 5 потребует, чтобы пользователи просматривали каждый диск, чтобы рассчитать недостающий контент и восстановить его. Затем это приводит к огромной нагрузке ввода-вывода, которая, в свою очередь, увеличивает шансы на повреждение второго диска. Более того, такая большая нагрузка на диск может привести к простою, поскольку накопители записывают и читают так много данных, что другие приложения не могут записывать или считывать данные для их работы. В случае, если нагрузка не слишком велика для приложений, процесс перестройки с Raid 5 занимает намного больше времени, чем в конфигурации Raid 10.
Помните, что Raid 10 распределяет все данные по различным группам дисков и копирует данные в массиве Raid, где он создает копию на каждом диске. С другой стороны, в этом массиве Raid 5 хранит ваши данные на трех дисках одинаково, что помогает повысить производительность чтения.
Избыточный массив независимых дисков (RAID) объединяет различные физические диски в виртуальное запоминающее устройство, что обеспечивает большую емкость хранилища и отказоустойчивость, что позволяет восстанавливать данные в случае отказа любого из физических жестких дисков.
Конфигурации RAID могут быть организованы в такие уровни, как Raid 10, Raid 5, Raid 6, Raid 1 и Raid 0. Уровни рейдов от 0 до 6 считаются стандартными. Наиболее распространенными конфигурациями являются Raid 0 (известный для чередования, где данные фрагментированы на блоки на разных физических дисках), Raid 1 (известный для зеркального отображения, где копии данных хранятся на разных дисках для избыточности), Raid 5 (известный для распределенной четности включая чередование и хранение информации о четности) и Raid 6 (известный как двойной четности).
Рейд 10 против Рейда 5 Сравнительная таблица
Теперь давайте кратко рассмотрим функции Raid 10 и Raid 5 в следующей сравнительной таблице Raid 10 и Raid 5.
Особенности | Рейд 10 | Рейд 5 |
Ключевой особенностью | Зеркальное чередование: сочетает зеркальное отображение и чередование для повышения производительности и отказоустойчивости. | Паритет с чередованием |
Чередование | Да, равномерно распределить данные по группам дисков. Каждая группа владеет двумя дисками, которые настроены как зеркальные изображения. Таким образом, Raid 10 сочетает в себе функции как Raid 1, так и Raid 0 | Да, данные чередуются равномерно среди всех дисков Raid. Кроме того, информация о четности хранится только одна. Таким образом, восстановление данных возможно в случае отказа любого диска |
Отказоустойчивость, избыточность и зеркалирование | Его функция зеркалирования данных делает его отказоустойчивым. Если драйвер поврежден, данные могут быть быстро восстановлены путем копирования на другие диски | Нет избыточности или зеркалирования. Здесь отказоустойчивость может быть достигнута путем измерения и сохранения информации о четности. Он терпит один сбой физического диска |
Быстродействие | Быстрые операции чтения из-за чередования, а также быстрые операции записи, поскольку каждый блок данных требует зеркального отражения или записи дважды. Здесь записи происходят на двух разных дисках для параллельного появления. Нет необходимости рассчитывать информацию о четности | Быстрое чтение из-за чередования данных на нескольких физических дисках. Здесь записи выполняются немного медленнее из-за необходимости измерения информации о четности. Поскольку четность рассчитывается, диск не становится узким местом |
Использование | Хотя производительность важна для операций записи и чтения, а также для быстрого восстановления после сбоя | Эффективный баланс достойной производительности, эффективного хранения, хорошей безопасности и устойчивости к сбоям. Идеально подходит для приложений и файловых серверов, имеющих ограниченный номер. жестких дисков |
Необходимое минимальное количество дисков | 4 | 3 |
Паритетный диск | Контрольная сумма и четность не измеряются в конфигурации Raid 10 | Информация о четности распространяется на все физические диски. Если какой-либо диск поврежден, информация о четности используется для восстановления данных, хранящихся на диске |
преимущества | Быстрое восстановление данных в случае сбоя диска | Отказоустойчивость, быстрое чтение и недорогое резервирование. Здесь данные могут быть доступны во время восстановления неисправного диска |
Недостатки бонуса без депозита | Использование диска составляет всего 50%. Таким образом, это недорого для получения избыточности при хранении по сравнению с хранением информации о четности | Восстановление после сбоя происходит медленно из-за вычислений четности для восстановления содержимого и восстановления замещающего диска. Можно читать из системы Raid, но функции чтения в течение этого времени могут быть довольно медленными. |
Часто задаваемые вопросы по рейду 10 против рейда 5
Здесь мы перечислили некоторые из наиболее распространенных вопросов, задаваемых людьми при сравнении Raid 10 и Raid 5. Посмотрите на эти вопросы, чтобы узнать ответы на некоторые распространенные вопросы, и ваш вопрос будет решен в течение минуты.
Сколько дисков вам нужно для Raid 10 против Raid 5?
Минимальное количество драйверов для Raid 10 - четыре, а для массива Raid 5 - 3.
Какие вопросы вы должны задать при выборе идеального решения Raid?
Основной вопрос, который вам нужно задать, - насколько важны оптимальная производительность и полное резервирование. Рейд 10 будет лучшей конфигурацией, если вы решите воспользоваться всеми этими двумя функциями.
Вам нужно создавать резервные копии, если у вас есть Raid?
Да, конечно. Рейд не является правильной заменой регулярных резервных копий. Некоторые уровни Raid могут помочь избежать потери данных только в случае повреждения диска; Существуют различные сценарии, в которых поврежденные данные могут проходить через Raid и записываться на все диски, содержащие подобные данные.
Точное резервное копирование относится к копии данных, которые хранятся в разных местах, а не на жестких дисках. Содержимое в резервных копиях не будет повреждено, пока вы не создадите резервную копию до того, как произойдет повреждение данных.
Если Raid 10 отлично подходит для обеспечения надежности хранилища, тогда зачем вам Raid 5?
Raid 5 - идеальный выбор для приложений и файловых серверов с несколькими дисководами данных. Благодаря хорошей производительности, высокой безопасности, эффективному хранению, Raid 5 представляет собой надежную систему. Эта система максимизирует пространство в массиве Raid.
Хотя Raid 5 или Raid 10 кажутся отличными вариантами для максимизации пространства, существуют и другие варианты, например Raid 0, который является отличным решением для хранения некритического контента.
Какой из них лучше, Рейд 10 против Рейда 5?
При выборе конфигурации Raid, вы должны убедиться, что вы выбираете правильную. Это для максимизации производительности и повышения защиты, которые вы получите от технологии Raid. Проще говоря, Raid 10 увеличивает производительность в пространстве, тогда как Raid 5 увеличивает хранилище.
Надеюсь, эта статья помогла определить различия между уровнями Raid 10 и Raid 5. Если вы все еще запутались Рейд 10 против Рейда 5 сравните, затем оставьте свои вопросы или вопросы в разделе комментариев ниже.
Родительский контроль, отслеживание и удаленное наблюдениеЧитайте также: