Sas mdl что такое
В чём смысл параллельного существования и развития отдельного стандарта SAS когда SATA развивается и черпает вдохновение из того же SCSI и почему SAS/SCSI-винчи имеют другие ёмкости (причём загадочной кратности) и, обычно, более высокие обороты (в то время как на ограничение пропускной способности при существовании SATA 3 это вроде как не свалить)? В каких случаях кроме брутального high-load, хостинга множества виртуалок и многопотокового видеовещания действительно имеет смысл ставить SAS и почему?
Извините если глупый вопрос. Заранее спасибо. Интересно.
Ох, сигейта нет на вас ;). Я видел отличную презентацию про отличия SAS и SATA у Игоря Макарова из Seagate. По стараюсь кратко и по существу.
2. Не все SAS диски одинаковы. Есть несколько категорий SAS и SATA.
— т.н. Enterprise SAS — обычно 10K или 15K оборотов в минуту. Объемы до 1 ТБ. Используются для СУБД и критичных к скорости приложений.
— Nearline SAS — обычно 7.2K, объемы от 1 ТБ. Механика таких устройств похожа на Enterprise SATA. Но все равно два порта и другие прелести SAS. Используются в enterprise, где нужны большие объемы.
— Enterprise SATA, иногда RAID edition SATA — почти то же самое что и NL SAS, только однопортовый SATA. Чуть дешевле NL SAS. Объемы от 1 TB
— Desktop SATA — то что ставится в PC. Самые дешевые и самые низкокачественные диски.
Первые три категории можно ставить в массивы на контроллерах от LSI и Adaptec. Последний — нельзя категорически. Проблем не оберетесь потом. И не потому, что у нас картельный сговор, а потому, что диски проектируются под разные задачи. То есть 8x5 или 24x7, например. Есть также такое понятие как максимальная допустимая задержка, после которой контроллер считает диск умершим. Для десктопных дисков она в разы больше. Это значит, что под нагрузкой рабочие Desktop SATA будут «вываливаться» из массива.
Короче, ориентируйтесь на конкретные линейки под конкретные задачи. Лучше всего смотреть на сайтах производителей. Есть например специальные мало шумящие и мало греющиеся винты для домашней электроники.
Те же подходы и к SSD, но область еще на сформировавшаяся, поэтому много тонкостей. Здесь мы ориентируемся по параметрам. Хотя все, что сказано в п., справедливо и для SSD.
"То есть 8x5 или 24x7" - думаю у оченеь многих пользователей десктопы или даже ноутбуки работают в режиме 24x7 (и вряд ли у сколько-нибудь существеной доли такиз пользователей SAS). В то же время да, издавна (ещё до появления SATA и по сей день) замечаю, что рэйды (не только на серьёзных контроллерах LSI и Adaptec, но и на контроллерах потребительского класса и просто полностью софтовые рэйды на уровне ОС) на хардах потребительского класса рушатся ну очень часто (при том, что на проверку диски оказываются исправны и работай он без рэйда никаких заметных проблем бы не возникло).Плюс SAS — вовсе не в скорости. В этом вопросе они не отличаются от SATA. Вплоть до того, что диски практически идентичны по «железу», а отличаются только прошивкой. А то иногда SATA и быстрее, если это SSD ;)
На сегодня главное отличие SAS — multipath. Вы можете подключить корзину (ну или экспандер) с дисками не одним, а, скажем, четырьмя линиям, и нагрузка будет на них распределяться, и отказа линии (контакт в разъёме плохой, например, или при каких-то работах с сервером «на горячую» провод зацепили) на работоспособности системы не скажется — ОС может даже и не заметить сбоя, только снизится производительность.
На SATA такое невозможно.
Обзор HP P4000 VSA
Такое семейство продуктов LeftHand раньше ассоциировалось исключительно с дисковыми массивами, самого базового уровня, и использовались лишь для подключения систем хранения данных (SAN) по протоколу ISCSI, но все развивается и не стоит на месте и теперь LeftHand называется после ребрендинга HP StorageWorks P4000, и дополнилось рядом функционала который присутствовал только в топовых решениях high-end класса.
Сама StorageWorks P4000 это два модуля хранения, стоечного вида сервера в которых два процессора архитектуры HP ProLiant , довольно неплохой RAID контроллер, так, что вы легко сможете построить на его базе дисковые raid массивы любой сложности. Жесткие диски тут MDL SAS.
Что такое MDL SAS и Enterprise SAS диск
HP P4000 VSA имеет диски нескольких уровней, во первых это двухпортовые SAS диски, у них два вида
Отличия у них в нескольких параметрах. Во первых MDL SAS это диск у которого SATA механика и интерфейс, шпиндель в дисках MDL SAS имеет скорость вращения 7200 оборотов в минуту. Объем дисков варьируется от 750 до 2000 гигабайт.
Enterprise SAS это диск с SAS механикой и интерфейсом и у них шпиндель уже крутится со скоростью в два раза больше, 15 000 оборотов. А так же больше запас прочности, как следствие надежность системы в целом. Объем у них заметно меньше от 300 до 600 гигабайт.
Продолжаем рассматривать HP P4000 VSA и его схему подключения, напомню что его модули по Ethernet сети и протоколу iSCSI, объединяются в кластер, и его уже ресурсы:
- RAM > оперативная память
- Дисковое пространство
- кэш-память
- сетевые интерфейсы
закладываются в общий пу и потом дербанятся, все кому что нужно. Так как у каждого узла две сетевые карты, то можно сделать отказоустойчивость между узлами кластера. Если брать технологии кластера HP P4000, то там можно из физических дисков разных узлов, создать общие дисковые тома. Управлять данной схемой можно из утилиты Centralized Management Console (CMC), она есть как для Windows так и для Linux версий.
Как я полагаю, просмотр SAN и большинства поставщиков предлагает 10k или 15k «правильных» SAS-дисков, многие из них также предлагают 7.2k MDL /Nearline SAS-диски.
Есть ли у кого-то авторитетное объяснение разницы?
3 ответа
Приводы 7.2K работают медленнее и легче, а с более высокими порогами ошибок, что повышает производительность (и емкость). Однако с точки зрения операций ввода-вывода каждый дискретный диск может поддерживать, приводы 7.2K заметно менее эффективны, чем их более быстрые братья. Поэтому они получают прозвище «Nearline», поскольку они набирают насыщенность ввода /вывода намного быстрее, чем эквивалентное количество 10K или 15K дисков. Поэтому производителям хранилища нужен способ передачи, «у нас есть более быстрый материал», поэтому они пошли с MDL /Nearline.
Вот как они пытаются поощрять людей, которым нужны быстрые и большие объемы памяти, для работы с более быстрыми дисками. Те, кто в бюджете, увидят, что вы можете получить (например) 1.5TB MDL /Nearline за половину стоимости 450-гигабайтного 15K-накопителя и задаться вопросом, почему это происходит. Несмотря на это, 48 приводов с частотой вращения 7,2 Кбит будут по-прежнему превосходить 12 приводов с частотой вращения 15 000 об /мин. Это просто, что 48 7.2K RPM-накопителей, вероятно, будут иметь емкость 30 ТБ, где 12 15-мегапиксельных RPM могут иметь только 5 ТБ.
Это еще один способ сказать .
Go 7.2K RPM, когда мощность - ваша цель номер один, а производительность - не цель.
Пойдите с 15 000 об /мин, когда производительность - это ваша цель номер один и средняя емкость.
Отличный ответ 1138, но еще один аспект примечания состоит в том, что средний лининг обычно не имеет служебного цикла '24 /365 ', это часто бывает трудно определить в спецификациях, но это означает, что если вы будете управлять дисками долго и они будут терпеть неудачу чаще, чем вы думаете. В качестве примера у нас был массив размером
200, полный MDL с 1 ТБ, и в течение первого года наблюдался показатель отказов 20%, потому что массив был активен в течение 20-24 часов в день, нам пришлось поменять место на 10 КБ.
Разверните свое мышление за пределами дискуссии «Производительность или производительность». Многие производители хранилищ перемещаются к многоуровневому решению для хранения, смешивая SSD, SAS, SAS-MDL /SATA. Большинство критически важных и часто обращающихся данных находятся на более быстрых уровнях, менее доступ к которым перемещается в нижние уровни хранения. Результат = лучший из двух миров по стоимости, емкости и производительности. Отличные инструменты управления, которые сообщают об использовании мощностей каждого уровня, и вы увеличиваете необходимый уровень. Делает угадывание работы по управлению ростом производительности /производительности. (Не упомянуто ни одной марки. Несколько поставщиков хранилищ движутся в этом направлении и не хотят звучать как реклама.)
Начнем с основ. Как же работают устройства на технологи SCSI? В стандарте SCSI все построено на концепции клиент/сервер.
Клиент, называемый инициатором (англ. initiator), отправляет разные команды и дожидается их результатов. Чаще всего, разумеется, в роли клиента выступает SAS контроллер. Сегодня SAS контроллеры — это HBA и RAID-контроллеры, а также контроллеры СХД, стоящие внутри внешних систем хранения данных.
Сервер называется целевым устройством (англ. target), его задача — принять запрос инициатора, обработать его и вернуть данные или подтверждение выполнения команды обратно. В роли целевого устройства может выступать и отдельный диск, и целый дисковый массив. В этом случае SAS HBA внутри дискового массива (так называемая внешняя система хранения данных), предназначенный для подключения к нему серверов, работает в режиме Target. Каждому целевому устройству (“таргету”) присваивается отдельный идентификатор SCSI Target ID.
Для связи клиентов с сервером используется подсистема доставки данных (англ. Service Delivery Subsystem), в большинстве случаев, это хитрое название скрывает за собой просто кабели. Кабели бывают как для внешних подключений, так и для подключений внутри серверов. Кабели меняются от поколения к поколению SAS. На сегодня имеется три поколения SAS:
— SAS-1 или 3Gbit SAS
— SAS-2 или 6Gbit SAS
— SAS-3 или 12 Gbit SAS – готовится к выходу в середине 2013 года
Внутренние и внешние кабели SAS
Инициатор, соединенный с целевым устройством системой доставки данных, называют доменом. Любое SCSI устройство содержит как минимум один порт, который может быть портом инициатора, целевого устройства или совмещать обе функции. Портам могут присваиваться идентификаторы (PID).
Целевые устройства состоят из как минимум одного логического номера устройства (Logical Unit Number или LUN). Именно LUN и идентифицирует с каким из дисков или разделов данного целевого устройства будет работать инициатор. Иногда говорят, что target предоставляет инициатору LUN. Таким образом, для полной адресации к нужному хранилищу используется пара SCSI Target ID + LUN.
Как в известном анекдоте («Я не даю в долг, а Первый Национальный Банк не торгует семечками») — целевое устройство обычно не выступает в роли «посылающего команды», а инициатор — не предоставляет LUN. Хотя стоит отметить, что стандарт допускает тот факт, что одно устройство может быть одновременно и инициатором и целью, но на практике это используют мало.
Для «общения» устройств в SAS существует протокол, по «доброй традиции» и по рекомендации OSI, разделенный на несколько слоев (сверху вниз): Application, Transport, Link, PHY, Architecture и Physical.
SAS включает в себя три транспортных протокола. Serial SCSI Protocol (SSP) — используется для работы со SCSI устройствами. Serial ATA Tunneling Protocol (STP) — для взаимодействия с дисками SATA. Serial Management Protocol (SMP) — для управления SAS-фабрикой. Благодаря STP мы можем подключать диски SATA к контроллерам SAS. Благодаря SMP мы можем строить большие (до 1000 дисковых/SSD-устройств в одном домене) системы, а также использовать зонирование SAS (подробнее об этом в статье про SAS-коммутатор).
Уровень связей служит для управления соединениями и передачи фреймов. Уровень PHY — используется для таких вещей как установка скорости соединения и кодировки. На архитектурном уровне находятся вопросы расширителей и топологии. Физический уровень определяет напряжение, форму сигналов соединения и т.д.
Все взаимодействие в SCSI строится на основании команд, которые инициатор посылает целевому устройству и ожидает их результата. Команды эти посылаются в виде блоков описания команды (Command Description Block или CDB). Блок состоит из одного байта кода команды и ее параметров. Первым параметром почти всегда выступает LUN. CDB может иметь длину от 6 до 32 байт, хотя последние версии SCSI допускают CDB переменной длины.
После получения команды целевое устройство возвращает код подтверждения. 00h означает что команда принята успешно, 02h обозначает ошибку, 08h — занятое устройство.
Команды делятся на 4 большие категории. N, от английского «non-data», предназначены для операций, не относящихся к непосредственно обмену данными. W, от «write» — запись данных, полученных целевым устройством от инициатора. R, как не сложно догадаться от слова «read» используется для чтения. Наконец В — для двустороннего обмена данными.
Команд SCSI существует достаточно много, поэтому перечислим только наиболее часто используемые.
А теперь рассмотрим несколько типичных примеров организации хранения данных на SAS.
Пример первый, сервер хранения данных.
Дата-центр одной из российских Web 2.0-компаний
Процессоры и память в таких серверах задействуются не сильно. Второе – в мире Web 2.0, информация хранится географически распределено, несколько копий на различных серверах. Хранится 2-3 копии информации. Иногда, если она запрашивается часто, хранят больше копий для балансировки нагрузки. Ну и третье, исходя из первого и второго, чем дешевле – тем лучше. В большинстве случаев все вышесказанное приводит к тому, что используются Nearline SAS или SATA диски высокой емкости. Как правило, Enterprise-уровня. Это значит, что такие диски предназначены для работы 24x7 и стоят значительно дороже своих собратьев, использующихся в настольных PC. Корпус обычно выбирают такой, куда можно вставить побольше дисков. Если это 3.5’’, то 12 дисков в 2U.
Типичный 2U-сервер хранения данных
16-портовый SAS HBA
Пример второй, почтовый сервер Exchange. А также MDaemon, Notes и другие подобные сервера.
SSD- кэширующий RAID-контроллер Nytro MegaRAID
Пример третий, внешняя система хранения данных своими руками.
Итак, самое серьезное знание SAS, конечно же, требуется тем, кто производит системы хранения данных или хочет их сделать своими руками. Мы остановимся на достаточно простой СХД, программное обеспечение для которой производится компанией Open-E. Конечно же, можно делать СХД и на Windows Storage Server, и на Nexenta, и на AVRORAID, и на Open NAS, и на любом другом подходящем для этих целей софте. Я просто обозначил основные направления, а дальше вам помогут сайты производителей. Итак, если это внешняя система, то мы почти никогда не знаем, сколько же дисков потребуется конечному пользователю. Мы должны быть гибкими. Для этого есть так называемые JBOD – внешние полки для дисков. В их состав входит один или два экспандера, каждый из которых имеет вход (4-х портовый разъем SAS), выход на следующий экспандер, остальные порты разведены на разъемы, предназначенные для подключения дисков. Причем, в двухэкспандерных системах первый порт диска разведен на первый экспандер, второй порт – на второй экспандер. Это позволяет строить отказоустойчивые цепочки JBOD-ов. Головной сервер может иметь внутренние диски в своем составе, либо не иметь их совсем. В этом случае используются «внешние» контроллеры SAS. То есть контроллеры с портами «наружу». Выбор между SAS RAID-контроллером или SAS HBA зависит от управляющего ПО, которое вы выбираете. В случае Open-E, это RAID-контроллер. Можно позаботиться и об опции кэширования на SSD. Если ваша СХД будет иметь очень много дисков, то решение Daisy Chain (когда каждый последующий JBOD подключается к предыдущему, либо к головному серверу) в силу многих причин не подходит. В этом случае головной сервер либо оснащается несколькими контроллерами, либо используется устройство, которое называется SAS-коммутатор. Он позволяет подключать один или несколько серверов к одному или нескольким JBOD. Подробнее SAS-коммутаторы мы разберем в следующих статьях. Для внешних систем хранения данных настоятельно рекомендуется использовать диски только SAS (в том числе NearLine) в силу повышенных требований к отказоустойчивости. Дело в том, что протокол SAS имеет в своем составе гораздо больше функций, чем SATA. Например, контроль записываемых-считываемых данных на всем пути с помощью проверочных сумм (T.10 End-to-End protection). А путь, как мы уже знаем, бывает очень длинным.
Напоследок, хочется поделиться некоторыми сведениями о текущей адаптации SAS мировыми производителями оборудования. SAS сегодня – это стандарт де-факто для серверных систем и профессиональных рабочих станций. Серверные системы подавляющего большинства как A- так и B- брендов имеют в составе контроллеры SAS, как HBA, так и RAID. В области внешних систем хранения данных, основные производители оборудования (HP, EMC, NetApp, IBM) уже несколько лет как перевели внутренние архитектуры своих систем на SAS. Таким образом, диски Fibre Channel стали за последние пару лет настоящей экзотикой. Fibre Channel продолжает жить и развиваться, в основном, как способ подключения серверов к системам хранения данных, хотя в области Low-End, Mid-Range и профессиональных систем, SAS отвоевывает все большую долю.
На этом наш экскурс в мир истории и теории SCSI вообще и SAS в частности подошел к концу, и в следующий раз я расскажу вам более подробно о применении SAS в реальной жизни.
Читайте также: