Алгоритмы RAID давно уже являются общепризнанным стандартом в сфере хранения данных, обеспечивая заданные показатели надежности и скорости доступа. И хотя вариаций RAID не мало, основными на текущий момент являются уровни 1, 5 и 6 (плюс их комбинации с нулевым уровнем). А вот дальнейшее их развитие в виде RAID EE позволило как повысить их достоинства, так и снизить некоторые существующие недостатки.




Вообще, идея RAID EE не нова. И давно уже воплощена в ряде контроллеров. Взять хотя бы достаточно популярные RAID контроллеры от Adaptec. Однако среди систем хранения данных поддержка данных алгоритмов до сих пор является весьма редким явлением. Тайваньский производитель СХД Qsan Technology как раз один из немногих, кто реализовал в своих продуктах возможность применения RAID EE (начиная с версии прошивки 1.3.0).


Чем же так хорош RAID EE?


Основным отличием уровней ЕЕ от традиционных является вхождение резервного диска (или сразу нескольких дисков) Hot Spare в состав RAID группы. Т.е., другими словами, данные в группе «размазаны» не только по основным дискам, но и по диску (дискам) Hot Spare таким образом, что на каждом диске имеются свободные блоки, суммарный объем которых равен объему диска (дисков) «горячего» резерва.


RAID EE можно использовать для классических уровней 5 и 6, а также их комбинаций с нулевым уровнем (50, 60). Для примера рассмотрим схему распределения блоков для уровня 5ЕЕ из 4-х дисков плюс Hot Spare.



На схеме Р – блок четности, S – блок Hot Spare. Допустим, в группе отказал диск 2.



В результате блоки с данными с диска 2 будут восстановлены в блоки Hot Spare.



Как только мы заменим неисправный диск, ранее скопированные блоки вернутся на свое место, а блоки Hot Spare вновь будут доступны для «горячего» резерва.



Также для примера можно привести схему распределения блоков для уровня 60ЕЕ из 8 дисков (2 группы 2+2) и двух дисков Hot Spare.



Отметим, что СХД Qsan поддерживают до 8 дисков Hot Spare в составе единой RAID группы ЕЕ, обеспечивая беспрецедентный уровень защиты данных.


Использование дисков Hot Spare в составе группы имеет ряд преимуществ по сравнению с выделенными. Прежде всего, это то, что данные диски участвуют в операциях чтения/записи, повышая тем самым общую производительность RAID группы. Конечно, увеличение скорости доступа не будет впечатляющим, но зато оно абсолютно бесплатно.


Вторым и даже более важным моментом является значительное сокращение времени ребилда. Если рассматривать традиционные уровни RAID 5 или 6, то в случае отказа диска начинается процесс восстановления недостающих блоков на резервный диск. При этом скорость записи восстановленных блоков будет упираться в производительность единственного диска Hot Spare. Также не забываем и о стандартных операциях ввода/вывода во время работы с массивом, которые должны обрабатываться совместно с процессом восстановления. Чем больше дисков в группе и чем выше емкость каждого диска, тем дольше будет проходить процесс ребилда. В итоге на емких дисках NL-SAS процесс восстановления может занимать несколько суток, в течение которых массив находится в состоянии Degraded.


В случае использования RAID EE процесс ребилда будет происходить быстрее, т.к. блоки Hot Spare расположены на всех дисках группы. И процесс записи в эти блоки будет происходить параллельно. Конечно, время восстановления все так же будет зависеть от объема диска в группе и текущей активности операций ввода/вывода. Но использование параллельной записи в зарезервированные области на диски может существенно сократить время нахождения массива в состоянии Degraded. Стоит отметить, что увеличение дисков Hot Spare в составе группы RAID EE способно еще сильнее сократить время восстановления за счет большей параллелизации операций записи на свободные блоки.


Для проверки факта сокращения времени ребилда был проведен ряд тестов. Специально использовался том небольшого объема в 100GB, чтобы можно было получить результаты за вменяемое время.


Тестировалась СХД Qsan XS5224-D с iSCSI интерфейсом, подключенная к серверу, который создавал нагрузку при помощи IOMeter. В качестве дисков использовались 24 x Seagate Constellation ES, ST500NM0001, 500GB.


Профили нагрузки:


  • Backup Pattern (Sequential Read / Write, 256KB (MB/s))
  • Database Access Pattern (as defined by Intel/StorageReview.com, 8KB, 67% Read, 100% Random)
  • File Server Access Pattern (as defined by Intel)
  • Idle


Сравнение RAID5 и RADI5 EE




Сравнение RAID60 и RADI60 EE


Исходя из тестов можно сделать вывод, что реализация RAID EE в СХД Qsan действительно позволяет снизить время восстановления. Но данное утверждение справедливо только для тех ситуаций, когда в характере нагрузки преобладают операции чтения.


Не стоит забывать о том, что во время ребилда значительно повышается вероятность выхода из строя других дисков в группе из-за резко возросшей на них нагрузки. Поэтому снижение времени восстановления – один из ключевых параметров сохранности данных. Возможность применения RAID EE как раз позволяет улучшить этот показатель. Но еще большей эффективности можно добиться, если использовать RAID EE в СХД Qsan совместно с другой фирменной технологией — Fast Rebuild, которая производит копирование только реально занятых блоков с данными. Грамотное планирование пространства хранения избавит от потенциальных проблем в будущем. И богатый арсенал возможностей для этого, предоставляемый производителем СХД, только повысит привлекательность этих СХД в глазах заказчика.

Комментарии (3)


  1. vesper-bot
    01.11.2018 12:44

    Конечно, увеличение скорости доступа не будет впечатляющим, но зато оно абсолютно бесплатно.

    Не совсем — если хранилище умеет spin down для резервных дисков, то цена использования хотспары под данные — её амортизация и выход из строя со временем. И пока ещё (для меня) вопрос, стоит ли пониженного времени ребилда фактическое задействование дополнительного диска в рейде в нормальной его работе. Разве что контроллер достаточно умный и может загодя дублировать запись на диск в состоянии predictive failure на один из резервных страйпов запасных блоков, что теоретически при правильной работе механизма предсказания выхода из строя обеспечит де-факто нулевое время ребилда массива.


    1. DeeZ
      01.11.2018 13:04

      Но приведет к деградации скорости, тк, фактически имеем лайт-ребилд постоянно.


      1. vesper-bot
        01.11.2018 13:27

        Необязательно — если все диски SMART OK, двойной записи не будет происходить. Если один выпал в SMART PF, его данные переносим в свободные блоки, и рапортуем о выходе диска из строя после завершения переноса. Если он за это время выпал в SMART FAIL, ну туда и дорога, и тогда задействуем блоки четности для восстановления данных, как при обычном выходе из строя диска в рейде без ЕЕ. Вот если дисков в SMART PF будет два, а блоков всего одна пачка… тогда проблемы, неясно, какой сначала спасать.