В нашем блоге на Хабре мы не только рассказываем о развитии облачного сервиса 1cloud, но и много пишем о новых технологиях, в том числе в области процессоров и памяти. Сегодня мы представляем вашему вниманию адаптированный перевод заметки директора по исследованиям компании IDC Фила Гудвина (Phil Goodwin) о плюсах и минусах технологий гибридных массивов хранения данных и масивов флеш-памяти.

С падением цен на SSD все больше компаний предлагают массивы, целиком построенные на флеш-памяти, но действительно ли они лучше гибридных массивов, содержащих как твердотельные накопители, так и жесткие диски?

Для сравнения различных технологических решений мы часто обращаемся к соотношению цена/производительность, однако появление SSD привело к тому, что покупателям пришлось выбирать, что для них важнее. Флеш-память предложила умопомрачительные скорости и очень высокую стоимость гигабайта. С другой стороны, многотерабайтные жесткие диски (HDD) не так сильно опустошали кошельки, но, обладая скоростью в 75 IOPS, не могли справиться с большой нагрузкой.

Стоимость гигабайта на жестком диске меньше, чем у SSD, но он проигрывает в скорости работы.

Гибридные массивы должны были стать компромиссом. Добавляя флеш-память в размере 2-5% от общего объема памяти, можно увеличить количество IOPS практически вдвое, что снизит латентность системы до уровня 3-5 мс (без флеш-технологий она составляет более 10 мс). Таким образом, заплатив всего на 10-20% больше, вы получаете возможность удвоить производительность массива.

Как бы хорошо ни выглядели цифры в 3-5 мс, в некоторых ситуациях этого оказывается недостаточно. All-flash-массивы способны обеспечить латентность менее миллисекунды при должном QoS – качестве обслуживания. В такой архитектуре не возникает задержек из-за выборки данных, поскольку, технически, операции ввода-вывода выполняются из кэш-памяти. Только подумайте, снижение латентности с 10 мс до 5 мс, а затем до 0,5 мс – это двадцатикратное увеличение скорости работы по сравнению с жесткими дисками. На сегодняшний день цены на SSD и HDD очень близко подошли друг к другу, но, несмотря на это, большинство организаций все еще не могут позволить себе купить сотни терабайт флеш-памяти. Если компании все же требуется внедрить флеш-технологию, то знание главных особенностей обоих подходов поможет руководителям принять взвешенное решение.



Пять причин выбрать гибридный массив или all-flash-массив



Гибридный массив лучше использовать, когда all-flash-массив нужен, когда
Характеристики
рабочей нагрузки неизвестны
Требуется
латентность менее миллисекунды
Необходимо
оптимизировать стоимость
Требуется
гарантированное качество обмена данными
Разброс
в показателях латентности не является препятствием
Необходимо
оптимизировать производительность
Происходит
переход от классических массивов
Производительность
важнее стоимости
Бюджет
не позволяет осуществить полный переход на SSD, но требуется увеличить
производительность
Есть
возможность использовать малоизвестные высокопроизводительные HDD, чтобы
снизить совокупную стоимость владения системой

Соотношение цена/производительность гибридных и all-flash-массивов


Поскольку цена и производительность являются двумя самыми важными метриками при покупке записывающих устройств, давайте сначала рассмотрим их. Считается, что стоимость покупки HDD-массива составляет примерно 20% от стоимости его эксплуатации в течение трех лет. All-flash-массивы разрушают эту модель: стоимость покупки растет, однако эксплуатационные расходы снижаются. Например, компания Nimbus Data, производитель all-flash-массивов, заявляет, что их устройства потребляют всего 8 ватт на каждый терабайт, в то время как HDD могут потреблять до 80 ватт. Более того, Nimbus говорит, что пользователи могут заполнить стойку на 90%, и это не вызовет снижения производительности – таким образом, высвобождается свободное пространство, и оптимизируются энергозатраты. Высокоемкие диски SATA предлагают гигабайты пространства для хранения информации, но обладают посредственными показателями IOPS и латентности. Флеш-память, наоборот, очень похожа на кэш и обладает небольшим объемом, но высокой производительностью. Именно поэтому стоит сравнить общую стоимость владения гибридными массивами и all-flash-системами.

Для оценки стоимости компания Hewlett-Packard предлагает следующую метрику: доллар/операция. Эта метрика отражает реальные эксплуатационные расходы, в то время как доллар/Гб и доллар/IOPS позволяют оценить только стоимость покупки. Еще соотношение доллар/операция не зависит от типа носителя. Если требуется выполнять большое количество операций, то метрика доллар/операция будет меньше при использовании all-flash-массивов. Для гибридных массивов соотношение доллар/операция будет меньше при небольшом количестве операций. В любом случае, результат предсказуем и легко вычисляется.

Запоминающие устройства (их покупку можно считать переменными затратами) могут рассматриваться IT-менеджерами как факторы, влияющие на пользовательский опыт. Если пользователи считают, что приложение работает недостаточно быстро, у них, скорее всего, сложится негативное впечатление о всей организации или провайдере. Если пассажир самолета видит пятна кофе на своем откидном столике, то он начнет сомневаться и в качестве обслуживания двигателей. Может быть, имеет смысл потратить чуть больше денег, чтобы изменить мнение клиента в лучшую сторону, особенно в эру IT-аутсорсинга?

Дедупликация и сжатие используются практически во всех системах хранения и позволяют снизить стоимость одного гигабайта памяти. Однако здесь нужно сделать замечание. Дедупликация и SIS – компонент хранилища единственных копий – используются на уровне ОС и уровне приложений (например, решения VMware и SIS для Exchange). Дедупликация и сжатие не применяются дважды к одному набору данных, потому администраторы систем хранения могут пронаблюдать снижение стоимости гигабайта на величину меньше расчетной.

До недавнего времени для коммерческих вычислительных приложений производительность хранилищ оценивалась только по IOPS. Возможно, это было связано с тем, что массивы в принципе не могли гарантировать определенные показатели QoS. All-flash-массивы изменили правила игры, чем воспользовалась компания SolidFire. Технология SolidFire позволяет предсказывать нагрузку (IOPS) отдельных секторов массива, что позволяет выделять ресурсы для чтения/записи данных тогда, когда это необходимо. Еще это решает проблему «шумного соседа». Например, в типичном гибридном массиве приложения соперничают друг с другом за участок флеш-памяти (доступ получает тот, у кого больше прав), что ведет к перегрузке и неоптимальной производительности. Подстройка IOPS для каждого приложения в отдельности решает эту проблему.

Так что же выбрать?


Все известные производители систем хранения уже дополнили свои HDD-решения флеш-технологиями: гибридными устройствами или all-flash-элементами. IBM, EMC Corp., NetApp Inc. и HP предлагают все вышеупомянутые решения, однако особенности их исполнения серьезно отличаются.

IBM расширила возможности своей технологии виртуализации хранилищ данных SAN Volume Controller (SVC), чтобы управлять all-flash-устройствами FlashSystem или гибридными массивами линеек XIV Storage System, Strowize и DS. Поскольку все эти устройства могут управляться с помощью SVC, IBM применяет гибридную концепцию не только к массивам, но и ко всей экосистеме хранения корпорации. Они хотят получить максимальную гибкость при внедрении обоих типов носителей и комбинаций массивов, что даст больше возможностей по масштабированию и наращиванию производительности.

VMAX от EMC может виртуализировать как гибридные, так и all-flash-решения в одной экосистеме. VMAX, VNX, VNXe и Isilon также могут быть как гибридными, так и all-flash-продуктами. Таким образом, пользователи могут решать, что им сейчас нужнее. Компания предоставляет еще одно all-flash-решение – XtremIO. Поскольку EMC нет необходимости разделять гибридные и all-flash-предложения, она может поставлять традиционные HDD-массивы покупателям с ограниченным бюджетом, гибридные конфигурации – тем, кому нужна производительность, и all-flash-решения, если клиенту нужно гарантированное качество обслуживания (QoS). Выбор линейки зависит от трех показателей: надежности, доступности и удобства обслуживания. Например, система VMAX способна обеспечить доступность на уровне «шесть девяток» (99,9999%) вне зависимости от типа.

HP предлагает системы хранения данных 3PAR, построенные как на HDD, так и флеше. Последние обладают интересными особенностями: в одном массиве располагаются флеш-карты с одноуровневыми и многоуровневыми ячейками. Компания рекомендует использовать первые для записи данных, а вторые для чтения. Все это построено на основе технологии Adaptive Optimization sub-LUN tiering. ОС 3PAR имеет встроенный менеджер кластерных томов и умеет виртуализировать все типы носителей, включая новые.

Компания NetApp предлагает флеш для всех массивов семейств FAS, V-series и E-series. EF540 – это all-flash-система. NetApp обычно рекомендует использовать Flash Pools в объеме 1-2% от общего объема памяти. По словам компании, для работы с электронными письмами, веб-обслуживания, разработки приложений и кооперации подойдут гибридные конфигурации. В этих случаях требуется менее 150 000 IOPS, а латентность в 3-5 мс не является препятствием. При нагрузке с большим количеством операций или там, где требуется латентность менее миллисекунды, лучше использовать all-flash-массивы.

ZFS Storage ZS3 от Oracle – это гибридные массивы, но компания говорит, что пользователи могут достичь 90% вероятности «попадания» в кэш и латентности менее миллисекунды с помощью их flash/DRAM-архитектуры. Более того, решения компании имеют некоторое преимущество в стоимости, по сравнению с конкурентами. Пользователи получают производительность all-flash-системы по цене гибридной. Hybrid Storage Pool от Oracle автоматически перемещает данные по DRAM, читает из флеш-памяти и пишет во флеш-память, чтобы оптимизировать производительность массива.

Использование RAID


Данные на флеш-устройствах также можно защитить с помощью RAID, как в любом другом хранилище. Хотя большинство поставщиков поддерживают стандартные RAID-методики для флеш-устройств, использование RAID может повлечь за собой повышение стоимости хранения информации и снижение скорости её обработки так же, как в случае с HDD. IBM решает эту проблему с помощью Variable Stripe RAID в своей технологии FlashSystem, где имеется встроенный контроллер RAID 5.

В результате получился RAID с диском четности и высокой скоростью передачи данных, где нагрузка распределена между несколькими контроллерами. NetApp начала использовать Dynamic Disk Pools («динамические дисковые пулы») в своей SANtricity (E-series). Благодаря этой технологии данные распределяются равномерно по всем дискам. NetApp утверждает, что система позволяет быстро восстановить сбойные диски, сохранив при этом высокую производительность. Nimbus использует алгоритм RAID 5, разработанный с целью снижения степени износа оборудования, проявляющегося при записи во флеш-память.

Выводы


Несмотря на различия в подходах и архитектурах, компании-поставщики согласны в двух вещах. Во-первых, если вам нужна латентность менее миллисекунды или QoS, то используйте all-flash-массивы. В случае с Oracle можно использовать гибридный массив, способный предоставить практически такую же производительность. Приложения, требующие QoS, включают в себя [к примеру] решения из области электронной коммерции, где во главу угла ставится качество пользовательского опыта, и аналитические продукты в сфере поддержки принятия решений, где одним из важнейших параметров является скорость работы.

Во-вторых, если нагрузка неизвестна или меняется со временем, то следует использовать гибридные устройства, которые справятся с поставленными задачами, но за меньшую стоимость. Nimbus, SolidFire, а также другие all-flash-поставщики предлагают свои собственные решения для этого случая – их продукты могут иметь интересные характеристики цена/производительность и низкую стоимость IOPS. Основные области применения – это электронная почта и приложения для [организации] совместной работы – все, где не требуется мгновенный доступ к большому количеству данных.

Комментарии (3)


  1. navion
    11.12.2015 18:05
    +1

    Techtarget — это спамерская помойка «ресурс для бизнеса», вроде нашего CNews?

    используются на уровне ОС и уровне приложений (например, решения VMware и SIS для Exchange)

    SIS убрали в Exchange 2010, а для View дедупликация реализована только в сторонних продуктах.


  1. PerlPower
    11.12.2015 18:22
    +3

    С падением цен на SSD все больше компаний предлагают...


    А? Что? Где?


    1. TrueMaker
      12.12.2015 12:05

      PureStorage как пример. Правда их IPO оказалось провальным.