Концепции и причины возникновения SDS (Software Defined Storage) – систем хранения, базирующихся на функционале программного обеспечения, иногда без привязки к конкретной архитектуре или аппаратной платформе, лежат в первую очередь в требованиях компаний. Сегодняшний бизнес любой компании все больше и больше движется в сторону развития аналитики, BigData, облаков и социальных медиа, которые не взаимоисключают друг друга, но дополняют общую архитектуру решений своими требованиями. Так для примера наиболее эффективные внедрения BigData не обходятся без использования аналитики. Социальные медиа уже не могут существовать без облачных сервисов и тесной их интеграции с интерфейсами социальных платформ.





В итоге приходим к тому, что влияние технологий и требований потребителей влияет на бизнес в целом, требуя более быстрого доступа к инсайтам, приводя к повышению требований к разработке новых приложений и возникновению новых конкурентов. И это все на фоне гигантского роста объемов информации, появления новых задач и внедрения облака как элемента инфраструктуры.

На фоне всего этого становится тяжелее описать требования использования СХД под весь спектр новых задач и условий. Возникает необходимость освободить данные от ограничений аппаратной платформы и перестроить их для работы с новыми бизнес процессами и приложениями. Уровни сервисных требований вводят в заблуждение IT-руководителей, привыкших к стандартным методам хранения, создавая ситуации “слепого” добавления объемов, изоляции данных в “островах” хранения, необоснованной дупликации информации, что, в свою очередь, приводит к увеличению цикла обслуживания сетей хранения, росту цены решений, усложнению процессов внутри компаний и отсутствию гибкости инфраструктуры.

Именно из-за появления таких проблем и задач возникла концепция SDS. Согласно IDC, Software Defined Storage – это связка ПО систем хранения, которая может быть установлена на любой коммодити-сервер (платформа х86, гипервизор или облако) или другую вычислительную платформу, и предоставлять весь спектр услуг по хранению и объединению существующих ресурсов размещения данных, позволяя мобильно перемещать и перераспределять мощности хранения между этими ресурсами в зависимости от требований.

Основными атрибутами SDS являются:

— работа на коммодити платформе – без специализированных аппаратных платформ или компонентов;

— полный набор услуг по хранению – эквивалентно традиционным аппаратным системам;

— объединение (федерация) множества существующих ресурсов хранения: внутренние диски, облако, другие внешние СХД или облачные\объектные платформы.

SDS использует:

— “Shared nothing” архитектуру – архитектуру распределенного вычисления, в которой любая нода вычислительного узла является самодостаточной;

— Горизонтально или вертикально масштабируемую модель.

Software Defined Storage делится на три группы: базирующийся на файловом доступе, объектный доступ и блочный доступ.

Компания IBM выделяет три основных характеристики SDS в дополнение к выше изложенным:

Гибкость:

Автоматически настраиваемое решение корпоративного класса, позволяющее внедрить “облачную” инфраструктуру хранения за минуты.

Контроль:

Глубочайший анализ и оптимизация “on permise” (на площадках заказчика) систем хранения и облачных СХД – безопасность, цена, производительность – с использованием аналитики.

Эффективность:

Лучшая автоматизация процессов размещения и управления данных между носителями информации, системами хранения, облаками для достижения как уровней сервисного соглашения, так и уменьшения цены решения.

IBM анонсировала новую линейку программного обеспечения, которая покрывает те или иные задачи, решаемые SDS. Общее название – IBM Spectrum Storage. Она включает в себя как набор уже известных технологий, так и новейшие разработки.

Из известных стоит выделить IBM SAN Volume Controller, который на рынке с 2004 года и успешно помогает заказчикам консолидировать объемы хранения и избавиться от проблем одновременного управления СХД от разных вендоров и разных классов в пределах одной инфраструктуры, а также упрощает выделение объемов, перемещение данных между разными аппаратными платформами без остановки работы хостов, добавление уровней хранения и автоматизацию процессов перемещения и миграции между ними. SVC позволяет “спрятать”, по сути, любую Fibre Channel систему хранения и за интерфейсом самого аплайенса, и добавить функциональности виртуализированным хранилищам, в том числе функционал компрессии данных на лету, даже тех СХД, которые никогда не умели этого делать.

В разрезе нового семейства ПО SAN Volume Controller будет называться IBM Spectrum Virtualize.

IBM Spectrum Controll – софт по автоматизации управления и оптимизации инфраструктуры хранения с возможностью предоставления порталов самообслуживания, глубокой аналитики и рекомендаций по настройке. Ранее был известен как Virtual Storage Center, который включает в себя значительно переделанный и улучшенный Tivoli Productivity Center.

IBM Spectrum Protect является усовершенствованной версией Tivoli Storage Manager, обеспечивающей систему бэкапов и архивирований по графикам, интенсивности нагрузок и критериям. Конечно, не обошлось и без алгоритмов по проверке данных и технологий восстановления. Полноценная поддержка совместной работы заложена в само понятие семейства продуктов Spectrum Storage. Так и в случае с доработанным IBM Spectrum Archive, который основывается на базе Liner Tape File System, позволяющим получать доступ к данным на ленточных носителях как к сетевой папке или сетевому примонтированному диску.

Кроме названных выше продуктов в семейство вошли еще два «новичка» – IBM Spectrum Scale и IBM Spectrum Accelerate. Первый основывается на GPFS и представляет собой готовую платформу с открытыми API для тесной интеграции с Social Media, Hadoop, IBM BigInsight. Позволяет объединять как СХД, так и локальные серверные диски. Имеет возможность консолидировать объем из разных источников вплоть до создания многоуровневого хранилища на базе пулов объема, состоящих из локальных дисков, сети хранения, файловых или объектных хранилищ, и облачных ресурсов. Интерфейсы Spectrum Scale позволяют создавать файлы в едином пространстве имен и при этом хранить данные в зависимости от типа, даты, пользователя или группы на разных уровнях. Автоматически перемещать информацию между физическими ресурсами вплоть до переноса в облако или на Spectrum Archive по истечению срока хранения. На сегодняшний день тот же Hadoop полностью поддерживает и может разворачиваться на базе файловой системы Spectrum Scale вместо «родной» HDFS.



Архитектура решения сегодня позволяет масштабироваться до значений в Yottabytes и не имеет физического ограничения по месту нахождения аппаратных элементов, позволяя собирать географически распределенные системы в один интерфейс управления с одинаковым набором политик и правил.

Второй продукт, IBM Spectrum Accelerate, является программной реализацией уникальной архитектуры GRID, которая лежит в основе системы XiV. Поддерживает весь набор функций системы хранения XiV, может выступать как полноценный партнер при настройке удаленного зеркалирования. Точно так же, как и аппаратная платформа, поставляется по полезному объему. Пользователю не нужно будет задумываться о типе рейда, количестве дисков в рейд группе или о том, как правильно настроить систему для работы с той или иной нагрузкой. IBM Spectrum Accelerate использует любой сервер на площадке заказчика как аппаратную платформу. Это означает, что не нужно покупать диски или систему хранения, достаточно выделить как минимум три сервера, соответствующих минимальным требованиям, и получить полноценную СХД, обладающую всеми характеристиками аппаратного аналога. Это идеальное решения для пользователей с разнородной нагрузкой и высокими рисками.



Два новых продукт в линейке Spectrum Storage — это лишь часть стратегии дальнейшего развития. Весь перечисленный функционал и все продукты, упомянутые выше, в той или иной мере доступны в облаке IBM SoftLayer и готовы для использования клиентами. Компания IBM также выпустила на рынок новый продукт на базе PCI-E Flash технологии Flash System 900 и систему с интегрированным управлением и широким набором функционала Flash System V9000. Предыдущее поколение таких систем показало высочайшие результаты на независимых тестированиях и у ряда украинских заказчиков.

Стратегия и шаги к развитию Software Defined Storage являются одним из наиболее перспективных на рынке IT. Сегодняшние бизнесы в той или иной мере все более и более подвержены проблемам управления, контроля и аналитики инфраструктур, что в значительной мере усложняется из-за большого количества независимых аппаратных платформ, выполняющих одну и ту же функцию, но под разные задачи. Возможность упростить, автоматизировать, оптимизировать и анализировать такие инфраструктуры играет немаловажную роль в показателях CAPEX и OPEX любой компании.
Поделиться с друзьями
-->

Комментарии (6)


  1. navion
    09.06.2016 17:00

    По Spectrum Accelerate очень не хватает технических деталей, в редбуках только инструкция по базовой настройке без описания механизмов защиты данных, кэширования и т.п.
    Или подразумевается, что внедряющий её специалист хорошо знает XIV?


    1. artiusha
      09.06.2016 17:32

      Если вас интересует что-то конкретное, задавайте вопрос, мы попытаемся ответить более подробно.


      1. navion
        09.06.2016 18:43

        Интересует как оно хранит данные и как работает мультипасинг (вроде описаний архитектуры Netapp или Nutanix).
        Про большой XIV написано что он fully symmetrical Active-Active storage array, но в SDS ведь будут задержки на репликацию и (?) разное наполнения кэшей.


        1. artiusha
          10.06.2016 10:54

          Касательно описания архитектуры XIV есть отличный редбук .
          Глава 2 посвящена параллелизму, виртуализации, кэшированию системы. Также есть редбук по архитектуре и пример разворачивания Spectrum Accelerate.


          1. navion
            10.06.2016 17:23

            Второй редбук вчера пролистал и не нашел описания механизмов работы уровня презенташки по Сторвайзу.

            В референсной архитектуре про производительность сказано одной строкой, чего тоже не достаточно.


          1. navion
            14.06.2016 12:55

            Глянул в редбук, похоже Spectrum Accelerate — это софт из XIV на x86 и референсная архитектура повторяет большую железку.
            А внутри там распределённый RAID1, который может потерять данные при поломке двух дисков и IBM пытается убедить всех, что это не страшно.

            На фоне VSAN, Nutanix и Ceph смотрится не очень интересно.