Зачастую выбор СХД похож на выбор кошки в черной комнате, и очень не хочется, чтобы после пары лет работы оказалось, что за красивым фасадом скрываются давно устаревшие технологии, не готовые к новым тенденциям и не имеющие «запаса прочности» для масштабирования в будущем.

На наш взгляд система хранения 3PAR получилась весьма удачной и имеющей потенциал для имплементации новых модных трендов рынка систем хранения данных, таких как онлайновая дедупликация, компрессия данных и т. п. Правы мы или нет — покажет время. Вначале несколько общих слов о системах хранения 3PAR. Презентацию, из которой взяты картинки к этой статье – всего пару недель как опубликовали. Мы, в основном, коснемся изменений и нововведений в системе 3PAR в общей системе и инфраструктуры СХД.

Чем хороша новая система HP 3PAR?

– об этом под кат

Начнем с того, с чего начинают любые заказчики: «Дайте мне 50тб дискового пространства! И все.» А какого пространства? как оно будет работать? — все эти проблемы администратор начинает «выгребать» уже после.



Чтобы таких ситуаций не было, рекомендуем подходить к этому вопросу правильно и основательно. В системах хранения есть очень много подводных камней, например:
• Террабайты против тибибайтов.
• Параметр от которого коробит многих программистов — IOPS (параметр ввода-вывода) — очень важный параметр, особенно для БД.
• Соотношения чтения-записи — как работает БД? — она больше будет читать или будет больше писать? или это система видеонаблюдения, которая всегда пишет, и никогда не читает? какой размер блока? время задержки допустимое для вашего приложения? — и т.д.
Этих значений набегает очень много. Очень легко попасть на неправильный сторедж и потом с ним долго мучится.

Начнем ТB vs TiB





По поводу этих двоичных единиц. Если объем рассчитан в неправильных единицах, то при большом количестве дисков можно ошибиться на целый порядок — а это тысячи IOPS и ТБ полезной емкости неправильно рассчитанные в маркетинговых единицах. Поэтому, как всегда все сокрыто в деталях. И таких деталей, или «подводных камней» вполне достаточно чтобы неопытный заказчик некорректно подобрал себе СХД переплатив значительные деньги или получив систему хранения не выполняющую поставленные перед ней задачи.

Как эту проблему предлагает решать Hewlett-Packard? Для этого в HP есть инициатива называемая Конвергентные решения (в случае СХД Converged Storage).

В двух словах: эта инициатива заключается в том, что Hewlett-Packardкак вендор предлагает уже ГОТОВЫЕ аппаратные комплексы под конкретные задачи. При этом работоспособность решения под заявленную задачу гарантирует производитель (т. е. Hewlett-Packard). HP имеет целое портфолио под конкретные задачи.
Подробнее об инициативе Конвергентные решения.



Конечно, же за конвергентное решение придётся «слегка» переплатить, но зато у заказчика сразу отпадает «головная боль» при подборе работоспособного решения, подборе кабелей, дисков и т. п.

Но вернемся к нашей основной теме — новой модели 3PAR.

Что главное должна уметь современная система хранения?


Любой заказчик ожидает от своей СХД:
• ускорение операций ввода-вывода и полную разгрузку RAID операций
• отказоустойчивость с пресловутыми пятью девятками (99,999%)
• поддержку выполнения нескольких задач без взаимного влияния одной задачи на другую
• поддержку всяких «модных фишек» — уровни хранения (Tiering), дедупликация (deduplication), компрессия данных и т. п.
• поддержку манипуляции данными – создание моментальных снимков, клонов, онлайновый перенос данных и т. п.

Так вот, в 3PAR основные «желания» заказчика АППАРАТНО ускоряются специальной микросхемой.



О преимуществах аппаратного ускорения, думаем, не нужно рассказывать, это известно всем владельцам видеокарт.
Чип 5-го поколения (вышел в июле этого года). Он делает аппаратные ускорения по рейду.

Как все вы знаете – в RAID выше 1 уровня нужно писать контрольные суммы. Если это поручить центральному процессору контроллера (обычно это IntelXeon, 3PAR не исключение) то ему кроме его основных задач по управлению, приходится производить низкоуровневые просчеты контрольных сумм в реальном времени. Это приводит к «проседанию» производительности. В случае с 3PAR этой проблемы нет, т. к. просчетом RAID занимается 3PAR ASIC, полностью разгружая центральный процессор.

Следующее, чем занимается чип 3PAR это отслеживание блоков нулей в потоке данных. Зачем отслеживать нули? Все дело в том, что детекция нулей – это ядро модной технологии называемой тонким выделением томов (ThinProvisioning). Идея ее заключается в том, что на системе хранения хранятся только полезные данные, а пустое дисковое пространство (которое собственно и представляет собой нули) отбрасывается в процессе ввода вывода и на СХД не храниться. 3PAR умеет детектировать нули микроскопическим блоком в 16кБ, что значительно меньше чем у всех конкурентов, причем детекция осуществляется в реальном времени. Что это означает для конечного пользователя: значительная экономия дискового пространства, ускорение форматирования дисков в VMWare, автоматическое освобождение пространства на СХД в случае удаления данных и т. п.

Чип 5-го поколения научился детектировать не только блоки по 16 кБ нулей, он также может детектировать любые блоки по 16кБ. Соответственно процесс может быть, как в архиваторе, как в том же WinRAR. Контроллер создает словарь блоков, первый блок 16 кБ — назовем 1, следующие 16 кб назовем – блок 2, ит. д. Далее если контроллер встречает знакомый блок, то он не пишется на диск, а заменяется ссылкой на его номер, а это уже дедупликация. Т.е. если 3PARвидит 16 кб повторяющихся данных он находит у себя в словаре, то он их просто не пишет на диски. Чип это умеет делать в реальном времени, а это онлайн-дедупликация. Представьте: идет боевой ввод-вывод, а 3PAR в онлайне дедуплицирует эту информацию! Этого пока никто не умеет делать, только 3PAR.

Также задачей 3PAR ASIC является соединение контроллеров в единую систему хранения. Как вы знаете любая СХД должна иметь минимум 2 контроллера. Почему? Для отказоустойчивости, плюс еще, так как их 2, то можно одновременно их 2 нагрузить, в результате вырастает скорость работы в 2 раза. Чип поддерживает объединение (аж!) 8 контроллеров, в единую систему хранения. Причем каждый контроллер работает как active-active. Т.е. мы не в 2 раза ускоряем ввод-вывод, а ускоряемого в 8 раз (конечно при установке 8 контроллеров).

Следующей задачей 3PAR ASIC является поддержка гетерогенной нагрузки (Wide-striping)




На картинке на примере автодороги хорошо показано к чему это может привести несбалансированное использование ресурсов. Мы видим огромную очередь автомобилей, хотя соседние шлюзы гуляют. Хотя при правильном (интеллектуальном) перераспределении места хватило бы всем.



Как же 3PAR делает этот интеллектуальный Wide-striping?



В отличии от классической системы хранения где все блоки данных обрабатываются в порядке их поступления (нет wide-striping), 3PAR разделяет каждый поступающий блок на сами данные и управляющую команду которая говорит, что с этими данными сделать (метаданные). Формируется два потока данных: управляющих команд (метаданные) и непосредственно самих данных, причем управляющие команды (метаданные) обрабатываются отдельно центральным процессором Xeon контроллера, а сами данные обрабатывает 3PARASIC, причем Xeon перераспределяет данные на основе полученных метаданных, так чтобы получился нужный нам Wide-striping.



Соответственно, 3PAR на АППАРАТНОМ уровне умеет балансировать нагрузку между разными задачами, прекрасно справляясь с гетерогенными задачами в пределах одного хранилища.

Хорошие результаты при гетерогенной нагрузке признают даже конкуренты (в лице Oracle) что подтверждается их отчетами.



Поддержка чипом 3PAR ASIC дедупликации на дисках SSD позволяет кроме экономии дискового пространства еще и сэкономить на деньгах. Ведь стоимость современного твердотельного диска для системы хранения сравнима со стоимостью автомобиля и экономия нескольких десятков гигабайт это уже значительная экономия денег.



Причем сама дедупликация никакой задержки не вносит, она происходит в онлайн, в реальном времени на уровне чипа 3PARASIC.

Подробнее об «модных фишках», а конкретнее о технологии уровней хранения (Tiering)


Как показывает исследование среднестатистической задачи (к примеру, базы данных) в разрезе хранения данных, выходит очень интересная картина (прямо принцип Парето) – 50%ввода-вывода попадает всего лишь на 5% дискового пространства, выделенного под задачу. Это означает, что добавив в систему хранения всего лишь по объему 5% очень быстрых дисков (сейчас это SSD) мы можем получить прирост производительности в десятки или сотни раз!



Проблема заключается только в том, как вычислить эти 5% данных. В этом нам помогает технология уровней хранения (Tiering ) успешно имплементированная в 3PAR.

3PAR умеет разделить свой дисковый объём на два или три уровня (как показывает практика больше не нужно). Первый уровень — это обычно диски SSD, второй – обычные диски SAS 15K или 10K, третий – медленные, но емкие диски NL-SAS (SATA).

Соответственно первый уровень – это уровень горячих данных, обеспечивающий наиболее быстрый ввод-вывод. Второй уровень – уровень часто востребованных (но не постоянно) данных обеспечивающий среднюю скорость ввода-вывода. И, наконец третий уровень – архивный, имеющий наибольший дисковый объем, но весьма скромные показатели производительности.



Причем, 3PAR умеет автоматически переносить блоки «горячих» и «холодных» данных между уровнями хранения. Эта технология в 3PAR называется Adaptive optimization. Конечно же блоки можно перенести и вручную, тогда это в 3PAR называется Dynamic optimization.
Более того, в 3PARне обязательно чтобы каждый слой базировался на разной технологии дисков. Можно, к примеру, как первый слой выбрать хранилище на RAID1, второй на RAID5, а третий в RAID6. Можно даже создавать уровни на основе геометрии дисков: первый уровень внутренняя область дисков, а второй внешние секторы дисков.

Настоящая архитектура объединения контроллеров системы хранения Active/Active



Все вендоры систем хранения данных дружно кричат, что их СХД имеют архитектуру контроллеров Active/Active, однако на практике оказывается, что это архитектура ALUA, особенностью которой есть дешевая реализация, однако при существенном недостатке: любой том хранения обслуживается только ОДНИМ контроллером, все остальные доступа к этому тому не имеют (из за конфликта одновременной записи).



В случае с 3PAR — это ограничение удалось обойти за счет хитрой организации дискового пространства. В 3PAR к одному и тому же дисковому тому имеют доступ ВСЕ контролеры, и чем больше контроллеров в системе, тем более производительный этот дисковый том. Все контроллеры объединены в full-mesh топологию, где контроллер с другой ветки может спокойно читать данные с оперативной памяти другого контроллера — они все являют собой единый кластер.

Что еще недавно появилось в 3PAR?



Сейчас пошла большая мода на конвергентные системы хранения. В данном случае под конвергентной имеется в виду то, что система хранения обеспечивает кроме классического блочного ввода-вывода по протоколамSANеще и файловый доступ по-обычному Ethernet.В качестве сетевых шар поддерживаются все популярные распределенные файловые системы CIFS (Samba), NFS и т. п. Поддержка конвергентности доступна во всех 3PAR с индексом с в конце названия модели (7200с, 7400с).



Для файловых систем поддерживаются все современные «фишки». К примеру, заявлена поддержка SMB 3.0.

Настройка и управление



Новшества также коснулись и интерфейса управления. Новая веб-консоль является частью всеохватывающего ПО управления OneView способного управлять не только системами хранения, но и обычными серверами, блейд-серверами и шасси, коммутаторами и интеллектуальными PDU через единую консоль.



Основная идея новой консоли – максимальная простота управления, к примеру, выделять объем на 3PAR можно с помощью гибких интуитивно понятных политик.



Например, ваш IT-директор вообще не понимает, что такое рейды, он только знает о том, что есть разные диски по стоимости: быстрые, средние и медленные диски, и ему, либо кому-то из руководства, нужна наглядная схема — что к чему. Вы можете создать себе различные политики, например, вы создаете политику Gold (дорогие и быстре диски),Silver (медленные и дешевые диски) и т.д. Таких разных политик можно создать нужное количество и дальше уже «рулите» своим СХД хозяйством на их основе. Эта идеология очень удобна для «облачных» решений.

По поводу надежности 3PAR



Hewlett-Packard настолько уверенна в надежности систем хранения 3PAR, что оформила инициативу под названием «HP 3PAR Get 6-Nines Guarantee Program». В двух словах, эта инициатива описывает то, что HP готова идти на штрафные санкции в случае нарушения надежности в 99,9999% (простой 30 секунд в год) для 4-ехконтроллерных систем хранения 3PAR.



Более подробно об этой маркетинговой инициативе по ссылке

За счет чего такая уверенность?



Она базируется на ряде архитектурных особенностей аппаратной составляющей 3PAR. Первая из них это отсутствие выделенного диска для горячего восстановления RAID, так называемого Hot-sparedrive.

Для классической системы хранения Hot-spare диск обычно является узким местом при восстановлении сбойного RAID. Все блоки, которые были утеряны при сбое, восстанавливаются на один диск! Это еще допустимо при восстановлении одного RAID, но если нужно восстановить два, три или больше вышедших из строя RAID? Опытные администраторы рассказывали случаи, что при сбое SATA диска объемом в несколько терабайт, за время восстановления (это обычно десятки часов) обычно выходит из строя второй SATA диск из за возросшей нагрузки. Вот почему все вендоры как один рекомендуют на медленных дисках NL-SAS(SATA) только RAID 6.



В случае с 3PAR такой проблемы нет, т. к. 3PAR не создает RAID на дисках, он создает RAID на блоках (в cсовременных 3PAR этот блок 1ГБ), соответственно восстановление вышедшего из строя RAID можно на любой свободный блок на ЛЮБОМ диске, имеющем свободное пространство хотя бы в 1 ГБ.

Следующей отказоустойчивой особенностью является отказоустойчивый кэш (в терминах 3PAR Resilient Caching). Не стоит объяснять, что кэш на любой системе значительно ускоряет процессы ввода-вывода. 3PAR не исключение, на каждом контроллере системы хранения есть несколько десятков или сотен гигабайт кэш памяти. Так, вот, в случае с классической двухконтроллерной системой хранения выход из строя одного из контроллеров приводит к автоматическому отключению кэш памяти, из-за возникновения единой точки отказа (некуда зеркалировать кэш на запись, ведь контроллер-партнер вышел из строя). Это приводит к значительной деградации производительности, что, естественно, отражается на бизнес-процессах.



В случае с 3PAR такая проблема отсутствует, ведь 3PAR может иметь больше чем два контроллера, соответственно единая точка отказа отсутствует, а кэш из вышедшего из строя контроллера, просто перераспределяется между выжившими контролерами системы хранения

Третьей отказоустойчивой особенностью является высокоуровневое программное обеспечение 3PAR PeerPersistence, работающее на основе ОС VMware и позволяющее получить геораспределенный отказоустойчивый кластер прямо из коробки без «мучений» с настройкой VMwareSRM.



Это наиболее покупаемая программная опция идущая совместно с 3PAR, позволяющая прямо «из коробки» получить катастрофоустойчивое решение базирующееся на двух разделенных расстоянием датацентрах. Про серьёзность и зрелость этого решения говорит хотя бы долговременное сотрудничество разработчиков 3PAR с компанией VMware. К примеру VMware VVOLсоздавался по образу и подобию внутренней архитектуры хранения данных в 3PAR.



Рассмотрим все семейство систем хранения 3PAR доступное на рынке



Первое, о чем хочется сказать – 3PAR является системой хранения среднего (Mid-range) и высокого уровня (Hi-End).Модели среднего уровня представлены семейством 3PAR 7000, а старшие моделями 10000 и 20000. Отличие моделей только в железе, операционная система и функционал ОДИНАКОВЫЙ у всех моделей. Соответственно освоив работу с самой младшей системой 3PAR 7200, вы можете смело управлять самым старшим «монстром» 3PAR 20000 масштабируемым до более чем 1000 дисков.



У каждого семейства есть модели, заканчивающиеся на цифру 50 (К примеру, 3PAR 7450). Это специальные модели, оптимизированные для работы исключительно с дисками SSD. Как оказалась, внутренняя архитектура 3PAR очень подходит для работы с этим типом дисков.



Отличие этих моделей от безиндексных собратьев только в мощности установленного Xeon и объеме кэша.
Также диски SSDможно использовать как расширение кэш-памяти, увеличивая объем встроенного кэша до сотен гигабайт. Этот функционал в терминах 3PAR называется AdaptiveFlashCache, он бесплатен на всех моделях и активируется парой команд. Что самое интересное, под кэш можно выделять не весь объем SSD диска, а оставшуюся часть использовать для обычного RAID.



Естественно скорость работы при активации Adaptive Flash Cache возрастает в разы, что подтверждается тестированием.



3PAR и резервное копирование данных



Если вы задумались о быстром резервном копировании (backup), то соединение 3PAR с сиcтемой резервного копирования HP StoreOnce превращает эту связку в сверхпроизводительную ленточную библиотеку позволяющую делать backup сотен гигабайт за минуты. 3PAR при этом выступает как хранилище, а StoreOnce занимается эмуляцией ленточного устройства. Эта эмуляция необходима т.к. все привычные программы резервного копирования привыкли работать с ленточными накопителями, и «переучивать» их нет особого смысла.



И наконец, если вы решили перейти со своей старой системы хранения на 3PAR, Hewlett-Packard поможет вам в этом при помощи встроенных в функционал 3PAR утилит. Называется этот функционал 3PAR Online Import и позволяют НА ХОДУ (т.е. без остановки бизнес процесса) мигрировать дисковые тома со старой системы хранения в 3PAR. На текущий момент поддерживаются системы хранения EMC, Hitachi и старые сиcтемы HP EVA.



Ну вот так если кратко, НР сделало, как мы считаем очень достойную СХД. Если полностью и подробно описывать все технологии, которые работают в 3PAR, и во всех подробностях о том, что умеет 3PAR — не хватит и 4 таких статей.

UPD по холивару в комментах:
Для сомневающихся в эффективности (у которых в профилях другие производители СХД), скриншот из реального 3PAR ниже, сжатие в реальном времени в 3 раза, в 3 раза, Карл!:


UPD2:
Презентация, из которой взяты картинки к обзору самая свежая, может сбить с толку то, что в скриншот попал некорректный колонтитул из PowerPoint. Описанный в статье функционал (дедупликация, к примеру) появился с выходом ASIC 5-го поколения (начало этого месяца).


Дистрибуция решений НР в Украине, Грузии, Таджикистане, странах СНГ.
Учебные курсы по технологиям НР в Киеве (УЦ МУК)

Комментарии (21)


  1. AmberSP
    27.07.2015 18:16

    Простите, что комментарий не по теме, но КДПВ довольно-таки иронична. HP 3PAR ассоциируется не со всеми любимым котиком, а с мутантом вымирающего вида. Да, они красивые, но вики пишет что имеют много проблем из-за близкородственного скрещивания.

    Наверное, это не лучший вариант? :)


  1. Alukardd
    27.07.2015 21:56

    Представьте: идет боевой ввод-вывод, а 3PAR в онлайне дедуплицирует эту информацию! Этого пока никто не умеет делать, только 3PAR.
    Шёл 2009 год.... И не надо оправдываться, что в HP это сделано «аппаратно», а в ZFS программно. Современных ЦПУ вполне хватает что бы выполнять всю работу возложенную на хранилище. Если пичкать туда аппаратные чипы ускорители, то ЦПУ там просто простаивает.


  1. beststoragename
    28.07.2015 08:35
    +3

    При прочтении статьи складывается впечатление, что старые дисковые массивы решили выдать за новые, не особо вкладываясь. Даже картинки в презентации взяли старые, датированные 2012м годом. И опять в качестве основного преимущества выделяют процессор ASIC, без которого другие производители создают отличные массивы. Специализированный процессор ASIC сделает больше операций за один такт, чем стандартный. Но если он работает на 300Мгц, вместо 3 Ггц у Intel, то производительность будет меньше.
    И еще удивила ответственность, которую HP готов на себя взять в случае нарушения надежности в 99,9999%. Если массив перестал работать и Ваш бизнес под угрозой, HP готов… не возместить ущерб или хотя бы выкупить массив обратно, а бесплатно продлить поддержку массива на 3 месяца. Вот это уверенность в их отказоустойчивости!


  1. Muk Автор
    28.07.2015 11:20
    -3

    По комментариям выше складывается впечатление, что софтовое ускорение (процессором Intel) лучше чем аппаратное. Ответьте тогда на вопрос почему же вы все берете себе графический акселератор для игр? Всегда (подчёркиваем, ВСЕГДА) ФОП (Функционально ориентированные процессоры) превосходят процессоры общего назначения для узкоспециализированных задач. В случае 3PAR дедупликация и ускорение RAID как раз и являются такими задачами.
    И при чем тут ZFS? В статье идет речь о блочном вводе выводе, а не файловом. Учите теорию систем хранения, господа комментаторы….


    1. Alukardd
      28.07.2015 11:57
      +1

      Переходим по указанной мною ссылке и, опачки, что мы видим...

      ZFS deduplication works at the block level, not on an individual file basis, so it is possible that «mostly the same» files can enjoy benefits of deduplication and reduced disk space consumption. Imagine even a single user working with a series of medical image files from CAT scans, or different versions of an animated film. The different files might be almost identical in contents, and potentially the majority of disk blocks could be the same — and stored only once instead of storing the same contents multiple times.
      Фраза «Этого пока ни кто не умеет делать» очень опрометчива. Маркетологи вы наши…

      Далее. Узкоспециализированные действительно лучше заточены на конкретные задачи, ради которых их создавали, НО когда в это тычат пальцем, забывают уточнить что обещанная производительность появилась в том числе за счёт освобождения ресурсов ЦПУ, НО если ЦПУ и так справлялся со всеми описанными задачами, то на кой хрен тратится на доп. железо?


    1. DaylightIsBurning
      28.07.2015 12:03

      Всегда (подчёркиваем, ВСЕГДА) ФОП (Функционально ориентированные процессоры) превосходят процессоры общего назначения для узкоспециализированных задач

      Это неправда, если мы говорим не о теоретических умозаключениях или лабораторных исследованиях. В жизни значение имеет performance/$. И тут у ЦПУ общего назначения большая фора из-за массовости производства: менее эффективное расходование «транзисторного бюджета» компенсируется более низкой стоимостью транзисторов. ФОП могут превосходить ЦПУ общего назначения по performance/$ только в том случае, если производятся достаточно массово. При чём под $ нужно понимать полную стоимость владения. С ФОП могут быть связанны дополнительные расходы/риски т.к. их мало, мало специалистов с ними знакомых, нюансы эксплуатации менее исследованы. Все любят работать со стандартными компонентами, это неспроста.
      По комментариям выше складывается впечатление, что софтовое ускорение (процессором Intel) лучше чем аппаратное.

      Часто так и есть.


    1. gotozero
      28.07.2015 12:07

      Во-первых, у Intel не софтовое ускорение, а такое же аппаратное(SSE инструкции и проч).

      Во-вторых, утверждение: «Всегда (подчёркиваем, ВСЕГДА) ФОП (Функционально ориентированные процессоры) превосходят процессоры общего назначения для узкоспециализированных задач.», не корректно, если вычислительная часть не является узким местом. 24 ядера Intel(2 сокета например) вполне вероятно справятся с задачей расчета crc32(который аппаратно ускорен).

      И при чем тут ZFS? В статье идет речь о блочном вводе выводе, а не файловом. Учите теорию систем хранения, господа комментаторы….

      Наверху любого блочного устройства лежат, либо ФС, либо специализированные LVM(например Oracle ASM).
      Надо признать, для второго как раз дедупликация могла бы быть полезна, но по факту не будет, ибо одинаковые блоки в БД большая редкость. Сжатие, прозрачное как в IBM Storwize(обычные Intel ядра к слову) например тут поможет.

      Неважно какой в автомобиле двигатель, если мы соревнуемся на 1/4 мили. Важен результат.


    1. DaylightIsBurning
      28.07.2015 12:11

      Кроме того не нужно забывать, что в общем случае чип общего назначения проще загрузить работой, а значит время простоя у него будет меньше. Это сильно зависит от области применения, но даже только одного этого эффекта во многих случаях может быть достаточно что бы софтовое ускорение оказалось «лучше» аппаратного.
      Кстати, лучше-то по какому критерию?


    1. Muk Автор
      28.07.2015 13:11
      -3

      Общий коммент №1
      Еще раз, дедупликация происходит на БЛОЧНОМ уровне (вы «поверху» можете ставить любую файловую систему, хоть ту же ZFS, но это уже дело ОС сервера, а не системы хранения данных)
      дедупликация происходит в реальном времени в отличии от других СХД где это происходит по расписанию. Для сомневающихся в эффективности скриншот из реального 3PAR ниже

      Сжатие в реальном времени в 3 раза — в ТРИ раза.
      _____________________________

      Для комментаторов — любителей софтовых ускорений:
      Вы так и не ответили на вопрос по видеокартам. Если процессор общего назначения так хорош, почему вы используете аппаратный акселератор для видео?


      1. Alukardd
        28.07.2015 13:17

        Потому что основной ЦПУ в этот момент занят другими делами и нечего его загружать расчётом графики, НО я Вам ещё раз втолковываю и не только уже я — в СХД ЦПУ делать нечего кроме как расчёта контрольных сумм, дедупликации (если она есть) и обработки SCSI команд. Итого, если с него снять ещё и дедупликацию, то он просто будет простаивать!
        А ещё можно RAID поставить аппаратный со своим контроллером для подсчёта сумм, тогда вообще можно СХД на пеньке 4-ом замутить…


        1. sashaboyko
          28.07.2015 17:10
          -2

          Предлагаем вам создать свою СХД на «пеньке» 4.


      1. DaylightIsBurning
        28.07.2015 15:20
        +1

        Еще раз, дедупликация происходит на БЛОЧНОМ уровне

        Как и в ZFS, и да, в ZFS вы тоже можете установить ЛЮБУЮ файловую систему поверх ZVOL. Сжатие на лету, на блочном уровне в ZFS тоже есть.
        Если процессор общего назначения так хорош, почему вы используете аппаратный акселератор для видео?

        Потому что там это окупается. Потому что с одной стороны производство видеокарт — массовое, а с другой видеокарты на данный момент — весьма универсальные ЦПУ, которые ускоряют много чего. Например, в научных и инженерных вычислениях очень широкое применение сейчас нашли GPU. Современные GPU — это универсальные процессоры, пусть и другого типа, чем x86 CISC.


      1. DaylightIsBurning
        28.07.2015 15:57

        На счёт видеокарт могу привести очень показательный пример из своей области. Существует такой метод как Молекулярная Динамика (МД), он очень широко применяется в биофизике, фармакологии, материаловедении и др. Еще 3 года назад подавляющие число вычислений велось на суперкомпьютерах на x86 процессорах с использованием MPI. Конечно, x86 процессоры не созданы для МД, но до ~2011 года почти все ими пользовались для МД.
        Существует в Мире один частный научно-исследовательский институт, называется D. E. Shaw Research, который создал специальный компьютер «Anton» для МД на основе ASIC, который на два порядка (в 100 раз) превосходил по производительности то, чего можно было добиться на суперкомпьютерах общего назначения. Оказалось, однако, что его цена столь велика, что никто, кроме самих разработчиков не купил ниодной такой машины — дешевле и проще пользоваться стандартным оборудованием и ПО. А к тому же видеокарты становились со временем все более и более универсальными — появивились и развивались CUDA, OpenCL. И примерно в 2011-2013 годах начался повальный переход с x86 на видеокарты. Но никто не купил «Anton». Причина в том, что только совместный объем рынков видеоигр+ научных вычислений + обработки изображений и видео + ускорение инженерного ПО оказался достаточным что бы экономически оправдать создание и использование менее стандартных, чем x86 процессоров.


  1. MurdocNG
    28.07.2015 13:23
    +1

    Дорогие коллеги из МУК, если уж решили написать статью на хабр, то пишите ее сами, а не по ХП-шным презам двухлетней давности.


  1. Muk Автор
    28.07.2015 15:07

    Не прикреплялся скриншот к прошлому комменту. Для сомневающихся в эффективности скриншот из реального 3PAR ниже, сжатие в реальном времени в 3 раза:

    image

    Так как у нас ограничение – 1 коммент в час, будем отвечать всем сразу.

    Дорогие коллеги из МУК, если уж решили написать статью на хабр, то пишите ее сами, а не по ХП-шным презам двухлетней давности.

    А с чего вы решили что презентации двухлетней давности? Из-за того, что в скриншот попал некорректный колонтитул из PowerPoint? Описанный в статье функционал (дедупликация, к примеру) появился с выходом ASIC 5-го поколения (начало этого месяца). Так что вы проверяйте информацию перед тем как говорить.


    1. DaylightIsBurning
      28.07.2015 15:26

      Как я понимаю, Вы хотите здесь прорекламировать продукт. Для успешности рекламы на хабре, мне кажется, нужно ответить на один вопрос: какие конкурентные преимущества имеет ваше решение. Детали реализации не являются сами по себе конкурентным преимуществом. Конкурентным преимуществом могут быть эксплуатационные качества. Вам указали в сторону конкурентной реализации функциональности которую Вы рекламируете — ZFS.


      1. exLH
        28.07.2015 22:05

        А сколько памяти нужно воткнуть в сервер, чтобы dedup нормально работал в ZFS на емкости, скажем, 1PB?


        1. DaylightIsBurning
          29.07.2015 11:34

          Не знаю точно, но dedup может использовать SSD через L2ARC, так что, наверное, меньше, чем может показаться.


        1. DaylightIsBurning
          29.07.2015 11:48

          К тому же, в Оракл работают над deduplication в ZFS: www.theregister.co.uk/2014/12/11/oracle_improving_zfs_dedupe
          Обещают в этом году золотые горы, но это посмотрим.


  1. omnimod
    28.07.2015 16:42
    +3

    Интересно, а когда речь идет о:
    «Зачастую выбор СХД похож на выбор кошки в черной комнате, и очень не хочется, чтобы после пары лет работы оказалось, что за красивым фасадом скрываются давно устаревшие технологии, не готовые к новым тенденциям и не имеющие «запаса прочности» для масштабирования в будущем.»
    это кто-то конкретный имеется ввиду? На рынке вообще остались «обычные» СХД? А то куда ни глянь — везде самые передовые технологии.

    По поводу inline дедупликации, ее поддерживают EMC XtremIO, Pure Storage, Violin Memory.

    Если ASIC так хороши, то почему тот же Hitachi отказался от них в новой серии массивов? Или у них были неправильные ASIC'и?


  1. Alukardd
    29.07.2015 11:09

    упс, это ответ на комент выше про память.
    Есть рекомендации считать что чисто на DDT уйдёт 20Гб памяти на хранилище в 1PB, я склонен рассчитывать на 40Гб, но всё зависит от того на сколько хорошо у Вас работает дедупликация. Не в плане абстрактного качества её работы, а в плане повторяемости записываемых данных.
    Так же можно использовать L2ARC на SSD.