Данные, данные и еще раз данные. От анализа банковских операций до оптимизации загруженности рейсов авиакомпаний. Изучение ситуации «в реальном времени» — возможность сделать выводы и принять сбалансированное решение в ограниченных временных рамках. Отличный пример — гонки «Формулы-1».

Перед каждым этапом гонщики проводят тестовые заезды. Болиды начинены сотнями сенсоров, которые позволяют мониторить работоспособность всех узлов и агрегатов машины.

Датчики одного болида генерируют более 1 ГБ данных за заезд — это информация о положении машины на треке, скорости, работе коробки переключения передач и даже давлении воздуха в шинах. Эти данные позволяют получить максимально полню картину о техническом состоянии болида и зафиксировать неисправности.

К концу сезона у гоночных команд накапливаются терабайты данных, которые подвергаются тщательному анализу. Результат — успех или поражение команды в дальнейших гонках. Подобные задачи решают платформы хранения и обработки. Например, в сезоне гонок «Формула-1» 2014 года команда McLaren прибегала к технологии SAP HANA.

В этой статье нам бы хотелось остановиться на программно-аппаратном комплексе SAP HANA и рассмотреть существующие методики расчета облачных мощностей под этот тип хостинга.


/ Flickr / Dima Moroz / CC

Что такое SAP-хостинг


SAP-хостинг — это услуга хостинга решений SAP в облачной инфраструктуре провайдера, где поставщик берет на себя обязательства по выполнению задач миграции, администрирования, технического обслуживания и сопровождения приложений SAP.

Что касается SAP HANA, то компания SAP дает следующую расшифровку аббревиатуры продукта: High Performance Analytical Appliance. HANA является высокопроизводительным решением для аналитики и содержит такие инструменты, как средства обработки транзакций и крупных объемов данных. Например, SAP HANA дает возможность автоматически считывать показания счетчиков в различных социальных сетях.

Компания «ИТ-ГРАД» предлагает SAP HANA на vSphere на специальном интегрированном оборудовании дата-центра. При этом вы получаете до 1 ТБ памяти и 32 физических ядра (это 64 виртуальных) для одной инсталляции на VMware vSphere.

Расчет облачных мощностей под хостинг SAP HANA


Теперь посмотрим, как проводится расчет облачных мощностей под хостинг SAP HANA. Вообще, компания SAP имеет ряд конфигураций для SAP HANA и обозначает их буквами, как если бы вы подбирали себе футболку по размеру.


Примерив футболку размера S и обнаружив, что она вам мала, вы можете взять размер побольше — M. Размер M заменить на L и так далее. Точно так же поступают и с ресурсами: если их недостаточно, то всегда можно добавить. Указанные в таблице «размеры» удовлетворяют большинству бизнес-задач на базе SAP HANA, однако помимо них есть еще несколько уникальных и специфических конфигураций (представлены ниже).


Но приступим к оценке требуемых ресурсов. Начнем с общей памяти. Ее размер определяется объемом данных, которые должны в ней храниться. Исходя из этого значения уже ведется расчет параметров дисковой подсистемы и процессора.

В требованиях к RAM выделяют две составляющие. Первая — статическая память, используемая HANA, определяемая количеством данных, которые требуется хранить в памяти. Вторая — динамическая RAM — оперативная память, требуемая при загрузке новых блоков данных и приложений.

По рекомендации SAP следует резервировать одинаковое количество динамической и статической памяти, поэтому общий объем памяти будет равен объему статической RAM, умноженной на два.

RAMd = RAMst
RAMtotal = 2 x RAMst

Далее, идет расчет ресурсов дисковой системы (HDD). При этом обращаем внимание на тот факт, что свод данных с БД периодически копируется на так называемый том данных, чтобы сохранить информацию в случае непредвиденной аварии. Объем тома данных вычисляется согласно формуле:

DISKpers = 4 x RAMtotal

Также следует учитывать объем тома журналов, где хранится информация об изменениях базы данных, чтобы её можно было «откатить» в случае форс-мажора. Объем тома вычисляется по следующей формуле:

DISKlog = RAMtotal

Итого общий объем дискового пространства равен:

DISKtotal = DISKlog + DISKpers

При этом отметим, что первичные результаты следует регулярно проверять, чтобы избежать неприятностей и падения производительности при внезапном росте объема данных.

Теперь черед ресурсов CPU. Требуемый объем процессорных ресурсов зависит от числа пользователей. SAP HANA поддерживает 300 SAPS (условные единицы измерения нагрузки на железо) для каждого пользователя. При этом система поддерживает 60–65 одновременно активных пользователей на один CPU. Если вам интересно, то более подробную информацию о SAPS вы можете найти здесь и тут. Пример полного расчета конфигурации вы сможете найти по ссылке.

Чтобы упростить процесс вычисления ресурсов для SAP HANA, компания SAP предлагает воспользоваться утилитой Quick Sizer. Она позволяет вычислять объемы RAM, HDD, CPU, а также IOPS. На изображении ниже представлены результаты работы инструмента Quick Sizer. При этом значения параметров CPU, HDD определяются согласно «размерам футболок», о которых шла речь ранее. Сам инструмент доступен по ссылке.


Так же рекомендуем обратить внимание на результаты тестов SAP Standard Application Benchmarks, которые помогут выбрать аппаратную конфигурацию, подходящую для конкретных бизнес-задач, поскольку виртуализация VMware на сегодняшний день успешно справляется с обслуживанием высоконагруженных баз данных и приложений, которые стабильно работают как в частных, так и в публичных виртуализированных средах.

Другие материалы из нашего блога на Хабре:

Поделиться с друзьями
-->

Комментарии (2)


  1. andrewzhuk
    13.12.2016 11:50
    +2

    Спасибо за материал. Кстати, вовремя напомнили про экономическое обоснование IaaS — для главы в дипломной работе пригодится :D


  1. dargo
    13.12.2016 16:23
    +1

    А почему вас нет в список сертифицированных поставщиков (http://www.sap.com/documents/2015/03/74cdb554-5a7c-0010-82c7-eda71af511fa.html#) :)

    По поводу расчета ресурсов, на мой взгляд не все так просто — скриншоты и формулы, что вы привели в статье, описаны на saphanatutorial.com/sap-hana-sizing. А на http://www.sap.com/documents/2015/03/74cdb554-5a7c-0010-82c7-eda71af511fa.html# расчеты другие, в частности «There is no direct correlation between the SAP HANA database size and the required log volume size.»

    [systems ? 512GB ] Size redolog = 1/2 x RAM
    [systems > 512GB ] Size redolog (min) = 512GB


    Я не говорю, что вы приводите не правильную информацию, мне кажется по поводу расчета ресурсов есть некоторая путаница в данных доступных в интернете.