Практически каждый день мы узнаем о том, что в очередной компании произошел серьезный сбой в работе ИТ-инфраструктуры, который привел к серьезным финансовым и репутационным потерям. Системный сбой – первое, что приходит на ум, когда просчитываются возможные риски для работы ИТ-сервисов и организации в целом. Однако куда чаще имеют место другие причины: человеческий фактор, перебои в работе оборудования, отключение питания, вредоносное ПО, повреждение данных – все это может привести к полной остановке систем и приложений.
Вероятность же успешного аварийного переключения на резервную площадку – запланированного или срочного – будет невелика, если уделять недостаточно внимания процедуре и плану переключения, не обновлять его своевременно и не тестировать в нужные сроки. Неверно указанные зависимости машин и приложений, не задокументированные изменения, неправильные процессы, не проверенные на корректность работы приложения и сервисы, неверная последовательность запуска машин из реплик – это лишь некоторые из проблем, которые могут помешать успешному переключению как одного приложения, так и целого ЦОД.
Чтобы помочь организациям справиться с этими проблемами, компания Veeam недавно выпустила новое решение Veeam Availability Orchestrator для автоматизации управления работы с репликами ВМ при переключении на резервную площадку. (Первая версия решения поддерживает виртуальные машины на платформе VMware vSphere.) Подробнее о новинке читайте под катом.
Как мы знаем, план переключения на резервную площадку является составной частью плана действий на случай аварии и послеаварийного восстановления (DR plan). Так, если на виртуальных машинах работают критически важные приложения, зависящие одно от другого, то для сохранения работоспособности системы в случае аварии необходимо корректное переключение на реплики этих ВМ, выполненное в определенной последовательности (сначала домен-контроллер, а потом Exchange, а не наоборот). Для автоматизации этого процесса в Veeam Backup & Replication создается план переключения (failover plan), где указывается:
План аварийного переключения следует подготовить заранее, чтобы в случае сбоя быстро запустить его. В начале переключения можно выбрать, на какой момент времени (в какое состояние) сделать переключение на реплики ВМ. Затем Veeam Backup & Replication для каждой ВМ из перечня найдет ее реплику и будет включать реплики согласно настройкам плана.
Обязательно выполнить финальный этап процедуры – это может быть либо окончательная фиксация на резервной площадке, либо обратное переключение (например, по окончании техобслуживания\ремонта на основной площадке). Подробнее обо всем этом можно почитать здесь (на русском языке).
Трудно представить, что у серьезных организаций нет плана аварийного переключения. Почему же тогда сбои в работе происходят с такой регулярностью? Что затрудняет работу над планом?
Основой для успешного планирования является полная, актуальная документация. ИТ-инфраструктуры становятся все более крупными и сложными, при этом в них постоянно происходят изменения. Документировать все важные аспекты работы ИТ вручную – занятие малоэффективное, и тут мы сталкиваемся с одной из возможных причин несостоятельности плана.
Регулярное комплексное тестирование помогает составлять и тщательно прорабатывать план аварийного переключения и послеаварийного восстановления. Это особенно важно в связи со сложностью построения современных инфраструктур – в частности тех, которые базируются на нескольких сайтах. Добавьте к этому важность потенциального результата для конечного пользователя. Тем не менее, реальная эффективность плана зачастую не проходит должной проверки.
Планирование и послеаварийное восстановление тесно связаны с нормативными документами, которые регулируют соответствие требованиями целостности, надежности и доступности данных. Хоть требования и нормы различаются для разных отраслей, их объединяет обязательность к выполнению. Невыполнение же влечет за собой высокие репутационные и финансовые риски.
Veeam Availability Orchestrator позволяет снизить затраты на подготовку и тестирование планов аварийного переключения. Решение предназначено для автоматизации процессов создания, документирования и тестирования плана аварийного переключения и восстановления, который можно сразу же отдать на подпись руководству, а позднее предъявить проверяющим или аудитору.
Новое решение помогает задокументировать инфраструктуру в соответствии с требованиям аудита и нормативных актов. Продукт предоставляет:
Veeam Availability Orchestrator позволяет обойтись без нагрузки на производственную инфраструктуру в ходе тестирования плана переключения. Кроме того, можно снизить расходы, сэкономив на ручных процедурах и используя функциональность нового продукта, а именно:
Новое решение помогает управлять репликацией виртуальных машин VMware vSphere, выполняемой при помощи Veeam Backup & Replication. В рамках этой функциональности поддерживаются:
В состав Veeam Availability Orchestrator входят:
Важно! Встроенные редакции продуктов лицензируются только для поддержки Veeam Availability Orchestrator (VAO) и не предназначены для их полнофункционального использования в производственной среде. Если у вас уже развернут Veeam Backup & Replication, то имейте в виду, что для работы с новым решением его версия должна быть 9.5 Update 3 (и выше), причем редакция Enterprise Plus, поскольку API, необходимые для интеграции с Veeam Availability Orchestrator, представлены только в этой редакции. Заметим, что продукт нельзя устанавливать на ту же машину, где уже работает Veeam Backup & Replication или Veeam ONE.
Схема взаимодействия компонентов показана на рисунке ниже.
Все настройки выполняются из веб-консоли сервера VAO; по умолчанию используется протокол HTTPS и порт 9898.
После настройки ролей и уведомлений администратору нужно выполнить на сервере VAO следующие шаги:
Затем уже можно создавать планы переключения и добавлять в них группы виртуальных машин.
Созданные планы можно автоматически проверять, настраивать расписание планового переключения, просматривать историю выполнения, и т.д. Кроме того, состояние всех планов можно отслеживать при помощи дашборда и настраиваемых отчетов:
Лицензию на Veeam Availability Orchestrator можно приобрести в виде подписки на 1 год или со скидкой на срок от 2 до 5 лет.
Приобретать лицензии необходимо только для тех реплицируемых ВМ, для которых требуется настройка планов послеаварийного восстановления (минимальный объем заказа — 10 ВМ), а не для всех ВМ, защищаемых с помощью Veeam Availability Suite или Veeam Backup & Replication.
На одну ВМ приобретается одна лицензия Veeam Availability Orchestrator. Подробно о ценах можно почитать здесь.
Описание продукта (на русском языке)
Пользовательская документация (на англ.языке)
Ссылка для скачивания пробной версии
Ссылка для регистрации на вебинар (на англ.языке)
Вероятность же успешного аварийного переключения на резервную площадку – запланированного или срочного – будет невелика, если уделять недостаточно внимания процедуре и плану переключения, не обновлять его своевременно и не тестировать в нужные сроки. Неверно указанные зависимости машин и приложений, не задокументированные изменения, неправильные процессы, не проверенные на корректность работы приложения и сервисы, неверная последовательность запуска машин из реплик – это лишь некоторые из проблем, которые могут помешать успешному переключению как одного приложения, так и целого ЦОД.
Чтобы помочь организациям справиться с этими проблемами, компания Veeam недавно выпустила новое решение Veeam Availability Orchestrator для автоматизации управления работы с репликами ВМ при переключении на резервную площадку. (Первая версия решения поддерживает виртуальные машины на платформе VMware vSphere.) Подробнее о новинке читайте под катом.
Как мы знаем, план переключения на резервную площадку является составной частью плана действий на случай аварии и послеаварийного восстановления (DR plan). Так, если на виртуальных машинах работают критически важные приложения, зависящие одно от другого, то для сохранения работоспособности системы в случае аварии необходимо корректное переключение на реплики этих ВМ, выполненное в определенной последовательности (сначала домен-контроллер, а потом Exchange, а не наоборот). Для автоматизации этого процесса в Veeam Backup & Replication создается план переключения (failover plan), где указывается:
- Последовательность переключения ВМ
- Длительность паузы между переключениями (пауза нужна, чтобы ненароком не запустить зависимые ВМ до того, как основная ВМ – например, сервер DNS — полностью включится в работу)
План аварийного переключения следует подготовить заранее, чтобы в случае сбоя быстро запустить его. В начале переключения можно выбрать, на какой момент времени (в какое состояние) сделать переключение на реплики ВМ. Затем Veeam Backup & Replication для каждой ВМ из перечня найдет ее реплику и будет включать реплики согласно настройкам плана.
Обязательно выполнить финальный этап процедуры – это может быть либо окончательная фиксация на резервной площадке, либо обратное переключение (например, по окончании техобслуживания\ремонта на основной площадке). Подробнее обо всем этом можно почитать здесь (на русском языке).
Трудно представить, что у серьезных организаций нет плана аварийного переключения. Почему же тогда сбои в работе происходят с такой регулярностью? Что затрудняет работу над планом?
Необходимость тщательного документирования
Основой для успешного планирования является полная, актуальная документация. ИТ-инфраструктуры становятся все более крупными и сложными, при этом в них постоянно происходят изменения. Документировать все важные аспекты работы ИТ вручную – занятие малоэффективное, и тут мы сталкиваемся с одной из возможных причин несостоятельности плана.
Необходимость тестирования
Регулярное комплексное тестирование помогает составлять и тщательно прорабатывать план аварийного переключения и послеаварийного восстановления. Это особенно важно в связи со сложностью построения современных инфраструктур – в частности тех, которые базируются на нескольких сайтах. Добавьте к этому важность потенциального результата для конечного пользователя. Тем не менее, реальная эффективность плана зачастую не проходит должной проверки.
Требования нормативных актов
Планирование и послеаварийное восстановление тесно связаны с нормативными документами, которые регулируют соответствие требованиями целостности, надежности и доступности данных. Хоть требования и нормы различаются для разных отраслей, их объединяет обязательность к выполнению. Невыполнение же влечет за собой высокие репутационные и финансовые риски.
Чем полезен Veeam Availability Orchestrator
Veeam Availability Orchestrator позволяет снизить затраты на подготовку и тестирование планов аварийного переключения. Решение предназначено для автоматизации процессов создания, документирования и тестирования плана аварийного переключения и восстановления, который можно сразу же отдать на подпись руководству, а позднее предъявить проверяющим или аудитору.
Помощь в документировании инфраструктуры
Новое решение помогает задокументировать инфраструктуру в соответствии с требованиям аудита и нормативных актов. Продукт предоставляет:
- 4 настраиваемых отчета на базе шаблонов, в удобном формате, готовом для подписи руководства
- Возможность регулярного обновления и публикации
- Автоматическое документирование всех вносимых изменений
Помощь в тестировании
Veeam Availability Orchestrator позволяет обойтись без нагрузки на производственную инфраструктуру в ходе тестирования плана переключения. Кроме того, можно снизить расходы, сэкономив на ручных процедурах и используя функциональность нового продукта, а именно:
- Выполнение тестов по требованию или по расписанию
- Получение в реальном времени отчетов о состоянии плана
- Регулярное тестирование готовности плана без вовлечения производственных систем и их пользователей
Помощь в выполнении плана
Новое решение помогает управлять репликацией виртуальных машин VMware vSphere, выполняемой при помощи Veeam Backup & Replication. В рамках этой функциональности поддерживаются:
- Верификация виртуальных машин, приложений и сервисов (например, Microsoft SQL Server, Exchange, IIS) в ходе переключения, согласно заданной последовательности запуска
- Интеграция с другими инструментами с помощью открытого API
- Делегирование и контроль доступа к соответствующим ресурсам
Что внутри
В состав Veeam Availability Orchestrator входят:
- Veeam Availability Orchestrator
- Veeam Backup & Replication Enterprise Plus (встроенный)
- Veeam ONE (встроенный)
- Microsoft SQL Server Express
Важно! Встроенные редакции продуктов лицензируются только для поддержки Veeam Availability Orchestrator (VAO) и не предназначены для их полнофункционального использования в производственной среде. Если у вас уже развернут Veeam Backup & Replication, то имейте в виду, что для работы с новым решением его версия должна быть 9.5 Update 3 (и выше), причем редакция Enterprise Plus, поскольку API, необходимые для интеграции с Veeam Availability Orchestrator, представлены только в этой редакции. Заметим, что продукт нельзя устанавливать на ту же машину, где уже работает Veeam Backup & Replication или Veeam ONE.
Схема взаимодействия компонентов показана на рисунке ниже.
Все настройки выполняются из веб-консоли сервера VAO; по умолчанию используется протокол HTTPS и порт 9898.
После настройки ролей и уведомлений администратору нужно выполнить на сервере VAO следующие шаги:
- Добавить серверы VMware и Veeam Backup & Replication (если не добавили в ходе установки).
- Категоризировать и сгруппировать ВМ, для которых будет выполняться план переключения — например, с помошью vCenter tags. Подробнее о категоризации рассказывается здесь (на англ.языке).
- Активировать получившиеся группы ВМ.
- Для каждого сайта указать, какие шаги будет необходимо включить в план.
- Если вы планируете использовать тестовую «песочицу» (а это знакомая вам «виртуальная лаборатория», работающая в Veeam Backup & Replication), то ее также нужно будет активировать в консоли VAO.
- Также на любом сервере Veeam Backup & Replication, находящемся на резервной площадке, можно настроить задание резервного копирования для защиты реплик, используемых при переключении. Для такого задания описание (description) обязательно должно содержать текст [VAO TEMPLATE], а само задание не должно содержать никаких ВМ (можно просто создать пустую папку и добавить ее на шаге Virtual Machines).
Затем уже можно создавать планы переключения и добавлять в них группы виртуальных машин.
Созданные планы можно автоматически проверять, настраивать расписание планового переключения, просматривать историю выполнения, и т.д. Кроме того, состояние всех планов можно отслеживать при помощи дашборда и настраиваемых отчетов:
О лицензиях и стоимости
Лицензию на Veeam Availability Orchestrator можно приобрести в виде подписки на 1 год или со скидкой на срок от 2 до 5 лет.
Приобретать лицензии необходимо только для тех реплицируемых ВМ, для которых требуется настройка планов послеаварийного восстановления (минимальный объем заказа — 10 ВМ), а не для всех ВМ, защищаемых с помощью Veeam Availability Suite или Veeam Backup & Replication.
На одну ВМ приобретается одна лицензия Veeam Availability Orchestrator. Подробно о ценах можно почитать здесь.
Дополнительные ссылки
Описание продукта (на русском языке)
Пользовательская документация (на англ.языке)
Ссылка для скачивания пробной версии
Ссылка для регистрации на вебинар (на англ.языке)
KorP
Пару недель назад захотел попробовать, а вне домена оно не работает :(