Привет, Хабр. Сегодня мы поговорим о том, почему растет спрос на аварийное восстановление, а также разберем несколько примеров, когда компании сталкиваются с рисками или реальными сбоями инфраструктуры там, где раньше это было невозможно. Всех желающих обсудить предпосылки к расширению DR, а также методы защиты данных в разных ситуациях, приглашаю под кат.
Disaster Recovery — само по себе хорошая штука, но если раньше системы подобного класса использовали все-таки для наиболее критичных систем, то сегодня мы наблюдаем повышенный интерес к DR. Только у нас в Oxygen количество данных, защищаемых тем или иным способом, ощутимо увеличилось за последние полгода. При том, что никто не отменял обычного человеческого фактора — кто-то что-то не то настроил, кто-то пнул сервер или неверно сохранил данные, сегодня работают новые факторы. Их можно отнести к совершенно непрогнозируемым событиям (таким как обрыв линии электропитания из-за ледяного дождя или случайная атака бульдозера на оптоволоконный кабель) и по большому счету их насчитывается целых пять.
Старое оборудование дает все больше сбоев, создает риски доступности важной информации и бизнес-систем. А купить новое быстро оказывается невозможно. Поэтому опция восстановления, если вдруг что-то пойдет не так, оказывается все более привлекательной.
Отсутствие технической поддержки вендора вносит большой вклад в нестабильность ИТ, когда речь заходит о проблемах с ПО. Это может быть и прикладное ПО, и middleware — не важно. Если вендор не поддерживает, значит многие вопросы приходится решать самостоятельно, либо привлекать дополнительных специалистов. И если в процессе что-то пошло не так, хорошо восстановиться и продолжить в другом месте.
Дефицит запчастей особенно для СХД. Длительная доставка и сложность закупки усложняют хранение данных и снижают надежность. К тому же, сегодня мало привести диск для расширения СХД. В большинстве корпоративных решений нужно докупить лицензию. Но вендоры ушли, они не обслуживают свое оборудование, не дают новых ключей. Возникает проблема, которая заставляет переносить часть хранения на другие массивы и даже гиперконвергентные системы.
Зарубежные облака. Не будем скрывать, ряд компаний, к которым не предъявляются требования по немедленному переносу всего и вся в Россию. продолжают работать в облаках гиперскейлеров. Но платить за зарубежное облако стало сложно, а к тому же никто не знает, не случится ли какого-либо отключения за то, что вы — русский бизнес. Видимо поэтому мы получили уже несколько запросов на резервирование данных в Oxygen из других облаков. Кстати, после этого проще запускать и миграцию процессов, не дожидаясь часа X.
Отказы на уровне приложений — приложения надо обновлять, но не получается. Ошибки становятся более частыми и весомыми. Поэтому потребность в восстановлении данных возросла даже для не самых критичных бизнес-процессов.
Три примера, когда компании начинают использовать облачный DR
Еще вчера сверхнадежные решения
Буквально не давно к нам обратилась одна компания, которая начала пользоваться облачными сервисами резервирования данных из-за проблем с СХД. Кластер из IBM StorWise v7000 использовался давно и, конечно, с некоторой периодичностью происходили различные проблемы на СХД, которые раньше решал вендор. Заказчику не нужно было даже штат специалистов содержать у себя.
Теперь не получается завести тикет, никаких ответов нет. Произошел крупный инцидент, и восстановить данные штатными средствами не удалось! Фирма наняла инженеров, которых уволили из IBM (и это, кстати, тоже не бесконечный актив — сегодня уже почти всех разобрали, несколько работают у нас в Oxygen). Но даже так они вернули только 40% важной информации. И это при том, что речь идет о сверхнадежных решениях от IBM. Таким образом, сегодня новые и новые компании осознают, что ранее гарантированная защита данных уже не работает. И хорошо, если это удается понять на чужом опыте…но уверенность в используемых решениях, увы, заставляет большинство приходить к такому выводу на своем.
Правила и законы, которые снижают надежность
Еще один пример, о котором далеко не все задумываются, связан со ввозом компонентов в Россию. И нет, здесь идет речь не о санкциях — как уже рассказывали мои коллеги (ссылка), ввести сегодня можно почти все что угодно. Да, долго и дорого, но можно. Здесь речь идет о том, что компоненты перестали соответствовать требованиям таможенных правил.
У одной компании, которая использует целый парк серверов Dell, не получилось ввести к ним запчасти. Дело в том, что существует таможенная нотификация, а также требования к работе с криптографическими средствами в РФ. Раньше вендор, заинтересованный в поставках, продлевал сертификаты. Но в этом году очередной срок кончился…но Dell их не продлила, потому что больше не работает в России. Как обслуживать целый парк серверов теперь? Нужно куда-то мигрировать, что-то делать. А главное, радикально снижается уровень надежности и отказоустойчивости. И я уверен, что с другими производителями происходит нечто подобное.
Сеть становится источником нестабильности
Опять же речь идет о самых проверенных и надежных коммутаторах. Многие компании используют топовые модели Cisco. А эти железки не будут нормально работать без соответствующих лицензий. Например, один наш клиент констатирует факт, что пока лицензии еще действуют. Но как будут обстоять дела дальше, уже непонятно. Ясно только, что продлить их официальным и привычным образом не получится. А все эксперименты создают дополнительные риски…и запрос на DR с возможностью восстановления активности ИТ где-то в другом месте.
Методы DR
Во всех этих и других случаях успешно применяется облачный DR. Однако и он не является универсальным решением. Ведь разным системам нужен точно не один и тот же уровень защиты, а самая надежная и быстрая failover схема стоит слишком дорого, чтобы применять ее налево и направо.
В следующем посте я подробно рассмотрю три схемы DR в облаке, которые мы применяем сегодня, а также расскажу об их плюсах, минусах и реальной стоимости. А сейчас расскажите, изменило ли ваше отношение к DR реальность 2022 года?