Говорят, что все новое — это давно забытое старое. При смене подходов к разработке информационных систем бывает полезно обратиться к фундаментальным концепциям и использовать в новых условиях лучшие наработанные практики. В этой статье мы рассмотрим понятие непрерывности бизнеса, а также разберемся, чем оно может быть полезно менеджерам продуктов.

При определении здоровья продукта мы чаще обращаемся к финансовым показателям, удовлетворенности клиента от юзабилити и основных функций, конкурентоспособности. Все эти метрики, безусловно, важны, они служат драйверами для развития функциональной составляющей продукта. Однако фундаментом, без которого удовлетворенности клиентов явно будет невозможно достигнуть, являются надежность и устойчивость работы продукта. По сути, продукт можно рассматривать как ядро бизнеса, а состояние этого продукта определяет непрерывность деятельности всей организации, выстраиваемой вокруг него.

Непрерывность бизнеса (Business Continuity) — способность продолжать работу в случае повреждения или уничтожения части инфраструктуры, ИТ-сбоев, потери поставщиков и т.д. Подробнее вы можете познакомиться с этим понятием в этом и втором материалах.

Чем может быть нам полезен такой взгляд?

Оценить масштаб ущерба

Во-первых, он позволит осознать степень критичности сбоев для бизнеса. Объем потерь может быть колоссальным. При этом, находясь в рамках «продуктового подхода к разработке программного обеспечения», мы не проводим расширенный анализ рисков и влияния на бизнес (Business Impact Analysis). Управление и планирование непрерывности бизнеса (Business Continuity Planning) подводит к тому, что критичные точки отказа должны быть заранее определены и проанализированы, а также следует определить комплекс превентивных мер по уменьшению или исключению сбоев.

Жизненный цикл управления непрерывностью бизнеса
Жизненный цикл управления непрерывностью бизнеса

Процесс начинается с выявления и оценки рисков (Risk Assessment), в рамках чего проводится оценка вероятности возникновения каждого риска и его потенциального воздействия на бизнес. Могут использоваться как качественные, так и количественные методы анализа. Про оценку рисков принято говорить в контексте любого проекта, но, к сожалению, редко выстраивается комплекс мер по их актуализации. Подход к этим привычным процессам с точки зрения управления непрерывностью бизнеса позволяет выстроить сквозную стратегию по управлению рисками.

Отметим, что стратегия не обязательно должна включать практики по снижению или избежанию риска. Риск можно передать третьим лицам: например, застраховать активы, прибегнуть к аутсорсингу или же просто осознать и принять риск, если затраты на его снижение превышают потенциальные убытки.

Часто бывает, что при управлении продуктом мы полагаемся на общую выстроенную в компании ИТ-инфраструктуру, процессы разработки (например, применение практик DevOps) и работу инженеров, как бы получая «сервис» от своей же компании. Эти процессы обособлены от основного пути развития продукта и зачастую кажется, что все гарантировано надежно и продукт в безопасности. Как мы говорили выше, это стратегия передачи риска третьим лицам. Нефункциональные требования прописаны, установлен SLA (Service Level Agreement) — значит, в крайнем случае можно будет определить «кто виноват». Однако это не решает вопроса предотвращения масштабных сбоев. По мировой статистике, большинство организаций, которые столкнулись с длительным простоем, не восстанавливаются и в скором времени прекращают полностью свою деятельность.

Учитывать новые угрозы

Во-вторых, понятие непрерывности бизнеса расширяет множество факторов, которые мы обычно учитываем. Например, отключение электричества, наводнения и другие стихийные бедствия могут оказать влияние на инфраструктуру, требующуюся для функционирования вашего продукта, что по данным регулярных исследований (например, Gartner) может привести к таким длительным сбоям, что даже восстановление бизнеса не позволит избежать банкротства. Наверняка, вы, как пользователи многих приложений, понимаете, что даже замедление загрузки данных может вызвать такие негативные эмоции, что лояльность клиентов будет безвозвратно потеряна. Что уж говорить про шквал эмоций от неработающего Wi-Fi при разрыве канала у оператора.

Отдельное внимание в мировой практике уделяется поддержанию деятельности сотрудников «на удаленке», учету политических факторов и мировой нестабильности. По результатам опроса на Всемирном экономическом форуме в 2024 году, в список топ-рисков уже попали последствия от использования AI (решений на базе искусственного интеллекта) – включая дезинформацию, поскольку принятие решений на базе недостоверных данных (мы не можем полностью доверять сгенерированным AI материалам) может привести к серьезным стратегическим ошибкам, как для отдельного продукта, так и для всей компании. Киберугрозы, безусловно, также продолжают оказывать сильное влияние на бизнес, чему вы найдете множество подтверждений в новостной ленте за прошедший год.

Топ-5 рисков с точки зрения НБ в 2024, по данным Всемирного экономического форума (World Economic Forum)
Топ-5 рисков с точки зрения НБ в 2024, по данным Всемирного экономического форума (World Economic Forum)

Непрерывность бизнеса не может быть сведена только к ИТ-угрозам и мерам (хотя зависимость от ИТ для многих направлений выросла), что открывает пространство для креативных решений. Например, чтобы обеспечить непрерывную работу, крупному западному ЦОД, предоставляющему услуги облачного хранилища, потребовалось бесперебойное электропитание. Дизельные генераторы, обеспечивающие резервное питание, нуждались в большом запасе топлива. Но дизельное топливо со временем теряет свои свойства. Регулярная замена большого объема дизеля — дорогое удовольствие. В итоге было принято решение о строительстве в непосредственной близости от ЦОД бензоколонки. Она обеспечивала постоянный обновляемый запас топлива и стала новым направлением бизнеса.

Выстраивать бизнес-мониторинг

В-третьих, фокусируясь через непрерывность бизнеса на критичных процессах и понимая все последствия, мы больше осознаем важность выстраивания бизнес-мониторинга. При этом речь идет не о контроле продуктовых метрик (МАU, DAU и других, в зависимости от продукта), а об отслеживании «здоровья» продукта даже в тех случаях, когда технический мониторинг не показывает сбой.

Главная ценность бизнес-мониторинга — фокус на бизнес-процессе в целом, а не на отдельных системах и сервисах. При этом заложить механизмы для сбора корректных данных необходимо уже на этапе проектирования аналитиками. В отличие от технического мониторинга, когда важны производительность, загрузка ресурсов или количество ошибок, необходимо определить показатели, отражающие выполнение end-to-end сценариев. End-to-end сценарии представляют собой полные цепочки действий, которые проходят от начальной точки (например, запроса клиента) до конечного результата (например, доставки продукта или услуги).

Чтобы было понятнее, рассмотрим на примере онлайн-магазина. Основным ожиданием пользователей, безусловно, является возможность набора корзины из каталога товаров и оформления заказа. Технический мониторинг мог бы показать, что отдельные сервисы работают исправно. Но бизнес-мониторинг, отслеживающий сценарий «Создание заказа», сразу выявил бы проблему: заказы не создаются, например, из-за неправильных данных об остатках. В данном случае, каждый сервис (товаров, остатков, корзины и заказа) может быть доступен и не выдавать ошибок, но при построении каталога и проверке остатка в сервисе, из-за проблем его синхронизации с другими системами, количество товара на складе было равно 0, что блокировало добавление в корзину и последующий заказ. В результате поведение штатное, но результат — некорректный. Из-за этого компания теряет прибыль и лояльность клиентов.

Построение бизнес-мониторинга может дать хороший эффект при минимальных затратах, поскольку используются те же инструменты, что и для технического мониторинга (например, Prometheus, Grafana). Также могут подключаться решения по сбору продуктовых метрик (системы аналитики, ETL-инструменты и др.), только при планировании отслеживаемых показателей особое внимание уделяется «здоровью» продукта. В реальном времени учитываются данные из различных источников о каждом этапе процесса, что помогает находить узкие места, задержки и проблемы, которые могут возникнуть на пути к достижению конечной цели. Собранные данные анализируются для выявления тенденций, паттернов и аномалий. На основе анализа данных и отчетов необходимо принять решение о доработке продукта, оптимизации процессов, инфраструктурных задачах или других последующих мерах. Изменения в продукте и окружающей среде, безусловно, диктуют необходимость постоянной модификации и развития системы бизнес-мониторинга для сохранения его эффективности.

Уверена, многие из вас сталкиваются с отдельными аспектами непрерывности бизнеса, поскольку без них невозможно стабильное выполнение бизнес-процессов, однако для перехода на новый уровень и обеспечения полноценной устойчивости продукта, всем членам команд разработки необходимо применять комплексный подход и использовать лучшие мировые практики.

Надежные продукты с хорошей репутацией и высоким уровнем удовлетворенности клиентов укрепляют доверие к бренду. Это доверие является важным фактором для долгосрочной устойчивости бизнеса.

Подробнее про то, как учитывать аспекты непрерывности бизнеса при проектировании информационных систем, поговорим на предстоящей конференции Analyst Days 19.

А какие нестандартные решения для обеспечения устойчивости вашего продукта вы применяете? Поделитесь своими кейсами в комментариях!

Комментарии (0)