Подобные системы применяют организации из самых разных отраслей — промышленные предприятия, нефтегазовые компании, облачные провайдеры и многие другие. Расскажем, что важно знать о ситуационных центрах.
Почему мы об этом говорим
Сегодня можно легко представить ситуацию, когда финансовая структура или ретейлер внезапно сталкиваются с технологическими проблемами, становятся «заложниками» сбоя или аварии в дата-центре. В силу обстоятельств они перестают обслуживать часть клиентов, а если речь идет о крупном маркетплейсе или банке из топ-20, их число может исчисляться тысячами.
Денежные и репутационные потери в таком случае, конечно же, приведут к серьезным последствиям. Подобные риски появились не вчера. Операторы дата-центров работают с ними с момента запуска облачных платформ как таковых, а организации-клиенты с каждым годом тратят все больше на обеспечение информационной безопасности, доступности и бесперебойной работы своих сервисов. Аналитики из Global Industry Analysts ожидают, что в ближайшие четыре года рынок систем управления производительностью и стабильностью приложений продолжит свое развитие и вырастет до $12 млрд. Для сравнения, еще в 2020-м его оценили в $6,3 млрд.
Решения, направленные на обеспечение работоспособности отдельных сервисов, достаточно разнообразны. Только Gartner выделяет порядка пятнадцати ключевых игроков. У них отличается технологический стек и функциональные подходы, зачастую они фокусируются на мониторинге процессов. При этом часть задач компании могут закрывать собственными силами, не привлекая сторонних поставщиков. Управлять таким «зоопарком» достаточно сложно — необходимы компетенции для связи и синхронизации инструментов, что тянет за собой дополнительные расходы.
В то же время даже минимальная децентрализация структуры мониторинга приводит к тому, что нештатные ситуации решаются с задержкой, а процесс устранения последствий затягивается. На эту проблему обращали внимание еще в 2015 году — тогда специалисты из аналитической фирмы Enterprise Management Associates установили, что большинство корпораций имеет более одиннадцати коммерческих платформ, отвечающих за мониторинг и бесперебойную работу сервисов. Две трети организаций отметили, что на поиск причины неполадок у них уходит от одного до трех часов (но эта цифра может достигать и шести часов). Дело в том, что в условиях децентрализации размывается ответственность за устранение инцидентов.
Одно из возможных решений — управление процессами с помощью централизованного ситуационного центра (СЦ). Он мониторит ключевые бизнес-операции (например, скорость обслуживания в офисе или колл-центре и необходимые для этого трудозатраты), а также выявляет потенциальные слабые места в инфраструктуре и ПО и заблаговременно предупреждает о сбое. Типичный спектр задач такой системы может включать и вопросы, связанные с управлением UX. Далее, рассмотрим все эти моменты подробнее.
Как это работает
Вообще, под ситуационным центром принято понимать единую систему, которая контролирует ключевые показатели бизнес-процессов компании и работу ИТ-инфраструктуры. В каком-то смысле она реализует data driven подход, позволяющий принимать взвешенные решения на основе данных. Плюс — она делает разработку новых продуктов и сервисов эффективной как с точки зрения ресурсов, так и информационной безопасности.
Такое решение становится основой для «зонтичного мониторинга» и единого центра ответственности. С его помощью можно координировать действия подразделений и контрагентов, чтобы оперативно устранять последствия аварий и сами уязвимости. Разумеется, к системам мониторинга можно подключить не только программное, но и аппаратное обеспечение. Например, вот так может выглядеть окно, позволяющее администратору оценить работоспособность отдельных рабочих станций.
При выборе централизованной системы для мониторинга следует обращать внимание на некоторые особенности вроде возможности анализа данных в контексте отдельно взятой компании, филиала или индивидуального рабочего места.
Также стоит обратить внимание на комплекс дополнительных решений, способных сэкономить время и ресурсы компании. Например, в некоторых случаях через ситуационный центр можно автоматизировать проведение конференц-звонков с руководителями ключевых подразделений при ЧС и настройку каналов для дистанционного доступа к корпоративной сети.
Еще один ключевой фактор — простота внедрения. Наличие исчерпывающих руководств и интуитивный интерфейс позволяют не тратить ресурсы на специальное обучение сотрудников, плюс — техподдержке проще реагировать на инциденты в процессе эксплуатации системы. Например, наш Watchman получает данные через унифицированные интерфейсы, что позволяет оперативно ставить на мониторинг новые и уже действующие приложения.
Что там с UX
В конечном счете — работа СЦ будет направлена на формирование благоприятного пользовательского опыта. В силу очевидной зависимости внешнего UX (клиенты и партнеры) от опыта внутренних потребителей (сотрудников), так как неэффективные процессы сказываются на общей удовлетворённости клиентов в не меньшей степени, чем технические сбои по «железу». Однако найти такие «тормозящие» процессы сложнее — зачастую их нельзя оценить визуально или с помощью каких-либо измерений.
В этом контексте стоит учитывать, что в составе СЦ обязательно должна быть многофункциональная система сбора данных о пользовательском опыте. Мониторинг такой информации является одновременно и элементом ситуационного центра, и инструментом для измерения эффективности его работы. Однако важно понимать, что метрики и параметры, на которых выстраиваются критерии анализа нештатных ситуаций, следует формировать на основе реальных данных.
В нашем портфолио есть такая система для комплексного бизнес-мониторинга — Watchman. Она построена на основе инструментов системного анализа, а также платформ для исследования бизнес-процессов — а именно, Process Mining и Process Discovery. Watchman получает данные мониторинга с рабочих мест и дает наиболее объективную картину ситуации с состоянием ПО и «железа». Такой подход дает возможность эффективнее оценивать то, как на самом деле выполняется тот или иной бизнес-процесс, в том числе и с помощью специализированных математических моделей.
Подобные решения по работе с данными, конечно же, подойдут не только условным предприятиям с разветвленной филиальной сетью, как упомянутый в начале статьи банк. Любая компания, имеющая в своем распоряжении широкий парк рабочих ПК и осуществляющая непрерывные бизнес-процессы, может выиграть от внедрения системы мониторинга. Так, для одного из наших клиентов мы добились увеличения доступности ИТ-сервисов с 99,3% до 99,7%, плюс — сократили число заявок в службу поддержки на 12%.
О других наших кейсах — в блоге на Хабре:
funca
Слушайте, я кое-как нашел лендинг вашего продукта, а там:
И две ссылки на pdf с документацией.
Сравниваю с уровнем клиентоориентированности ведущих игроков, на которых ссылается исследование в вашей статье, например https://www.pagerduty.com/resources/ или https://learn.newrelic.com/ . Они проводят просто невероятную работу для привлечения клиентов и разработчиков на свою сторону. Код client side доступен как опенсорс, что позволяет дорабатывать интеграции своими силами для собственных нужд. Масса документации, обучающих программ (в т.ч бесплатных), просветительской деятельности по ключевым вопросам change/incident/problem management, чуть-ли не бесплатные тарифы для небольших компаний, кто вероятно находится на старте своего роста и растет вместе с ними. Что мешает вам делать так же?
little-brother
>> Что мешает вам делать так же?
Имхо, размер и "национальные особенности" рынка.
SerjV
Ну действительно, зачем на отечественном рынке такие телодвижения, если всё равно купят - выбор-то конечно есть, но не того чтобы глаза разбегались (потому что реестры, сертификация)... А раз так, то можно даже вообще работать по-старинке (очень большой старинке) - предлагать цену методом оценки платёжеспособности клиента. С другой стороны, восток - дело тонкое, можно попробовать поторговаться, и если долго и хорошо торговаться, может даже и нормальную цену можно получить.