Почему мобильное приложение вышло из строя? Можем ли мы выявить проблемы с приложениями до того, как с этим столкнутся конечные пользователи? Является ли последняя версия приложения лучше или хуже, чем предыдущие? В этой статье мы расскажем, как вам может помочь Splunk в поиске ответов на эти вопросы.
Этой статьей мы начинаем цикл статей о том, для решения каких задач можно использовать Splunk. Все решения можно условно разделить на 5 направлений. Сегодня начнем разбираться более подробно с аналитики приложений.
В настоящее время бизнес опирается на приложения для обработки практически каждого процесса. Низкий уровень удовлетворенности качеством работы этих приложений может поставить под угрозу репутацию, конкурентные преимущества и в конечном итоге доход. Поэтому получение инсайдов из приложений и инфраструктуры, на которой они работают, становится важной задачей для любого бизнеса.
Splunk позволяет агрегировать машинные данные об использовании приложений, их доступности и производительности. Данные могут собираться из широкого спектра источников в режиме реального времени.
Давайте разберемся подробнее, какую ценность из мониторинга работы приложений мы можем получить.
Расширенный мониторинг приложений и алертинг
Измерение в режиме реального времени доступности приложений, производительности и использования пользователями способствует возможности обеспечения высокого качества обслуживания и получения положительного клиентского опыта. Когда вы комбинируете видимость машинных данных на разных уровней вашей инфраструктуры с мониторингом в реальном времени, вы может предвидеть события даже до того, как они произошли.
Исправление проблем
Сокращение среднего времени на восстановление работоспособности системы (MTTR) и на устранение неполадок, определяя причины сбоев в работе и узкие места системы. Распределенные приложения могут генерировать много ошибок, а корень проблемы найти не просто, так как разработчики приложений и администраторы могут не иметь прямого доступа к машинным данным, которые им нужны. Splunk может предоставить доступ ко всем вашим данным, что позволит быстро исправит проблемы и сократить время простоя.
Планирование мощности
Оптимизация производительности приложения и стоимости обслуживания за счет понимания использования приложения. А также прогноз будущих значений и планирование мощности, за счет машинного обучения
Управление уровнем обслуживания (SLA)
Анализ и составление отчетности об общей доступности сервиса и ключевых показателях эффективности (KPI), а также способность быстро определить причину, в случае отклонения от оптимальных значений.
Бизнес-аналитика
Возможность интегрировать в Splunk не только IT-данные, но и данные из источников не относящихся к IT, позволяет разработчикам и разным бизнес направлениям оценивать влияние транзакций на бизнес и то, как приложения способствуют ведению бизнеса.
DevOps
Для ИТ-специалистов, использующих DevOps, программное обеспечение Splunk помогает повысить скорость и качество работы над приложениям. В отличие от других решений, ориентированных на отдельные компоненты разработки, Splunk предоставляет информацию в реальном времени на всех этапах жизненного цикла разработки продукта, что позволяет сократить время разработки и выхода продукта на рынок. Видео о DevOps
Success story
Давайте посмотрим, как компания Zillow, занимающаяся продажей и арендой недвижимости, использует Splunk для обеспечения бесперебойной работы своего веб-сайта.
Трафик веб-сайта Zillow генерируется клиентами с мобильных устройств, ПК и планшетов. Раньше, когда случались случайные сбои веб-сайта, руководители Zillow были обеспокоены удовлетворенностью клиентов, рискуя потерями в миллионах долларов дохода от рекламы или неспособностью заключать договорные соглашения с компаниями, которые предоставляют данные о недвижимости для Zillow.
«Если веб-сайт «упал» в 2 часа ночи, мне пришлось бы кропотливо просмотреть терабайты журналов, чтобы выяснить, что не так» — говорит Jerome Ibanes, архитектор данных в Zillow.
Продолжать использовать устаревшие инструменты было невозможно: Zillow нуждался в эффективных решениях для обработки и анализа постоянно изменяющихся неструктурированных данных. Ранее Zillow приходилось перемещать терабайты данных по нескольким инструментам, чтобы использовать машинное обучение и получать понимание происходящего.
Zillow изначально развернули Splunk Enterprise для устранения неполадок ИТ — инфраструктуры. А уже успех в обработке ошибок привел к дополнительным задачам: от прогнозирования трафика веб-сайта и мониторинга среды тестирования приложений до получения информации о посещениях сайта клиентами и их действиях на сайте, чтобы предоставить наилучший контент.
Видео, в котором Jerome Ibanes рассказывает об опыте внедрения Splunk в Zillow, можно посмотреть тут.
Проблемы, которые требовали решения
- Нарушения работы веб-сайта влияли на отношение клиентов
- Нарушения веб-сайта влияли на доходы от рекламы и компрометировали договорные соглашения с компаниями, которые предоставляют данные для Zillow
- На идентификацию причины затрачивались часы
- Разработчики продуктов ждали от одного до двух дней для доступа к данным
Источники данных
- Веб-серверы
- Серверы Java
- Приложения на Python
- Базы данных
- Брандмауэры
- Балансировщики нагрузки
- Мобильные устройства
Влияние на бизнес
- Улучшение качества обслуживания клиентов
- Сокращение величины упущенной прибыли размерами в миллионы долларов за счет сокращения сбоев веб-сайта
- Сокращение времени выявления причины инцидента от часов до нескольких минут или секунд
- Ускорение времени выхода на рынок, предоставляя разработчикам продуктов данные работы приложений в режиме реального времени
Таким образом, аналитика работы приложений в Splunk позволяет:
- Улучшить производительность приложений, путем выявления проблем, которые затрагивают доступность и быстродейсвие
- Сократить среднее время на восстановление работоспособности системы и устранение неполадок
- Получить информацию использования приложений, включая поведение пользователей и производительность приложения
- Улучшить DevOps и уменьшить время выхода на рынок продукта
Если вы все еще не пробовали Splunk, то самое время начать, бесплатная версия до 500Мб в сутки доступна всем желающим. А если у вас есть вопросы или проблемы со Splunk — вы можете задать их нам, а мы поможем.
Мы являемся официальным Premier Партнером Splunk.
Комментарии (5)
bbidox
24.07.2018 11:21Splunk — это прекрасно. Это офигенный поиск и агрегация. Удобные отчёты. Но. Очень. Дорого.
sevmax
Отличный Вы выбрали пример компании! :)
Я DevOps инженер в Zillow, отвечу на общие технические вопросы, не подпадающие под NDA.
AlexKulakov
круто =) напишите как вам спланк, было бы интересно из первых уст послушать)
sevmax
В компании несколько брендов, в основном из-за поглощений, соответсвенно каждый бренд «пришёл» со своей инфраструктурой. Со временем всё логирование глобально перевели на Splunk.
Туда пишутся как обычные файловые логи, так и информация напрямую из приложения.
В целом, все команды довольны, реализована интеграция с SSO, разделение прав: кто из какого бренда какие логи может видеть, настроено большое количество фильтров, проводятся внутренние тренинги.
Стоимость продукта окупается его эффективностью, в рамках большой компании экономический эффект от системы логирования преобладает над ценой.
saboteur_kiev
Спланк — это хорошо для бизнес-аналитиков, для L3 саппорта — вполне френдли UI, гибкие фильтры, отчеты — все наглядно. Полезно для архитекторов.
Еще Спланк — хорошо, если у вас крупная компания с множеством проектов и в спланк можно интегрировать все проекты, ибо покупать его для одного приложения — дорого.
А просто для мониторинга (для админов/девопсов) — IMHO слишком большой оверхед