Почему мобильное приложение вышло из строя? Можем ли мы выявить проблемы с приложениями до того, как с этим столкнутся конечные пользователи? Является ли последняя версия приложения лучше или хуже, чем предыдущие? В этой статье мы расскажем, как вам может помочь Splunk в поиске ответов на эти вопросы.

Этой статьей мы начинаем цикл статей о том, для решения каких задач можно использовать Splunk. Все решения можно условно разделить на 5 направлений. Сегодня начнем разбираться более подробно с аналитики приложений.



В настоящее время бизнес опирается на приложения для обработки практически каждого процесса. Низкий уровень удовлетворенности качеством работы этих приложений может поставить под угрозу репутацию, конкурентные преимущества и в конечном итоге доход. Поэтому получение инсайдов из приложений и инфраструктуры, на которой они работают, становится важной задачей для любого бизнеса.

Splunk позволяет агрегировать машинные данные об использовании приложений, их доступности и производительности. Данные могут собираться из широкого спектра источников в режиме реального времени.




Давайте разберемся подробнее, какую ценность из мониторинга работы приложений мы можем получить.

Расширенный мониторинг приложений и алертинг


Измерение в режиме реального времени доступности приложений, производительности и использования пользователями способствует возможности обеспечения высокого качества обслуживания и получения положительного клиентского опыта. Когда вы комбинируете видимость машинных данных на разных уровней вашей инфраструктуры с мониторингом в реальном времени, вы может предвидеть события даже до того, как они произошли.

Исправление проблем


Сокращение среднего времени на восстановление работоспособности системы (MTTR) и на устранение неполадок, определяя причины сбоев в работе и узкие места системы. Распределенные приложения могут генерировать много ошибок, а корень проблемы найти не просто, так как разработчики приложений и администраторы могут не иметь прямого доступа к машинным данным, которые им нужны. Splunk может предоставить доступ ко всем вашим данным, что позволит быстро исправит проблемы и сократить время простоя.



Планирование мощности


Оптимизация производительности приложения и стоимости обслуживания за счет понимания использования приложения. А также прогноз будущих значений и планирование мощности, за счет машинного обучения

Управление уровнем обслуживания (SLA)


Анализ и составление отчетности об общей доступности сервиса и ключевых показателях эффективности (KPI), а также способность быстро определить причину, в случае отклонения от оптимальных значений.

Бизнес-аналитика


Возможность интегрировать в Splunk не только IT-данные, но и данные из источников не относящихся к IT, позволяет разработчикам и разным бизнес направлениям оценивать влияние транзакций на бизнес и то, как приложения способствуют ведению бизнеса.

DevOps


Для ИТ-специалистов, использующих DevOps, программное обеспечение Splunk помогает повысить скорость и качество работы над приложениям. В отличие от других решений, ориентированных на отдельные компоненты разработки, Splunk предоставляет информацию в реальном времени на всех этапах жизненного цикла разработки продукта, что позволяет сократить время разработки и выхода продукта на рынок. Видео о DevOps

Success story


Давайте посмотрим, как компания Zillow, занимающаяся продажей и арендой недвижимости, использует Splunk для обеспечения бесперебойной работы своего веб-сайта.



Трафик веб-сайта Zillow генерируется клиентами с мобильных устройств, ПК и планшетов. Раньше, когда случались случайные сбои веб-сайта, руководители Zillow были обеспокоены удовлетворенностью клиентов, рискуя потерями в миллионах долларов дохода от рекламы или неспособностью заключать договорные соглашения с компаниями, которые предоставляют данные о недвижимости для Zillow.

«Если веб-сайт «упал» в 2 часа ночи, мне пришлось бы кропотливо просмотреть терабайты журналов, чтобы выяснить, что не так» — говорит Jerome Ibanes, архитектор данных в Zillow.

Продолжать использовать устаревшие инструменты было невозможно: Zillow нуждался в эффективных решениях для обработки и анализа постоянно изменяющихся неструктурированных данных. Ранее Zillow приходилось перемещать терабайты данных по нескольким инструментам, чтобы использовать машинное обучение и получать понимание происходящего.

Zillow изначально развернули Splunk Enterprise для устранения неполадок ИТ — инфраструктуры. А уже успех в обработке ошибок привел к дополнительным задачам: от прогнозирования трафика веб-сайта и мониторинга среды тестирования приложений до получения информации о посещениях сайта клиентами и их действиях на сайте, чтобы предоставить наилучший контент.

Видео, в котором Jerome Ibanes рассказывает об опыте внедрения Splunk в Zillow, можно посмотреть тут.

Проблемы, которые требовали решения


  • Нарушения работы веб-сайта влияли на отношение клиентов
  • Нарушения веб-сайта влияли на доходы от рекламы и компрометировали договорные соглашения с компаниями, которые предоставляют данные для Zillow
  • На идентификацию причины затрачивались часы
  • Разработчики продуктов ждали от одного до двух дней для доступа к данным

Источники данных


  • Веб-серверы
  • Серверы Java
  • Приложения на Python
  • Базы данных
  • Брандмауэры
  • Балансировщики нагрузки
  • Мобильные устройства

Влияние на бизнес


  • Улучшение качества обслуживания клиентов
  • Сокращение величины упущенной прибыли размерами в миллионы долларов за счет сокращения сбоев веб-сайта
  • Сокращение времени выявления причины инцидента от часов до нескольких минут или секунд
  • Ускорение времени выхода на рынок, предоставляя разработчикам продуктов данные работы приложений в режиме реального времени

Таким образом, аналитика работы приложений в Splunk позволяет:

  1. Улучшить производительность приложений, путем выявления проблем, которые затрагивают доступность и быстродейсвие
  2. Сократить среднее время на восстановление работоспособности системы и устранение неполадок
  3. Получить информацию использования приложений, включая поведение пользователей и производительность приложения
  4. Улучшить DevOps и уменьшить время выхода на рынок продукта

Если вы все еще не пробовали Splunk, то самое время начать, бесплатная версия до 500Мб в сутки доступна всем желающим. А если у вас есть вопросы или проблемы со Splunk — вы можете задать их нам, а мы поможем.

Мы являемся официальным Premier Партнером Splunk.

Комментарии (5)


  1. sevmax
    24.07.2018 04:14

    Отличный Вы выбрали пример компании! :)

    Я DevOps инженер в Zillow, отвечу на общие технические вопросы, не подпадающие под NDA.


    1. AlexKulakov
      24.07.2018 10:59

      круто =) напишите как вам спланк, было бы интересно из первых уст послушать)


      1. sevmax
        25.07.2018 00:25

        В компании несколько брендов, в основном из-за поглощений, соответсвенно каждый бренд «пришёл» со своей инфраструктурой. Со временем всё логирование глобально перевели на Splunk.
        Туда пишутся как обычные файловые логи, так и информация напрямую из приложения.
        В целом, все команды довольны, реализована интеграция с SSO, разделение прав: кто из какого бренда какие логи может видеть, настроено большое количество фильтров, проводятся внутренние тренинги.
        Стоимость продукта окупается его эффективностью, в рамках большой компании экономический эффект от системы логирования преобладает над ценой.


      1. saboteur_kiev
        25.07.2018 00:32

        Спланк — это хорошо для бизнес-аналитиков, для L3 саппорта — вполне френдли UI, гибкие фильтры, отчеты — все наглядно. Полезно для архитекторов.

        Еще Спланк — хорошо, если у вас крупная компания с множеством проектов и в спланк можно интегрировать все проекты, ибо покупать его для одного приложения — дорого.

        А просто для мониторинга (для админов/девопсов) — IMHO слишком большой оверхед


  1. bbidox
    24.07.2018 11:21

    Splunk — это прекрасно. Это офигенный поиск и агрегация. Удобные отчёты. Но. Очень. Дорого.