Привет, Хабр! Я Максим Иванов, директор по развитию Modus, и сегодня я хочу порассуждать о важном вопросе.

В 2022 году российский IT-рынок столкнулся с массовым оттоком международных и технологических корпораций. Рынок BI не исключение – популярные лидеры досанкционного рынка - Tableau, Power BI, Qlik, Sisense - ограничили работу с российскими компаниями.

У бизнеса возник вполне понятный вопрос – а как работать дальше?

Поделюсь мнением.

Почему лучше не ждать?

Иностранные BI-вендоры останавливают сотрудничество с российскими клиентами: не продают новые лицензии, замораживают продление и техподдержку уже имеющихся. Оплатить подписку или покупку лицензий с карт российских банков невозможно.

Какое-то время бизнес считал, что это ненадолго – искали обход санкций, платили с иностранных карт и т.п. И ждали. Сейчас стало понятно, что это "всерьез и надолго".

Компании, для которых BI стал частью ежедневной бизнес-рутины, встали перед необходимостью чем-то оперативно заменить неработающие сервисы.

Для того, чтобы компания не осталась без данных, не потеряла все разработки и снизила зависимость от иностранного вендора, лучше не ждать с переходом на другой BI.

Что нужно для перехода?

В обычных условиях выбор и внедрение BI-платформ — поэтапный процесс, который начинается с первого пилотного проекта на 10–20 пользователей или аналитики какого-то определенного разреза данных (финансовой, кадровой и т.п), а дальше масштабируется на всю компанию.

Сейчас бизнес часто не готов ждать и интегрировать новые системы аналитики «по классике», чтобы не погрязнуть в аналитике и мониторинге данных на этапе миграции.

Со стороны заказчика самый важный этап - это понимание целей и задач, которые будут стоять перед новой системой. Дальше - работа интегратора и вендора.

Например, для перехода мы или наш партнер-интегратор создаем дорожную карту миграции, анализируем требования, существующую архитектуру приложений в компании и состояние источников данных.

Дальше заказчик или интегратор подготавливает данные к требованиям новой BI, разрабатывает новые сводные дашборды, тестирует и передает заказчику в промышленную эксплуатацию.

На словах все звучит довольно просто, но по факту для такого перехода разработчики вендора или интегратора должны быть профессионалами, потому что ключевая ценность – безопасность данных, их историчность, связи. И наша роль здесь – не только заменить, но и сделать более эффективным применение систем аналитики.

Наш партнер, «А2 Консалтинг», рекомендует всем нашим клиентам добавлять еще один важный промежуточный этап – создание аналитического хранилища данных.

Во-первых, это даст возможность менять аналитическую оболочку по вашим требованиям, во-вторых, ускорит отклик систем и, в-третьих, даст гарантии безопасности данных, которые стекаются из различных источников в единое хранилище.

Одно из ключевых преимуществ такой схемы – это снижение затрат на переход: 70% любого проекта это работа с данными, а этот этап уже будет готов. В итоге – быстрое внедрение BI и снижение затрат.

Этапы внедрения

На первом этапе команда интегратора создает дорожную карту для перехода с существующей платформы на новую (в нашем случае, как вендора, на Modus) и подготавливает описание ETL-процессов и Data Pipeline. Дальше разворачивает систему, интегрирует с источниками, настраивает сценарии трансформации данных и расписание работы ETL-процессов для формирования корпоративного хранилища данных (ClickHouse, PostrgreSQL и т.п.).

После этого наступает этап тестирования и ввода системы в промышленную эксплуатацию. А затем уже - техническая поддержка по проекту, настройка существующих решений и их оптимизация.

Стадии проекта

  • Подготовка источников данных (информационная система, СУБД, 1С, web-сервис и т.п.).

  • Проектирование структуры корпоративного хранилища данных (DWH);

  • Настройка правил получения и обработки данных в DWH в соответствие со сценариями ETL-процессов.

  • Создание и настройка дашбордов с помощью конструктора.

  • Обучение пользователей работе с DWH и созданию своих BI-отчетов.

  • Самостоятельная работа с данными и отчетами в режиме self-service.

  • Развитие аналитических разрезов на основе рекомендаций BI-команд и отделов аналитики (омниканальность, сквозная веб-аналитика, геоаналитика и др.).

  • Интеграция бизнес-аналитики с машинным обучением и прогнозной аналитикой (библиотеки Python).

  • Расширение разрезов Data Lake за счет интеграции с новыми источниками и другими типами хранения данных.

Возможная схема реализации

Архитектура проекта
Архитектура проекта

Результаты:

  • Созданное единое корпоративное хранилище на основе первичных источников;

  • Настроенные аналитические дашборды в BI-платформе.

Типы хранимых данных

Типы данных
Типы данных

Комментарии (9)


  1. Bessnov
    04.08.2023 18:54
    +4

    Вот бы посмотреть про российский BI, что он умеет по сравнению с ушедшими продуктами и теми что доступны в opensource.


    1. Mazaltov Автор
      04.08.2023 18:54

      Есть исследование «Круги Громова», которое каждый год оценивает около 15 российских вендоров. Можно посмотреть их продукты.

      Я понимаю скепсис относительно возможностей, но рекомендую посмотреть на кейсы основных вендоров, которые работают с крупным российским бизнесом, который эти решения не только использует, но и масштабирует внутри себя. И, в общем-то, они не плохо себя показывают. Есть, конечно, и сырые продукты, как на любом рынке.


      1. Bessnov
        04.08.2023 18:54

        Скепсис связан с сумбурной подачей материала в статье. Ну и по ссылке на сайт тоже непонятно что конкретно умеет продукт. Да и не попробовать. Видимо продукт строго коммерческий/закрытый.


        1. Mazaltov Автор
          04.08.2023 18:54

          В материале не было цели рассказать о преимуществах нашего или других российских продуктов - это тема отдельной большой статьи. Речь, скорее о том, нужно ли "подождать" или не нужно, т.к. в enterprise мнения достаточно разные на этот счет.

          Если Вы хотите потестить наш продукт, то можете оставить заявку через сайт - коллеги обязательно помогут с тестовой версией и ответят на вопросы. Вот тут еще коллега писал об ETL, например.


  1. Harliff
    04.08.2023 18:54

    Российский BI (столкнулся недавно) - это немного допиленные и русифицированные OpenSource продукты (Apache SuperSet, Apache NiFi). И это очень хорошо, я считаю.


    1. x67
      04.08.2023 18:54
      +4

      А что тут хорошего? Что сырой опен сорс продают дороже софта корпоративного уровня?

      Нет нет, я не всепропальщик и не сторонник делать все свое и непременно заново. Просто по факту ситуация на отечественном рынке BI напоминает дилемму Эскобара, разве что вариантов больше чем 2.


      1. Mazaltov Автор
        04.08.2023 18:54

        Спасибо за комментарий. Но есть вопрос - а почему Вы решили, что опенсорс дороже и что это всегда только опенсорс?

        Достаточно много у вендоров и проприетарных решений, которые разрабатываются годами. Например, наш продукт появился в 2014 году, и с тех пор было множество релизов.

        По стоимости - да, есть решения, которые могут быть дороже корпоративного софта. Часто это связано с тем, что BI у некоторых вендоров – это часть большой корпоративной платформы, куда входят и другие сервисы.

        Но если мы берем моно-решения уровня BI или BI+ETL, как наше, то это всегда существенно дешевле, чем, например, у западных вендоров, если сложить все факторы. Стоимость BI не ограничивается стоимостью лицензии, есть еще и стоимость владения, куда входит, например, обслуживание системы, доработки и т.п.

        При этом, облачные решения уместно сравнивать с облачными, а on-premise - с on-premise. У них разная архитектура, разная стоимость и немного разная ЦА.


  1. Drunk_Fly
    04.08.2023 18:54

    Я обычный аналитик в маленькой компании, у которой нет миллионов на bi аналитику. И я с 2022 года ищу альтернативу "ушедшему" PowerBi. Альтернатив нет. Ни одна российская Bi платформа не может такого, что может Power Bi даже в бесплатной версии. И чтобы запустить аналитику на power bi не нужно нанимать команду интеграторов. Имеется прозрачный код на DAX и куча литературы.


    1. Mazaltov Автор
      04.08.2023 18:54

      Хорошее замечание. Действительно, таких решений для SMB сейчас нет – мы проводили исследование буквально три месяца назад, и это четко видно. Поэтому мы решили такой облачный BI разработать, в июле уже закончили бета-тесты и сейчас дорабатываем. Вот здесь писали про него. Еще несколько вендоров, кстати, делают то же самое. Возможно, найдете для себя альтернативу.