Последнее время очень много на рынке говорят про Self Service BI (SS), что это такое и почему каждый пытается сейчас заявить, что он и есть настоящий self service?

Давайте разбираться по порядку. Начнём с определения, далее позволю себе процитировать англоязычного Гартнера.

 Аналитика самообслуживания из словаря Гартнера - это форма бизнес-аналитики (BI), при которой специалистам в данной области бизнеса предоставляется возможность самостоятельно выполнять запросы и генерировать отчеты при номинальной ИТ-поддержке. Аналитика самообслуживания часто характеризуется простыми в использовании инструментами BI с базовыми аналитическими возможностями и базовой моделью данных, которая была упрощена или уменьшена в масштабе для удобства понимания и прямого доступа к данным.

Если говорить простым языком, это такие аналитические платформы, которые дают возможность НЕпрограммисту НЕаналитику собрать свою простую модель данных и построить свой дашборд. При этом сам процесс не должен переходить в режим написания кода, а должен быть интуитивно понятным и максимально удобным. Процесс начального  курса обучения должен занимать 1-2 часа, написание формул должно быть максимально удобным (подсказки, конструкторы, сейчас уже интеграция с gpt), возможность безопасной работы с любого устройства в любой точке мира.

Сама концепция SS правильная, разгрузить собственное ИТ подразделение и дать возможность пользователям исследовать данные, не дожидаясь, когда по их запросу соберут долгожданный отчет, что в итоге приведет к увеличению скорости работы всей системы и появлению дополнительного экономического эффекта. При этом сохранить управляемость и контроль над данными со стороны ИТ службы. Звучит красиво, но все ли так просто на самом деле?

Давайте начнём с этапа подготовки данных. В любой организации существуют транзакционные учетные системы, под которыми находятся разные СУБД. Есть много электронных таблиц и много неструктурированных данных. Чтобы из всего этого множества собрать модель данных нужен специалист и встроенный в платформу  или внешний ETL инструмент. Простой пользователь не сможет решить такую задачу без каких либо дополнительных умных сервисов. Одним из таких инструментов может быть каталог данных, который собирают ИТ специалисты, в который может заходить пользователь и, как в обычном, интернет магазине, может набрать себе в тележку нужные срезы данных для дальнейшей работы с ними. После чего ETL соберёт сам модель данных в простом случае по принципу одинаковые поля с одинаковыми полями. В более сложном варианте сам определит, какие поля по смыслу нужно между собой связать. Видел в этом году несколько отечественных разработок магазинов данных, с нетерпением жду Круга по дата каталогам, может есть еще что то интересное будет. По сути инструмент должен сам определять в источнике потенциально интересные для пользователя данные, структурировать их в каталоге, дополнять описанием. Здесь скоро должны появиться инструменты ИИ в рамках генеративного BI, когда сам пользователь будет говорить системе, что он хочет анализировать, а система будет определять набор данных из каталога или источников, писать нужные скрипты, собирать модель и строить наиболее вероятные визуализации под данные запросы. И это будущее уже не послезавтра, а раньше. 

Конечно есть проблема качества данных, которую тоже нужно решать, но не будем ее детально затрагивать здесь. Я просто еще раз подчеркну, что без качественных данных не будет успеха в проекте. Кстати SS и здесь помогает выявлять некачественные данные, и делают это сами пользователи. Когда данные представлены визуально, некачественные данные иногда очень хорошо видны. Поэтому работа большого числа пользователей в концепции SS позволяет найти некачественные данные на раннем этапе и позволяет принять  необходимые меры. 

После того, как модель данных собрана и подготовлена для пользователей, очень важно наличие в платформе простого и понятого интерфейса по созданию дашборда. Возможности быстрого поиска по модели данных. Инструменты совместной работы с другими пользователями. Чтобы если уж я нашел интересную информацию, то я мог бы быстро ею поделиться и обсудить с коллегами в едином информационном пространстве. Закладки, комментарии, возможность поделиться дашбордом, сделать собственную написанную формулу доступной для других и т. п. Это все элементы аналитики самообслуживания (SS). 

Отдельно хочу похвалить вендоров, которые научили свои платформы дружить с GPT в части написания формул и выпустили эту фичу в своих новых релизах. Знание языков формул не должно быть обязательным требованием для пользователя. Появление таких сервисов внутри платформы делает аналитику еще более доступной. Понятно, что сейчас это простые формулы без сложных запросов с множеством переменных и параметров, но и сложные формулы не за горами. 

Сейчас на Российском рынке нет ни одной полноценной аналитической платформы с функцией SS. Есть элементы аналитики самообслуживания и дорожные карты, где вендора обещают в определенные сроки добавить функциональность в платформу. Гонка только началась. Сразу видны игроки, которые допустили ошибки в своем развитии и пытаются быстро это исправить. Как правило, для них характерны выпуски новых отдельных продуктов под SS или выпуск принципиально новой платформы. В свое время Qlik кстати тоже пошел по пути выпуска платформы на новой технологии. Здесь главное насколько быстро и безболезненно можно будет перейти с одной платформы на другую, и как быстро новая платформа нарастит всю необходимую функциональность. Мое мнение платформа должна быть единой, никаких эко систем в рамках аналитической платформы быть не должно, никаких новых языков и синтаксисов придумывать не нужно. Или это все это должно быть бесшовным и незаметным для глаза пользователя и конечно же не должно потреблять отдельные мощности. А то железа не хватит, а оно сегодня в дефиците даже у крупного бизнеса!

Отдельно про open source. Коротко и емко. Это не про self service от слова  совсем! Не могу представить пользователя, который на апаче, например, взял и к существующей модели сам прикрутил какую то свою электронную таблицу. Или собрал из нескольких плоских таблиц свою модель данных.

В заключение хочу дать собственную рекомендацию по тесту SS аналитики. Возьмите несколько плоских таблиц с понятными для вас данными, попробуйте их интуитивно собрать в инструменте. Обратите внимание насколько платформа позволяет это делать сама. Если этап сборки прошли успешно, попробуйте в несколько шагов создать свою первую визуализацию. Обратите внимание насколько платформа  сопровождает вас на всем пути идеями и подсказками. Объекты должны строится в 3-4 шага не более. Если это было сложно посмотрите курсы от вендора повторите путь. Самое первое впечатление без начального обучения самое правильное. Мы же в России инструкции не читаем! А если в платформу кто то из вендоров додумался встроить мастер или советника для построения первого дашборда, тому отдельный респект!

Тестируйте, пробуйте сами, требуйте пилоты! И помните сделать дашборд можно на любой платформе, но не везде он будет self service!

Комментарии (4)


  1. fpga421
    17.10.2023 06:37

    Есть ли импортозамещенные аналоги у Qlikview Desktop?
    Для меня, как частного лица, чтобы без покупки лицензии была хоть какая-то self-service BI, как это было у Qlik ?


    1. DataBanksy Автор
      17.10.2023 06:37

      Пока я не видел на рынке именно десктопную версию у кого либо. Ходят слухи что PIX, которые кстати неплохо копируют Qlik подумывают о такой штуке. Но, на мой взгляд это довольно проблематично для всех отечественных BI, у большинства под капотом стоит какой нибудь кликхаус и т п это точно не будет тот самый экзешник от QlikTech. Думаю что облачную версию увидем раньше. А для простых задач есть Yandex DL.


  1. stkonung
    17.10.2023 06:37

    А как вы решали проблемы с безопасностью?

    Или их небыло, потому что предполагается, что каждый бизнес пользователь имеет право доступа ко всем данным, которые доступны в BI?


    1. DataBanksy Автор
      17.10.2023 06:37

      Ну это же вопрос к каждой отдельно взятой платформе. Для любой BI системы должны внутри существовать отдельная ролевая модель, разграничение прав доступа на уровне данных в дашборде. Это стандартные функции из коробки должны быть. А давать доступ всем ко всему или каждому свое, это уже решается в зависимости от задачи и требований к итоговому дашборду.