Привет, Хабр! Мне, наконец, есть чем поделиться с вами. И это результаты практически годового процесса выбора BI-системы из числа российских разработок на замену одной из западных платформ. За это время мне стало очевидно, что примерно 50% действий, которые мы сделали, можно было и не делать, а 20% не стоило делать вовсе. В итоге получилась практически инструкция “как не надо” выбирать себе BI-систему, если вы хотите, чтобы она действительно начала приносить вам пользу ASAP.

Я работаю в секторе логистики, и за прошедшие годы руководство уже привыкло принимать решения на основе данных, которые предоставляла нам платформа Tableau. Было выстроено DWH на базе Postgres, в которое сгружались самые разные данные, а уже для расчетов и визуализации мы настроили их забор на BI-платформу. И все было бы хорошо, но в дальнейшем продлении лицензий официально нам отказали. Срок действия существующих был достаточным, и мы начали выбирать себе новую платформу. Быть может, именно эта расслабленная позиция, что “время еще есть” и стала причиной зря потраченных ресурсов. Но из-за этого я приобрел опыт, который точно пригодится мне в будущем. А может быть пригодится и кому-то из вас, дорогие читатели моего поста.

Русский BI — это особый колорит

Думаю, каждый человек, который сталкивается с необходимостью выбирать российский BI, неизбежно удивляется тому, сколько разного БиАя есть на земле русской! Я даже нашел пост на Хабре, посвященный именно этому вопросу. 

Это просто удивительно, что трем самым популярным на глобальной арене BI-системам противопоставляется две дюжины российских аналогов! Конечно, во всем этом хочется разобраться и сделать правильный (для себя) выбор. Я не буду останавливаться на том вопросе, что взять и полностью заменить ваш старый BI на российский без усилий и потерь не получится — мне кажется, это уже для всех очевидно, хотя некоторые вендоры все-таки заявляют о “простом переходе” в своей рекламе. Но, естественно, хочется убедиться, что выбранная платформа вообще будет работать как вам надо. И тут начинаются те самые нюансы, о которых я хочу вам рассказать. То, что приведено ниже — результат моих собственных находок, а также некоторая компиляция “синяков”, которые собрали наступая на одни и те же грабли коллеги по цеху. 

Тут вас точно обманут

Будут ли вендоры вас обманывать? Точно будут! Этим занимаются все и всегда, включая Microsoft, Google и прочих. Но в сфере BI есть свои специфические моменты, которые оказываются совершенно бесполезны при выборе новой платформы. 

Ответьте на наш опросник

Да, практически каждый вендор (а точнее его отдел продаж) или партнер-интегратор охотно ответит на все вопросы, которые вы им зададите. Конечно, возникает соблазн составить длиннющий опросник, в котором выяснить все факты соответствия платформы вашим ожиданиям. Проблема в том, что сформулировать вопросы так, чтобы вендор не интерпретировал их в свою пользу, практически невозможно. 

Например, вы хотите узнать: “Поддерживает ли ваша платформа Self-service?”. Ну что за вопросы? Конечно же, поддерживает — ответит вам практически любой менеджер по продажам, которому этот опросник попадет в руки. 

Чтобы этого не произошло, нужно уточнять, что именно вы понимаете под Self-service? Например, мы конкретизируем: “Может ли аналитик сам создать дашборд, без помощи программиста?”

Ответ будет: “Да, может!” (правда перед этим нужно потратить N часов на подготовку шаблонов, и работать это все будет только в ситуациях А и Б, причем вы не сможете перенести этот опыт на другой раздел без знания Python — но об этом заполняющий, конечно же, скромно умолчит). 

“А может ли он это сделать без подготовки шаблона программистом?”

И снова ответ “Да, может!” (но только в случае если вы используете простую гистограмму и два ряда данных).

И так с каждым пунктом. Получается, что сформулировать критерии максимально четко в рамках опросника просто не реально. Вы прождете месяц-другой, и вам вернут просто бесполезные листочки, в которых почти везде будет стоять ответ “да” или “ожидается”.

Пилот силами вендора — от лукавого

Естественно, вам хочется попробовать систему на реальной задаче, желательно на своей. Как посмотреть работу BI на ваших данных? Пусть вендор сам вкалывает (или его партнер) и покажет, на что способен. 

Это плохо. Объясню почему. Мы — не слишком крупная компания. И на пилоте у одного из вендоров ему мы были не очень интересны. Как следствие, наш проект “спихнули” партнеру, но не просто какому-то, а новичку. Ребята разбирались, ковырялись и один из них проговорился, что они сами только выясняют, что к чему в системе, и фактически тратят наше время. У меня сразу возник вопрос — а если они ни черта (извините) не знают, как они смогут показать нам потенциал платформы?

Думаю, если вы крупная компания и интересны вендору как якорный заказчик, то может выйти еще хуже. Команда супер-профессионалов из человек 5-10 пару недель без сна и полностью на RedBull будет пилить то-то уникальное с кучей кастомных элементов и получится конфетка, которая “типа это элементарно сделать у нас”. Дальше вы купите лицензии, начнете делать это для других задач… А все не так просто. Нужно много часов и дорогих специалистов, и окажется, что весь цирк совершенно экономически неэффективен, и лучше было взять что-то универсальное из цветника российского BI.

Hе верьте роадмапам

Роадмэп — страшная штука. Она не выполняется никогда и никакими вендорами на 100%. Причин этому целая куча — ведь при смене ситуации любой нормальный руководитель будет пересматривать бэклог и принимать решения о смене приоритетов, если что-то стало важнее другого. 

В разговорах с вендорами меня больше всего порадовали следующие фразы:

№1. “О, да! Это очень важная фича. Она появится очень скоро, подождите буквально месяц/год”. Интересно, а почему же ее не сделали раньше, если она очень важная? Были другие приоритеты? А что, если снова изменятся?

№2. “Это отличное предложение! Мы прямо сейчас добавим его в роадамап. Сделаем в релизе 7.2!” А что, я первый про это спросил? А если при разговоре со следующим клиентом мой запрос выкинут, а другой — достанут. 

№3. “Наш роадмап подробно расписан, на каждый релиз на протяжении года запланированы конкретные возможности”. Ну это вообще очень сложно. Как угадать, сколько уйдет часов разработки, если возникнут сложности? Подобный роадмэп похож на маркетинговую картинку скорее.

№4. “А у нас нет роадмэпа. То есть он есть, но мы его никому не показываем, потому что все время все меняется и мы адаптируемся под клиентов”. Тут вообще без комментариев.

Мне кажется, хорошо, когда есть приоритеты, общие вехи, понимание, куда движется платформа. Излишняя детализация и частности, на мой взгляд, должны вызывать опасения.

Нагрузочное тестирование — особые сложности

На самом деле для российского BI вопрос нагрузки остается открытым. Многие платформы еще “молоды и зелены”, и поэтому точно никто не может сказать, выдержат ли они анализ, скажем, 100 Гб информации в режиме real-time с нагрузкой в параллель для 50 аналитиков? 

Проверить это сложно. Может быть, сделать силами вендора? “Покажите нам, может ли ваша система работать с таким-то объемом данных?” — так и хочется задать вопрос. И мы даже пробовали.

Но когда речь идет о поддержке Больших Данных, неизбежно возникает вопрос: “А насколько больших?” Любой вендор будет трактовать в свою пользу возможность просто запустить DWH на ClickHouse, оптимизировать его силами крутого DBA и потом тянуть данные в BI. Это, насколько я понимаю, можно сделать в любой BI-платформе. Поэтому хочется провести прямо вот реальный тест.

И если вы обращаетесь к вендору, тут возникает два варианта: либо проект будет длиться месяцами, а потом вам покажут какие-то общие варианты нагрузки, которые не гарантируют ничего. Либо высококвалифицированные специалисты покажут, что на тесте все замечательно. А в реальной жизни к каждому дашборду придется приставлять по 2 архитектора и проводить оптимизации, стоящие времени и денег.

Разбираться с нагрузкой, увы, нужно самостоятельно. Правда, если делать это качественно, чтобы можно было доверять результатам — это очень серьезный проект, на месяцы. Делать это даже только для BI-платформ из шортлиста? Мне кажется, такое могут потянуть только очень большие ИТ-команды, которые никуда не торопятся, и у которых полно свободных ресурсов. На мой взгляд, единственный разумный способ — это найти референсы, поговорить с людьми, которые уже делали это на такой же платформе (это возможно на отраслевых мероприятиях, конференциях — проверено). Но вендору тут я бы доверять точно не стал.

Осторожнее

Впрочем, не всегда разочарование будет 100%. Как я выяснил на своей шкуре, есть также вероятность несколько обмануться в ожиданиях. Поэтому я предложил бы проявлять максимальную осторожность.

При общении с вендором/инетгратором 

Ведь с вами будет общаться команда пресейл. А те, кто возьмет на себя реализацию проекта — это совсем другие люди. А техподдержка — вообще третья команда, как правило. 

Конечно, при выборе BI-платформы также хочется получить профессионалов, которые помогут ее поддерживать, развивать и осваивать. Поэтому не хочется купиться на одно, а потом получить другое. 

Позитивное общение лучше подкреплять отзывами тех, кто имел опыт реальных внедрений с данным вендором/интегратором. А качество работы поддержки можно проверить, поиграв в “тайного покупателя”. 

При изучении исследований, рейтингов и сравнений

С одной стороны, без базового обзора вообще никуда — иначе как отличить этих вендоров друг от друга. Но с другой стороны, нужно помнить, что каждый из авторов каким-то образом искажает реальность, у него есть своя оценка, своя мотивация. Да, чем выше репутация у автора рейтинга, тем более релевантным будет рейтинг, но я бы не стал ориентироваться на “Вот это лучшая BI-система”. 

В конечном счете все зависит от ваших задач. И если уж рассматривать результаты какого-либо рейтинга, то лидерами нужно считать ТОП 3 или даже всех ТОП 5. А те рейтинги, в которых отсутствуют лидеры по версии других авторитетных источников (а такие есть — это точно), нужно просто пропускать мимо.

Подделать невозможно

Впрочем, есть и хорошая новость. Существуют факторы, которые невозможно подделать. Одним из них (на который я сначала не обращал внимания — посыпаю голову пеплом), являются…

Профессиональные сообщества

Если они существуют не для галочки, и если там идут обсуждения реальных задач — одни спрашивают, другие делятся опытом, значит продукт живет. Кстати, перечень сообществ активно мониторят в Russian BI Chat. Но будьте осторожны — не смотрите только на цифры. Важно, чтобы в чатах обсуждались актуальные для вас задачи, а не количество спящих членов сообщества.

Контент в открытой форме

Доступность открытого контента — это важный показатель. При этом если речь идет о ролике на YouTube или какой-то статье, обратите также внимание на количество просмотров и на содержательность материала. Если проводить аналогии с западными вендорами, то у всех лидеров — просто невероятное количество материалов по работе с платформой. Это касается, и Qlik, и Tableau, и Power BI.

Если у вендора реально есть накопленная база How-To и количество материалов, необходимых для работы, постоянно растет, это хороший знак. Если же кругом только анонсы, релизы и заявления — то, наоборот, стоит насторожиться. 

Кейсы и истории успеха

Тут, быть может, я сыграю в КО, но наличие кейсов — это реальная метрика. Например, если вендор делает все проекты только в одной крупной монополии, стоит задуматься, подойдет ли вам его продукт? А если кейсов нет вообще, никто из сторонних компаний не говорит о решении, то возникает вопрос — стоит ли тратить время на эту систему.

Кадры

Еще один момент, который невозможно ни скрыть, ни спрятать, ни подменить — это наличие спроса на кадры, а также возможностей эти самые кадры подготовить. Заходите на HH и смотрите, нужны ли специалисты по такой-то платформе? Ищут ли их работодатели? Если нет, то можно задуматься.

С другой стороны, сейчас все вузы так или иначе, начинают переводить свои рельсы на российский BI. И если система действительно смогла заинтересовать академическую среду, и подходящие вам университеты будут готовить кадры под этот BI-продукт, значит, он будет развиваться.

Особые фичи

Да, у некоторых платформ есть какие-то особенности, которые позволяют выделить их среди других для вас лично. И это может быть дополнительный аргументом, если вам важны какие-то фишки. Например, это может быть бесплатность у Yandex DataLens, наличие SmartForms для ввода данных у Visiology, изначальная интеграция с RPA у PIX и так далее. Это будет объективный фактор, но его стоит рассматривать только как дополнительный аргумент. Ведь если система не потянет, например, ваш объем данных, какой в этом всем смысл?

Заключение

Но вернемся к практике. Мы потратили кучу времени на анализ данных, которые были бесполезны и попытки сопоставить фактически маркетинговые уловки разных вендоров. Поэтому, когда вы выбираете BI, важно не погрузиться в непродуктивную работу, которая может съесть кучу времени. На своем опыте я бы дал три совета на эту тему:

  • Нужно ориентироваться на те вещи, которые невозможно подделать

  • Не стоит углубляться в теоретические сравнения — у вас все равно не получится идеального.

  • Попробуйте что-то сделать в системе своими руками/ Поговорите с теми, кто реально делает что-то и кому вы не то чтобы доверяете, а хотя бы не имеете оснований не доверять. Собирая фидбек по системе, берите непредвзятых людей, а не тех, кого привел вендор. Последние могут быть ангажированы просто потому, что сотрудничество с вендором важно для них.

Другими словами, не расходуйте много времени на подготовку, а просто берите подходящую по большинству факторов систему, узнайте о ней от тех, кто уже что-то внедрил, и начинайте что-то делать. Потому что после длительного сравнения и демагогии все равно придется поступить именно так.

P.S. Как вам мемчики из моего любимого фильма? По-моему, очень даже в тему вышли. :)

Комментарии (22)


  1. bisufferer
    30.08.2023 14:27
    +3

    Вот читаю и практически со всем согласен. Мы этот же путь проходили...


    1. miarh
      30.08.2023 14:27
      +2

      А мы проходим прямо сейчас... :)


  1. GromovBI
    30.08.2023 14:27
    +1

    все правда. Почти все в ИТ - страдание. А многое знание - плодит большие страдания. Есс-но все знают наш отчет "BI-круг Громова" - там мы пытаемся все "да" проверить и в целом интересная и картина и методология. Через месяц ждем новый отчет!! ОЧень!


    1. ArturBI Автор
      30.08.2023 14:27
      +2

      Надеюсь, у вас будет прям предметный обзор. Потому что заявления некоторых вендоров о поддержке много чего -- вообще не о чем. :(


  1. aixx
    30.08.2023 14:27
    +1

    вот yandex datalens на первом месте на графике. А что на деле? есть кто ее использует в реальности?


    1. GromovBI
      30.08.2023 14:27
      +1

      позиционирование YD немного другое. Они были бесплатными, есть небольшие ограничения, ориентир на b2c рынок, небольшие внедрения и плотная работа с Yandex Облако. Ими пользуются (судя по чату) - но вероятно не такой кровавый enterprise. Хотя мы например видим интерес от корпораций к YD.


  1. BerdBerd
    30.08.2023 14:27
    +2

    Мне кажется, российский BI уже умер.

    Qlik Sense и другие зарубежные решения - уже не работают с россией,

    Superset и grafana - полная шляпа.

    Российских вменяемых решений я не видел.

    Т.е. российский BI в итоге сведётся или к кубам в Excel, или в лучшем случае - к каким-то самопискам.


    1. mixsture
      30.08.2023 14:27
      +2

      А можете конкретизировать, почему Superset… полная шляпа?


      Мне он вполне импонирует, опенсорс, селф-хостед, кроссплатформенный (в том смысле, что и с мобилок можно пользоваться), немаленькое коммьюнити, довольно развитая система прав доступа (rls, можно часть таблицы видеть роли разрешать). В него завезли довольно удобный датамайнинг — может, это вкусовщина, но мне понравился подход Qlik — когда клик по значению отбирает по нему и текущий дашбоард перестраивается по отобранным данным — и его завезли и в superset.
      Лично я все поглядываю на него, как на относительно недорогой вариант BI, когда из экселя уже выросли.


      1. BerdBerd
        30.08.2023 14:27

        1. Коряво устанавливается. Не работает из коробки. Т.е если его попробовать просто установить стандартными средствами на сервер с тем же Ubuntu - то он не установиться нормально - нужны будут пляски с бубном на неопределённое время. Найти действительно стабильную версию - целое приключение

        2. Функциональность - по сравнению с тем же Qlik Sense - нет примерно трети функционала, без которого неудобно.

        3. Фильтры реализованы коряво.

        4. Просто не красиво выглядит - но это вкусовщина.


    1. ArturBI Автор
      30.08.2023 14:27
      +1

      А вот тут я с вами не соглашусь, несмотря на весь мой пессимизм. Много интересного есть, много что улучлишось. Мой пост в основном о диких методах продаж некоторых (большинства) товарищей. Из русского BI есть достойные системы, просто выбирать надо с фильтрацией этого маркетингового бреда


    1. GromovBI
      30.08.2023 14:27
      +2

      это черезчур кардинально. Наоборот - идет расцвет российского BI. Другой вопрос, что расцвет немного не в смысле разработки своих классных продуктов, а в смысле спроса. Решений много, они реально работают и внедряются. Их качество - конечно другое (по сравнению с мировыми лидерами). но наши программисты лучшие в мире и через несколько лет, если будут деньги и они будут грамотно применены (вот тут вопрос) - решения будут. Но что-то оригинального нет ничего, но думаю появится.


  1. SSukharev
    30.08.2023 14:27
    +2

    И на чем остановились в результате, есть что то вменяемое?


    1. ArturBI Автор
      30.08.2023 14:27
      +1

      Есть ряд вменяемых платформ. Но я принципиально не хочу заниматься тут рекламой. :) Потому что уверен, нужно выбирать разумно - об этом и писал в посте


    1. GromovBI
      30.08.2023 14:27
      +1

      лидеры по продажам на рынке видны. не хочу называть компании, чтобы не было рекламы, но где-то 5-10 российских решений активно покупают российские компании.


      1. SSukharev
        30.08.2023 14:27

        В личку можете написать? s.sukharev@gmail.com


  1. ITN1
    30.08.2023 14:27
    -7

    PIX BI - смотрели? ИМХО - в России стоит смотреть только 3 решения. Два - старых и одно новое. Из нового - безусловный лидер по скорости роста и функциональности только PIX BI


    1. ArturBI Автор
      30.08.2023 14:27
      +5

      Я даже не буду говорить о том, что вы похожи на продажника PIX. )) Но во-первых, скажу, о том, что в России "старых" решений вообще нет - все Qlik, Tableau намного старее (и от того богаче по многим параметрам). Но вот с PIX вы мне наступили прямо на больную мазоль. Такого маркетингового бреда как у них я не встретил нигде. Это система - странный нарост на теле PIX RPA (который про роботизацию). Быть лидером роста очень легко, если ты растешь "с нуля". Эта чепуха еще нигде не внедрялась, она просто совершенно сырая и новая, но они, разумеется "все могут" и каким-то таинственным способом становятся лидерами рейтинга CNEWS (кто его после этого вообще будет читать). Так что НЕТ! Не говорите мне про PIX. Они яркий пример того, о чем я пытался сказать в своем посте!!!


      1. ITN1
        30.08.2023 14:27
        -6

        Мы на PIX мигрировали с Qlik. Знаю еще как минимум двух клиентов уже внедривших. До PIX смотрели Visiology, они были самым адекватным российским вендером, но 2ая версия уже не будет развиваться, а третья пока ни о чем. Prognoz - самый продвинутый по сложной функциональности, но он слишком тяжелый и у нас 500+ пользователей, привыкших к Qlik, поэтому он не вошел в шорт-лист. Я помню как мне интегратор в 2009 рассказывал, что Qlik - это псевдо BI для бедных, а вот Oracle BI Suite EE идеален.


        1. bisufferer
          30.08.2023 14:27
          +3

          Я вот не хочу сейчас этого делать...но ваш профиль выглядит очень странно. Вы зарегистрировались вчера, как только вышел этот пост. И сразу включиилсь в жаркую дискуссию, продвигая PIX. При это не называя имен, "еще два клиента". Все без названий....и, наверняка, внедрили PIX на место Qlik без сучка и задоринки - встал как влитой, да? :) Ну все кому надо, думаю, поняли мою мысль...


          1. ITN1
            30.08.2023 14:27
            -4

            :) Мог бы рассказать, что перешел из группы RusBi Chat по ссылке на статью, захотел прокомментировать и с другого компа не могу под основным аккаунтом войти. Но Ты уже построил такую красивую историю, что не буду ее портить. В октябре мы с нашим кейсом по миграции уже кстати договорились выступить...


    1. GromovBI
      30.08.2023 14:27

      добавлю, что архитектурно есть штук 5 аналогов PIX BI у старых вендоров. PIX конечно имеет агрессивную политику на рынке и хорошую поддержку.


  1. am-habr
    30.08.2023 14:27

    Мне показалось, что статья делает упор на инструменты, которые мало общего имеют со словом BI. Если совсем просто, то BI - это процессы в организации, для их описания вам нужна лишь база данных, вся суть и, соответственно, трудозатраты находятся в модели данных, и тут все эти вендоры вам мало чем помогут.

    Конечно, желательно строить модели с учётом особенностей применяемого инструмента визуализации, но даже если он неизвестен, можно будет потом сделать соответствующие абстракции. Гораздо больше модель и её сложность зависят от источников данных и от особенности работы оперативных систем, чем от иструментов визуализации.