Однажды на работе мне потребовалось построить дашборд в Power BI, но данные хранились в ClickHouse. В Power BI есть много различных конекторов, но специального для ClickHouse нет. Ниже можно узнать, чем закончилась история)

Что это за звери?

ClickHouse это распределенная система управления базами данных от Яндекс. С каждом годом она становится все популярнее и известнее, даже за пределами стран СНГ. Ее основное преимущество заключается в том, что позволяет выполнять аналитические SQL-запросы в режиме реального времени на структурированных больших данных, а так же ClickHouse использует собственный диалект SQL близкий к стандартному, но содержащий различные расширения: массивы и вложенные структуры данных, специализированные агрегатные функции, функции для работы с URL и.т.д

Power BI это программное обеспечение для бизнес анализа от Microsoft. Главный и огромный плюс Power BI — она умеет распознавать и подключать более чем к 50 источникам данных. Например, xlsx, csv файлы, txt, данные из баз SQL, а так же позволяет делать графические красивые и понятные отчеты. Варианты на любой вкус — гистограммы, диаграммы, таблицы, срезы, карточки и т.д. Потом все это можно сохранить в специальном облачном сервисе онлайн-службы Power BI Service, где к отчету смогут получить доступ ваши коллеги.

Как их подружить?

Для этого будем использовать ODBC (Open Database Connectivity) - это программный интерфейс от Microsoft, который позволяет приложениям получать доступ к данным в системах управления базами данных, используя SQL в качестве стандарта доступа к данным.

  1. Установка ClickHouse ODBC Driver.

    Командой ClickHouse был реализован ODBC для доступа к ClickHouse в качестве источника данных. Последнюю версию можно скачать в их репозитории GitHub.

  2. Создание имени источника данных (DSN).

    Data Source Name связывает различные параметры конфигурации для связи с определенной базой данных. Обычно DSN состоит из следующих параметров: имя источника данных, расположение источника данных, логин и пароль для доступа к данным.

    Для создания наберите в поисковике Windows "ODBC" и откройте приложение.
    У Вас должно появиться такое окно (рис. 1), нужна вкладка Пользовательский DNS.

    Смело нажимаем добавить и получаем экран, как показано ниже (рис. 2).
    Выберите ClickHouse ODBC Driver. Кодировку ANSI или Unicode стоит выбирать исходя из того, какие символы находятся в базе данных. После того как нажмете готово, Вам будет предложено ввести сведения о подключении (те самые параметры конфигурации) (рис.3)

    После заполнения всех полей, все будет готово для использования ClickHouse в качестве источника данных для  Power Bi. Можно переходить к следующему шагу!

  3. Подключение к ClickHouse из Power Bi.

    Давайте откроем Power Bi и перейдем на вкладку получить данные и выберем ODBC (можно найти через поисковик).

    После этого выбираете имя источника данных (DNS) и , если надо, в расширенных параметрах пишет SQL-запрос. Цель достигнута!

Оказывается подключить Power BI к ClickHouse не так уж и сложно, надеюсь Вам была полезна статья и у Вас все получилось.

рис. 1
рис. 1
рис. 2
рис. 2

Комментарии (3)


  1. WondeRu
    23.08.2021 22:18

    Статья вызывает боль и ностальгию, когда 20 лет назад с помощью odbc цеплялся к dbase и paradox )


    1. Evil_Martian
      25.08.2021 17:09
      +1

      О, есть ещё кто-то, кто помнит про paradox)

      Сам цеплялся к paradox из Эксель через odbc


  1. wutas
    25.08.2021 17:09

    Только для автоматического обновления отчетов нужно еще шлюз будет делать (установить приблуду на тачку, где будет стоять этот ODBC драйвер), то есть нужна всегда включенная тачка на винде.