Однажды на работе мне потребовалось построить дашборд в Power BI, но данные хранились в ClickHouse. В Power BI есть много различных конекторов, но специального для ClickHouse нет. Ниже можно узнать, чем закончилась история)
Что это за звери?
ClickHouse это распределенная система управления базами данных от Яндекс. С каждом годом она становится все популярнее и известнее, даже за пределами стран СНГ. Ее основное преимущество заключается в том, что позволяет выполнять аналитические SQL-запросы в режиме реального времени на структурированных больших данных, а так же ClickHouse использует собственный диалект SQL близкий к стандартному, но содержащий различные расширения: массивы и вложенные структуры данных, специализированные агрегатные функции, функции для работы с URL и.т.д
Power BI это программное обеспечение для бизнес анализа от Microsoft. Главный и огромный плюс Power BI — она умеет распознавать и подключать более чем к 50 источникам данных. Например, xlsx, csv файлы, txt, данные из баз SQL, а так же позволяет делать графические красивые и понятные отчеты. Варианты на любой вкус — гистограммы, диаграммы, таблицы, срезы, карточки и т.д. Потом все это можно сохранить в специальном облачном сервисе онлайн-службы Power BI Service, где к отчету смогут получить доступ ваши коллеги.
Как их подружить?
Для этого будем использовать ODBC (Open Database Connectivity) - это программный интерфейс от Microsoft, который позволяет приложениям получать доступ к данным в системах управления базами данных, используя SQL в качестве стандарта доступа к данным.
Установка ClickHouse ODBC Driver.
Командой ClickHouse был реализован ODBC для доступа к ClickHouse в качестве источника данных. Последнюю версию можно скачать в их репозитории GitHub.Создание имени источника данных (DSN).
Data Source Name связывает различные параметры конфигурации для связи с определенной базой данных. Обычно DSN состоит из следующих параметров: имя источника данных, расположение источника данных, логин и пароль для доступа к данным.
Для создания наберите в поисковике Windows "ODBC" и откройте приложение.
У Вас должно появиться такое окно (рис. 1), нужна вкладка Пользовательский DNS.
Смело нажимаем добавить и получаем экран, как показано ниже (рис. 2).
Выберите ClickHouse ODBC Driver. Кодировку ANSI или Unicode стоит выбирать исходя из того, какие символы находятся в базе данных. После того как нажмете готово, Вам будет предложено ввести сведения о подключении (те самые параметры конфигурации) (рис.3)
После заполнения всех полей, все будет готово для использования ClickHouse в качестве источника данных для Power Bi. Можно переходить к следующему шагу!Подключение к ClickHouse из Power Bi.
Давайте откроем Power Bi и перейдем на вкладку получить данные и выберем ODBC (можно найти через поисковик).
После этого выбираете имя источника данных (DNS) и , если надо, в расширенных параметрах пишет SQL-запрос. Цель достигнута!
Оказывается подключить Power BI к ClickHouse не так уж и сложно, надеюсь Вам была полезна статья и у Вас все получилось.
Комментарии (3)
wutas
25.08.2021 17:09Только для автоматического обновления отчетов нужно еще шлюз будет делать (установить приблуду на тачку, где будет стоять этот ODBC драйвер), то есть нужна всегда включенная тачка на винде.
WondeRu
Статья вызывает боль и ностальгию, когда 20 лет назад с помощью odbc цеплялся к dbase и paradox )
Evil_Martian
О, есть ещё кто-то, кто помнит про paradox)
Сам цеплялся к paradox из Эксель через odbc