image

Бизнесу нужны данные, чтобы эффективно работать. Не важно, какой инструмент вы используете для анализа, главное, чтобы он экономил ваше время и повышал производительность.

Современные технологии делают цифровые процессы извлечения полезной информации и принятия решений доступными для всех компаний, независимо от их специализации или уровня подготовки сотрудников.

Сегодня расскажем о некоторых открытых (и бесплатных) инструментах визуализации данных. Мы отобрали их по количеству звезд на GitHub. Хотя они не так известны, как Tableau Public или PowerBI, эти приложения позволяют легко создавать диаграммы и дашборды, фокусируясь не на инструментах, а на данных и их бизнес-ценности.

А еще напомним, что данные практически любого объема и формата вы можете хранить в облаке. Сейчас на объектное хранилище MWS действует скидка 50%.



Apache Superset


Лицензия Apache-2.0 / 59,7 тыс. звезд



image
Источник изображения: Superset

Одна из главных альтернатив Power BI и Tableau. Платформа поддерживает множество типов графиков и диаграмм (более 50 типов визуализаций), интегрируется с десятками источниками данных, позволяет формировать сложные SQL-запросы. Интеграция с БД дает возможность визуализировать данные из разных хранилищ в едином пространстве.

SuperSet предлагает три вида пользовательских ролей, каждая из которых имеет свои права и уровень доступа к системе. Платформа интегрируется с LDAP, OAuth, другими механизмами аутентификации и сервисами; поддерживает создание кастомных визуализаций и метрик. За многочисленные нововведения и улучшения отвечает активное сообщество разработчиков (в том числе в России).

Superset — это мощный инструмент с интуитивным понятным интерфейсом. Но нельзя сказать, что развернуть Superset просто и быстро. Для этого понадобится опытный DevOps-специалист, даже в случае установки через docker. Пользователи Хабра по крупицам собрали гайд, с помощью которого можно загрузить и настроить все необходимые системы.

Metabase


Лицензия AGPL / 37 тыс. звезд



image
Источник изображения: Metabase

Metabase — это простая платформа для визуализации данных, которая не требует глубоких технических знаний. Процесс установки занимает всего пять минут, и любой сотрудник может использовать Metabase для получения ответов.

Metabase предлагает интуитивно понятный веб-интерфейс для создания запросов и визуализации данных с минимальными усилиями. Пользователи могут легко формулировать вопросы к базе данных без написания SQL-запросов, используя интерактивный конструктор. Также предусмотрена возможность написания кастомных SQL-запросов для более сложного анализа.

Инструмент автоматически генерирует разнообразные визуализации (графики, диаграммы, таблицы), которые могут быть объединены в настраиваемые дашборды. Платформа обладает продвинутыми функциями управления доступом. Гибкие настройки и возможность автоматической отправки почтовых сообщений по расписанию делают Metabase удобным инструментом для генерации регулярной отчетности.

Программа поддерживает интеграцию с облачными хранилищами и популярными источниками данных, включая реляционные БД. Кросс-платформенная совместимость позволяет размещать Metabase как on-premise, так и в облачной среде.

Redash


Лицензия BSD-2-Clause / 25,2 тыс. звезд



image
Источник изображения: Redash

Основная цель Redash, как и у Metabase, заключается в облегчении доступа аналитиков и других пользователей к данным. Инструмент включает в себя богатый набор функций для создания, управления и совместного использования различных дашбордов для разных команд.

Через программу можно подключиться к любому удобному источнику данных. Пользователи могут писать SQL-запросы непосредственно в редакторе или использовать конструктор. Redash также поддерживает функции автоматической отправки отчетов и уведомлений по расписанию.

Быстрая настройка и минимальные требования к техническим знаниям делают Redash популярным среди МСБ.

Однако главный недостаток Redash — это небольшой выбор графиков, которые не такие сложные и красивые, как в Metabase или Superset.

TimelineJS


Лицензия MPL 2.0 / 8,9 тыс. звезд



image
Источник изображения: TimelineJS

С помощью TimelineJS вы можете создать визуально насыщенные интерактивные временные шкалы. Чтобы создать шкалу, достаточно заполнить шаблон в таблице Google, указав даты и заголовки, а также добавив описания и медиафайлы. После этого данные автоматически интегрируются в хронологический формат, который можно настроить по своему усмотрению.

Интерактивные элементы в TimelineJS позволяют добавлять изображения, видео, аудио и ссылки, что значительно обогащает визуальные представления и делает их более информативными. Готовые временные шкалы легко встраиваются в сайты и блоги с помощью простого кода.

Flot


Лицензия MIT / 5,9 тыс. звезд



image
Источник изображения: Flot

JavaScript-библиотека для jQuery, позволяющая создавать графики и диаграммы. Это одна из старейших диаграммных библиотек. Она легко интегрируется в веб-приложения и предлагает широкие возможности для персонализации и стилизации графиков. Пользователи могут изменять цвета, добавлять метки, а также настраивать оси и легенды графиков в соответствии с их требованиями. Flot обрабатывает большие объемы данных с высокой производительностью.

Дополнительный плюс Flot — его расширяемость. В сообществе разработчиков создано множество плагинов, которые позволяют значительно расширить базовый функционал, включая возможности зумирования и панорамирования графиков, добавления аннотаций и многое другое.

Gephi


Лицензия GPL 3.0 / 5,7 тыс. звезд



image
Источник изображения: Gephi

Мощный инструмент для визуализации и анализа графов и сетей. Gephi создан для работы с большими наборами данных, обеспечивая эффективное отображение сложных структур и динамических систем.

Gephi предлагает множество функций для обработки и управления графами. Интуитивно понятный интерфейс предоставляет широкие возможности для интерактивной работы. Пользователи могут легко фильтровать, кластеризовать и раскрашивать узлы и ребра, а также применять различные алгоритмы для визуализации. Gephi позволяет адаптировать и стилизовать графы в соответствии с потребностями пользователей.

Инструмент поддерживает различные виды сетей, включая социальные, биологические и текстовые, что делает его универсальным решением для исследователей и аналитиков.

Dygraphs


Лицензия MIT / 3,2 тыс. звезд



image
Источник изображения: Dygraphs

Еще одна библиотека JavaScript, с помощью которой можно создавать масштабируемые и динамические графики, эффективно работающие с большими наборами данных.

Основные преимущества Dygraphs: высокая производительность и широкие возможности настройки. Пользователи могут легко кастомизировать внешний вид графиков, изменять типы осей, добавлять аннотации, работать с различными форматами данных. Библиотека поддерживает панорамирование и масштабирование.

Легкая интеграция с веб-приложениями и возможность использования в комбинации с другими JavaScript-библиотеками позволяют создавать практически любые интерактивные масштабируемые диаграммы.

Charted


Лицензия MIT / 2,8 тыс. звезд



image
Источник изображения: Charted

Charted помогает создавать красивые диаграммы. Этот инструмент фокусируется на минимализме, удобстве использования и эстетичном оформлении данных.

Входные данные могут быть представлены в виде ссылок на CSV-файлы, Google Таблицы или Dropbox. Charted не предоставляет обширных опций кастомизации и сложных аналитических функций, но поддерживает базовые возможности для быстрого анализа и презентации данных.

VTK


Лицензия BSD-3-Clause / 2,5 тыс. звезд



image
Источник изображения: VTK

VTK (The Visualization Toolkit) используется для 3D-графики, моделирования данных, построения 2D-графиков, обработки изображений и научной визуализации. Он включает множество продвинутых алгоритмов (например, реконструкцию поверхности, неявное моделирование, прореживание) и методов рендеринга (например, аппаратно-ускоренный объемный рендеринг, контроль уровня детализации).

Библиотека поддерживает множество форматов данных и предоставляет возможности для взаимодействия с различными ЯП, включая C++, Python и Java. VTK обладает высокой производительностью и использует оптимизированные алгоритмы для обработки больших объемов данных.

С момента релиза в 1994 году VTK применяется для научных исследований, инженерии и медицины благодаря своей способности быстро и точно обрабатывать сложные данные.

RAWGraphs


Лицензия Apache 2.0 / 329 звезд



image
Источник изображения: RAWGraphs

RAWGraphs упрощает процесс создания сложных графиков и диаграмм для пользователей без глубоких знаний программирования. Инструмент легко интегрируется в рабочий процесс дизайнеров и аналитиков, занимая нишу между приложениями для работы с электронными таблицами и редакторами векторной графики. Достаточно добавить необработанные данные в RAWGraphs и выбрать подходящую визуальную модель.

RAWGraphs поддерживает широкий спектр форматов данных и множество шаблонов графиков. Инструмент обладает широкими возможностями настройки и расширения. Можно добавлять в систему новые диаграммы, обладая базовыми знаниями D3.js. Визуализации легко редактируются с помощью приложений для векторной графики или могут быть напрямую встроены в веб-страницы.

Ключевой недостаток RAWGraphs — визуализации данных не являются интерактивными.

Palladio


Лицензия BSD-3-Clause / 168 звезд



image
Источник изображения: Palladio

Интерактивный инструмент для визуализации сложных наборов данных, разработанный в Стэнфордском университете. Основное преимущество Palladio — работа с географическими, временными и сетевыми данными.

С помощью Palladio можно создать четыре типа визуализаций:
  • просмотр карты — преобразует данные координат в точки на карте;
  • представление графика — позволяет визуализировать взаимосвязи между любыми двумя измерениями ваших данных;
  • представление списка — размеры данных можно организовать для создания настраиваемых списков;
  • просмотр галереи — данные могут отображаться в виде сетки для быстрого ознакомления.

Любой набор информации, который может быть представлен в формате таблицы, будет работать с Palladio. Визуализации можно экспортировать в различные форматы, включая SVG и PNG.

Заключение


В такой статье нельзя не упомянуть о нескольких других популярных инструментах визуализации. Grafana может похвастаться одним из самых активных сообществ разработчиков и 61 тыс. звезд на GitHub. Однако у этого инструмента недавно сменили лицензию с Apache 2.0 на AGPL 3.0. Подробности мы рассказывали в статье.

Kibana — инструмент на основе JavaScript, используемый для визуализации данных Elasticsearch, а также для навигации по Elastic Stack. В 2021 году компания Elastic сменила для Kibana лицензию на SSPL (Server Side Public License).

Кроме того, аналитикам значительно облегчит жизнь возможность использовать централизованную среду для хранения данных из различных источников. Объектное хранилище MWS хорошо подходит для неструктурированных данных, расширяя возможности BI-решений. Масштабируемость и высокая доступность хранилища позволяет легко управлять растущими объемами данных, проводить детализированный анализ и улучшать качество принимаемых бизнес-решений.

Комментарии (4)


  1. Billander
    11.06.2024 12:13
    +3

    Datalens еще недавно выложили...


    1. mvakhmenin
      11.06.2024 12:13

      1.2к звезд на GitHub, могли бы и упомянуть

      По сравнению с Metabase у них, по-моему, гораздо более логичный процесс построения дашбордов


  1. Ver_P
    11.06.2024 12:13
    +3

    Для визуализации используем plotly dash. Можно сделать всё что угодно. В связке с chatgpt проще работать чем с любой из систем.


    1. mvakhmenin
      11.06.2024 12:13

      plotly dash, конечно, больше всех возможностей предоставляет, но надо чтобы BI-аналитики могли хорошо в Python, таких сложно найти, я думаю (или дорого :о)