Расскажу я вам о способах визуализации данных, которые помогают бизнесу быстро оценивать информацию и принимать обоснованные решения. Постараюсь объяснить теоретические аспекты и продемонстрировать на практическом примере. Донести плюсы и минусы этих визуализаций.

В работе часто сталкиваюсь с нежеланием включать в дашборды визуализации сложней линейных, столбиковых, круговых диаграмм. Из аргументов приводят непонятность таких визуализаций стейкхолдерами и пользователями продукта и как следствие низкую продуктовую ценность, увеличение затрат на разработку и поддержку. С увеличением затрат соглашусь, но поразмышляю в статье и опровергну низкую продуктовую ценность.

Эти материалы задумывались как раз как подспорье в объяснении позиции на работе. Надеюсь, будут полезны для работы или как ликбез в визуализации данных.

Не бойтесь пузырьков! Как использовать Bubble Chart для бизнеса

Пузырьковая диаграмма (Bubble Chart) — это инструмент, который помогает объединить множество переменных в одном графике, позволяя увидеть важные зависимости и сделать выводы быстрее, чем при анализе таблиц. В этой статье я расскажу, как использовать пузырьковую диаграмму для анализа складского учёта и повышения эффективности бизнес-процессов.

Этот тип диаграмм, позволяет визуализировать три и более переменных одновременно. Две переменные отображаются по осям X и Y, в то время как размер пузырьков представляет третью переменную. Дополнительные данные могут быть переданы через цвет, форму или другие визуальные атрибуты пузырьков, что делает эту диаграмму мощным инструментом для отображения многомерных данных.

Каким образом показываем переменные

  • Положение в пространстве — две переменные отображаются по осям X и Y, определяют положение объекта в двухмерном пространстве.

  • Размер пузырька — отображаем количественную переменную.

  • Часть от целого — выделяем из этой количественной переменной важную часть.

  • Цвет — разделяем объекты на группы.

  • Сегментация — разделение графика на зоны для анализа.

  • Динамика во времени — отслеживание изменений переменных.

Практический пример

Ситуация:
Мы продаём товары на маркетплейсе и используем склады этого маркетплейса. Нам надо визуализировать складской учёт для оптимизации бизнес-процессов.

Товары заказывают из нескольких регионов (кластеров), на которые разделил маркетплейс. Мы стремимся, чтоб наш товар доставляли к покупателю внутри региона. Например, покупатель заказал в Москве и доставляли ему со склада в Москве, где мы предварительно сформировали запасы. Если в Москве вашего товара на складе нет, а есть в другом регионе то товар оттуда перебросят в Москву и доставят покупателю. Казалось бы хорошо, но нет )))

Есть несколько минусов, из очевидных увеличится время доставки, и от товара могут отказаться в пользу более быстрой доставки, конкуренция. Увеличится оплата за логистику. И упадет показатель локальных заказов, который в свою очередь влияет на стоимость логистики и отображения товаров в поиске, во как!

Хочется этого избежать и понимать в каком регионе на товар спрос. Куда делать и увеличивать поставки, чтобы поднять число локальных заказов.

У нас есть такая таблица со статданными

  • Регионы — куда привозится и где продаётся наш товар.

  • Заказы и выкупы — количество заказов и сколько из них выкупили.

  • Процент локальных заказов — это отношение заказов в регионе склада ко всем заказам. Высокий уровень локальных заказов, один из показателей влияющий на отображение товаров в поиске и на стоимость логистики.

  • Коэффициент территориального распределения (КТР) — как раз влияет на логистику, стоимость логистики умножают на этот коэффициент. Чем меньше локальных заказов, тем выше КТР.

  • Количество товара на складе — остатки на текущий момент.

  • Среднее время доставки — оно и есть, считается в днях и часах.

Ну, погнали!

1.
По X откладываем процент локальных заказов, по Y среднее время доставки и распределяем регионы на пересечении координат.

Уже видим склады относительно друг друга. «Москва» лидирует по локальным заказам и скорости доставки. В «Центре» долго доставляют и большую часть привозят из других регионов. 
Уже видим склады относительно друг друга. «Москва» лидирует по локальным заказам и скорости доставки. В «Центре» долго доставляют и большую часть привозят из других регионов. 

Кстати, интересный факт! )
Такой тип графиков, в которых используется только две переменных и не используется объем пузырьков называется Диаграмма рассеяния (Scatter plot) и используется для большого количества точек.

2.
Добавим размер пузырьков для отображения общего числа заказов.

А вот заказывают в «Москве» меньше, а «Сибирь» и «Урал» лидеры.
А вот заказывают в «Москве» меньше, а «Сибирь» и «Урал» лидеры.

3.
Внутри пузырьков отобразим долю выкупленных заказов.

В «Сибири» много заказывают, но не выкупают товары почти в половине случаев.
В «Сибири» много заказывают, но не выкупают товары почти в половине случаев.

4.
И дополним сегментами. Разделим график на три зоны по коэффициенту территориального распределения, когда платим повышенную логистику, обычную и пониженную.

Можно видеть регионы, где требуется повышение локальных заказов, чтоб снизить траты на логистику.
Можно видеть регионы, где требуется повышение локальных заказов, чтоб снизить траты на логистику.

5.
А «Где карта Билли?», как же наши цифры, без цифр то какая аналитика, так давайте добавим тултип.

Проанализировал визуально и посмотрел на цифры в тултипе. Даже более того, добавим точку входа на создание новой доставки в этот регион.
Проанализировал визуально и посмотрел на цифры в тултипе. Даже более того, добавим точку входа на создание новой доставки в этот регион.

По итогу, что можно «прочитать», по этой визуализации:

  1. «Урал» много продаёт товаров, но 80% товаров везут из других регионов. Надо посмотреть, что продают, запланировать увеличение остатков. Этим снизятся затраты на логистику и повысится скорость доставки, что в свою очередь повысит показы в поиске, и заказы. Звучит заморочено, но это так.

  2. В «Сибири» надо понять почему так много отказываются, тратим много денег на логистику, а выкупы подводят.

  3. В «Центре» большое время доставки, можно сократить за счет формирования остатков, 60% туда возят из других регионов.

Но это еще не всё!
Мы смотрели по всем товарам, там допустим и платья разные и отвертки, и блендеры. Данные у нас получаются усреднённые, сразу по всем товарам. С помощью фильтрации такая визуализация станет очень конкретной! Например, отфильтровать по одному артикулу и понять, в какой регион его везти, везти больше, а с какого перебросить в другой.

Корнер-кейсы

Например, когда все параметры очень близки друг к другу будет мешанина на диаграмме. Но это не плохо, а показывает, что наши склады имеют общие проблемы или приемущества и стратегия решений общая для всех.

Как интерфейсно решить по отображению и наслоению, расскажу во второй итерации этой статьи.

Не рассмотрел здесь разделение по цветам и отображение динамики во времени. То же во вторую итерацию.

Плюсы и минусы

Плюсы

  • Главный плюс — мы начинаем видеть картинку целиком, все объекты друг относительно друга в одной системе. Визуализация воспринимается целостно и обрабатываются параллельно, в отличии от таблицы, в которой требуется последовательное чтение и сравнение. При должном опыте быстро передаёт сложную информацию с меньшей когнитивной нагрузкой.

  • Делать поверхностные (в позитивном смысле) выводы быстро, а потом идти разбираться конкретно с цифрами.

  • Многомерная визуализация позволяет отображать три и более переменных на одном графике, что упрощает анализ сложных наборов данных.

  • Возможность добавлять атрибуты (цвет, размер) для передачи дополнительной информации.

Минусы

  • Сложность восприятия — необходимо обучение для «чтения» таких графиков.

  • Проблемы с наслоением — пузырьки могут перекрывать друг друга при близких значениях. Но это решаемо!

  • Создание и поддержка диаграммы требуют ресурсов.

Итог

Что в итоге, была у нас таблица:

А стала такая Пузырьковая диаграмма:

Я не предлагаю уйти от табличного отображения данных, таблица полезна, структурирует информацию.

Пузырьковая диаграмма — мощный инструмент для визуализации сложных данных. Она позволяет увидеть общую картину и определить узкие места в бизнес-процессах. Однако для максимальной эффективности важно дополнять её таблицами и обучать пользователей. Используйте фильтры для анализа отдельных категорий товаров, а также динамические графики для отслеживания изменений во времени.

Спасибо, что уделили время этой статье! Рад, что вы дошли до конца, и надеюсь, что материал был полезен и вдохновляющим. Визуализация данных — это мощный инструмент, который, правильно применённый, может изменить подход к анализу и принятию решений.

Мне важно узнать ваше мнение! Поделитесь в комментариях.
И до встречи в следующей части! ?

Комментарии (4)


  1. klady
    07.12.2024 15:03

    Виталий, спасибо! очень приятно написанная и полезная статья. жду вторую часть


    1. VitTurov Автор
      07.12.2024 15:03

      Спасибо! Уже готовлю


  1. Krokus283
    07.12.2024 15:03

    А что за инструмент для визуализации используется?


    1. VitTurov Автор
      07.12.2024 15:03

      Если конкретно этот пример, то собирал его вручную в figma. Дальше для веба передал бы его фронтенд-разработчику и он бы сделал его используя библиотеку d3js или Apache ECharts

      А если для себя что-то проанализировать то тут множество инструментов:
      - для простоты: Google Sheets, Microsoft Excel – мало что мтожно настроить
      - для интерактивности: Tableau, Flourish, Power BI, rawgraphs.io – можно множество параметров
      - для больших данных и кастомизации: Python (Plotly), R (ggplot2), D3.js – можно множество параметров, и большие объемы данных