Бизнес генерирует огромное количество информации, которое включает в себя данные о клиентах, транзакциях, конкурентах, процессах и операциях, данные из социальных сетей и онлайн-платформ, сенсоров, IoT и многие другие. Все они представлены в разных форматах: электронных таблицах, текстах, изображениях, видео.
Анализ данных - мощный инструмент для принятия обоснованных и эффективных решений в бизнесе, но интерпретация данных в исходном виде может быть сложной:
Большие объемы данных перегружают информацией, рост идет быстрее, чем их успевают обрабатывать
Данные хранятся в корпоративных источниках с установленной системой доступов, что ограничивает свободу работы с ними
Переключение между разными форматами затрудняет восприятие информации
Для полноты картины необходим контекст и связи между разрозненными данными
Не вся информация одинаково ценна для анализа, выделить ключевую вручную сложно
Анализ часто требует специализированных навыков и инструментов, математические модели и алгоритмы не интуитивны для большинства людей
Для того чтобы данные были понятны даже для неподготовленного человека, их можно представить в виде визуализаций: графиков, диаграмм, таблиц, карт.
В статье рассказываем, как создавать эффективные визуализации, которые раскроют природу данных и помогут выявить скрытые в них закономерности.
Что такое хорошая визуализация?
Согласно исследованиям Калифорнийского университета в области вербального и невербального общения зрительное восприятие информации обычно составляет около 90%.
Правильно подобранные визуальные образы воспринимаются более однозначно, чем текст, что делает визуализации ключевыми для понимания и запоминания информации.
Хорошая визуализация учитывает особенности данных, на которых она строится, чтобы сделать принятие бизнес-решений максимально наглядным и интуитивным.
Путем использования различных цветов, форм и размеров, визуализация поможет выделить ключевую информацию, что упрощает ее анализ.
Если вы корректно используете визуализации:
Большой объем данных преобразовывается в лаконичную, доступную для всех форму
Графики и диаграммы вызывают интерес, их хочется изучать и задавать вопросы
Данные представлены в соответствии с основной целью визуализации и потребностями пользователей, которые их исследуют
В данных возникают связи и формируется новый смысл
Информация становится живой, даже если тема сама по себе сложна для восприятия
Обратите внимание на примеры ниже. На обоих из них - информация о 7560 спутниках, которые в настоящее время вращаются вокруг Земли.
Как создать хорошие визуализации?
Для того, чтобы создать визуализацию, которая привлечет внимание пользователя и облегчит анализ, стоит придерживаться ряда рекомендаций:
Выбрать диаграмму, правильно отображающую конкретный тип данных
Использовать цвета так, чтобы они помогали пользователю быстрее оценить ключевые показатели
Расставить акценты в формах, размерах, с помощью насыщенности цветов, которые подчеркнут самое важное
Выбрать такой дизайн визуализаций, который не будет препятствовать пониманию связи в данных или искажать их
Ниже разберем каждую из рекомендаций подробнее.
Выбирайте диаграмму в соответствии с задачей
Визуализации создаются не просто для красоты, как правило, у каждого набора данных существует минимум 2–3 варианта визуализации для ответа на разные бизнес-запросы.
Графики и диаграммы помогают быстро обозначить ключевые тренды или аномалии. Таблицы используются для точного отображения конкретных числовых значений.
Самая известная схема выбора визуализаций (чарт-чузер) была предложена еще в 2006 году Эндрю В. Абела, создателем методики разработки презентаций Extreme Presentation™ Method. Она основана на разделении диаграмм по видам анализа (сравнение, распределение, соотношение, структура), количеству категорий, переменных и периодов.
Помимо схемы Абела существуют и другие чарт-чузеры, которые могут быть хорошей подсказкой для выбора подходящей визуализации.
Рассмотрим некоторые типы диаграмм по основным категориям, которые чаще всего используются для визуализации данных.
1. Сравнение
Сходство и различие между переменными в один момент времени. Например, сравнение результатов маркетинговых кампаний, план-факт продаж.
Линейчатая диаграмма (Bar Chart)
Также известна как столбчатая или полосчатая диаграмма, отображающая информацию в виде баров (столбцов). Длина столбца – значение параметра
Линейчатая диаграмма с группировкой
Используется для сравнения двух или нескольких наборов данных. Каждый набор данных выделен своим цветом.
Вертикальная диаграмма Водопад
Используется для отображения изменений значения относительно предыдущего. Верхний – исходное значение, нижний – итоговое.
Лолипоп
Значение параметра отображено длиной линий, на верхушке каждой добавлен кружок. Вид диаграммы позволяет добавлять сноски и пояснения.
2. Распределение
Деление на категории, частотность в пределах интервала, группировка по признаку. Например, распределение населения по возрастам, продаж по регионам, процентное соотношение успешных и провальных событий.
Гистограмма
Визуализирует распределение данных в рамках непрерывного интервала или ограниченного периода времени.
Боксплот
Диаграмма размаха, «ящик с усами». Показывает статистические показатели: медиану, верхний и нижний квартили, минимумы и максимумы, выбросы.
Точечная карта
Точечная карта плотности распределения. Отображает географические паттерны или распределение данных по географическим регионам.
График плотности
Демонстрирует распределение данных за интервал времени. Отображает гладкое распределение за счет сглаживания изменений параметров.
3. Структура
Соотношение части к целому, состав, деление категорий на подкатегории и их отношение к общей величине. Например, доля филиалов в общей выручке, влияние увеличения продаж и сокращения расходов на рост прибыли.
Круговая диаграмма (Pie chart)
Отражает соотношение категорий к целому при помощи сегментов окружности. Вся окружность означает общую сумму, 100%.
Линейчатая диаграмма с накоплением
Показывает, как крупная категория делится на более мелкие, и какое отношение имеет каждая часть в рамках общей величины.
Горизонтальная диаграмма Водопад
Показывает процентное соотношение подкатегорий и общего показателя, изменение частей от целого во времени.
Древовидная карта (Treemap)
Отображает иерархические данные, полезна при необходимости визуализировать большие объемы данных.
4. Корреляция
Взаимосвязь между переменными, которую можно описать как "когда изменяется переменная X, изменяется и переменная Y ". Например, сегментация клиентов по частоте обращений, возрасту и покупательской способности.
Пузырьковая диаграмма
Отображает трехмерные данные в двумерном пространстве. Размер каждого пузырька является третьим измерением.
Диаграмма рассеяния
Демонстрирует, существуют ли связи между двумя переменными. Степень взаимосвязи определяется плотностью расположения точек.
Зеркальная линейчатая диаграмма
Два набора данных располагаются по разным сторонам оси для удобства сравнения и поиска взаимосвязей.
Тепловая карта
Удобна для демонстрации вариативности переменных, выявления паттернов, отображения взаимосвязей между переменными.
Правильно выбранная визуализация помогает представить данные более понятно и наглядно, обнаружить скрытые тренды или аномалии в данных.
Правильно используйте цвета
Цветовая палитра для визуализаций способна как помочь пользователю быстрее оценить ключевые показатели, так и создать хаос в данных.
Например, использование слишком ярких и насыщенных цветов может создать визуальный шум и отвлечь от самой информации. В то же время, слишком блеклые оттенки сливаются друг с другом и не позволят сконцентрироваться на разнице показателей.
Рассказываем о нескольких приемах использования цвета, которые помогут сделать ваши визуализации лучше:
1. Цветовая палитра зависит от типа данных
Существует три основных типа цветовых палитр для визуализаций: категориальная (качественная), последовательная и расходящаяся.
Категориальная (качественная) палитра
Палитра состоит из разных цветов, которые не имеют упорядоченного или градиентного значения, с близкой яркостью и насыщенностью.
Категориальная цветовая палитра предназначена для представления категорий или классов данных без какого-либо внутреннего порядка или значений между категориями.
Она используется для отображения дискретных категорий, таких как различные группы товаров, типы событий, категории пользователей и т. д.
Последовательная палитра
Градиент из одного цвета разной насыщенности.
Палитру используют для данных, где присутствует упорядоченная структура, явная прогрессия или различные уровни значений.
Например, такая палитра идеально подходит для отображения температурных карт, рейтингов, показателей продаж, или любых данных, которые имеют явное распределение от низких к высоким значениям или наоборот.
Расходящаяся палитра
Комбинация последовательных палитр с разрывом, диапазон значений с определенной серединой, от которой цвета уходят в разные направления.
Расходящаяся палитра подходит для визуализации данных, которые имеют явное различие между низкими и высокими значениями, с выделенной областью средних значений или уровнем концентрации.
Это может быть полезно при отображении данных о средней температуре, статистике доходов или других показателях, где центральное значение играет важную роль.
Выбор цветовой палитры также зависит от контекста визуализации и эстетических предпочтений. Например, для корпоративных отчетов можно использовать цвета, соответствующие фирменному стилю.
2. Чем меньше цветов, тем проще найти их на дашборде
Для создания визуализаций лучше использовать не больше 5–6 цветов. Диаграмма будет выглядеть более профессионально, если использовать в ней только несколько оттенков и комплементарных цветов.
Во избежание хаоса в цветах рекомендуется стандартизировать несколько цветовых палитр, каждая из которых предназначена для определенных целей: несколько темных цветов, несколько светлых и нейтральные оттенки.
В случаях, когда необходимо использовать большее количество цветов, лучше заменить их оттенками серого или объединить несколько не ключевых категорий данных в одну.
3. Разные цвета для разных диаграмм
Пастельные, ненасыщенные цвета лучше подходят для крупных элементов визуализации. Яркие, насыщенные – для мелких, в том числе, надписей, тонких линий.
Для корректного отображения маленьких элементов можно или прибавить насыщенность и яркость цветовой палитры в конкретной диаграмме, или попробовать увеличить масштаб элементов/ сделать линии толще.
Для компонентов таблиц и графиков, не относящихся к данным, стоит использовать нейтральные цвета, довольно контрастные, но, в то же время, не отвлекающие от данных.
Для обозначения осей и границ диаграмм лучше использовать тонкие, насыщенные серые линии, для фона универсальный вариант – белый.
4. Не знаете, какой цвет выбрать - используйте красный и синий
Лиза Шарлотта Мут, руководитель отдела коммуникаций издания Datawrapper, в одной из статей о лучших практиках визуализации, предлагает цвета, которые чаще всего используют дизайнеры визуализаций: оттенки желтого/оранжевого/красного в сочетании с оттенками синего.
Эти цвета универсальны для любых видов данных и подходят под любые тематики.
Желтый, оранжевый и красный сочетаются, но, при этом, воспринимаются как разные цвета, что необходимо для отображения разных значений. Синий цвет всегда воспринимается приятно и даже профессионально.
К тому же контраст этих цветов доступен даже тем, кто страдает дальтонизмом и другими особенностями восприятия.
Как привлечь внимание к ключевым показателям?
Расставьте акценты
Часть информации опознается человеком на уровне бессознательного, подпорогового восприятия – когда действие раздражителя на органы чувств возникло, а порог восприятия, сознательного опознания еще не пройден.
При визуализации важны акценты в виде направления, формы, размера, длины и ширины линии, цвета или насыщенности, чтобы информация, которая имеет наибольшую значимость или релевантность (наиболее заметный стимул), отобралась для дальнейшего и более полного анализа путем сознательной обработки.
При помощи таких акцентов можно визуализировать ключевую информацию и помочь пользователю интерпретировать ее без усилий.
На примере ниже мы можем наблюдать, как использование разной длины столбцов в диаграмме автоматически направляет наше внимание на город с большим объемом продаж. Этот эффект еще больше усиливается за счет использования цвета. Именно на результатах продаж в этом городе можно сосредоточиться, изучая факторы повышения эффективности.
Разные визуальные акценты позволяют анализировать информацию с разной точностью.
Например, стандартная гистограмма, где столбцы расположены на одной шкале, позволяет оценивать конкретные значения и делать более точные выводы, а пузырьки разного размера или цвета на пузырьковой диаграмме дают лишь общие представления о разнице показателей.
Не перегружайте
Визуализация должна помочь пользователю сравнить два или более показателей друг с другом. Дизайн визуализаций не должен препятствовать пониманию связи в данных или искажать данные.
Излишнее количество элементов, цветов, попытки уместить в одну многоярусную диаграмму все имеющиеся данные приведет к тому, что визуальный ряд будет перегружен.
Если необходимо визуализировать сразу несколько типов данных и категорий, лучше разделить эту информацию на несколько диаграмм и графиков.
Как расположить визуализации на дашборде?
В системах бизнес-аналитики, цель которых – скоррелировать данные и представить их в удобном для пользователя виде, различные визуализации объединены в информационные панели – дашборды.
Некоторые правила, которые сделают ваш дашборд понятным для пользователя:
Элементы, добавленные в дашборд, должны быть логически объединены и помогать пользователю решить конкретную бизнес-задачу, например, повысить эффективность продаж
Информация должна помещаться на одном экране без необходимости скроллинга (обычно, не больше 4–7 визуализаций)
Масштаб визуализации определяется степенью ее важности, порядок расположения – паттерном восприятия пользователей
Для верстки дашбордов используют классические приёмы дизайна.
Стандартная европейская схема считывания информации – Z-образное направление - слева направо и сверху вниз.
Эту схему можно использовать для привлечения внимания пользователя к самым важным элементам, когда простота восприятия визуализаций является основной целью.
Согласно Z-паттерну, стоит располагать диаграммы с ключевыми KPI в левом верхнем углу.
Лидеры в сфере пользовательского опыта Nielsen Norman Group считают, что для быстрого считывания тяжелых блоков контента больше подойдет F-паттерн.
При такой схеме восприятия пользователь сканирует горизонтальную линию в верхней части страницы, затем спускается ниже и сканирует более короткую горизонтальную линию контента. После считывание осуществляется вниз по вертикали.
Этот паттерн свидетельствует о том, что контент, размещенный в верхней части страницы, обычно привлекает больше внимания, чем содержимое, размещенное дальше по горизонтали.
В некоторых странах Ближнего Востока и Южной Азии читают и пишут справа налево. При дизайне дашбордов для этих стран следует учитывать эти особенности восприятия.
Более подробно тему создания дашбордов мы раскроем в следующих статьях. Расскажем о разработке ТЗ для дашборда, прототипировании, методологии D.A.R. (Dashboard, Analysis, Reporting).
Комментарии (6)
zabanen2
22.05.2024 11:43+1плюсы: такая статья была бы хороша в 2005-м
минусы: в статье противоречия, статья про графики в вакууме.
самого главного нет - размера шрифта. даже ваши "красивые" графики с мелким шрифтом при приближении выдают 8/10 шакалов
правильно раскрашенная экселька может выдать результаты не хуже, чем графики
Yukr
Будет неплохо затронуть отображение визуализации на тёмной теме/фоне, особенно при переключении темы пользователем.