Привет, Хабр! На связи Кирилл Мазуров, продуктовый аналитик в Garage Eight. В этой статье поделюсь приемами, которые помогут сделать ваши графики и таблицы понятными и логичными.

Как и ребята из команды дизайна, я регулярно ищу классные фреймворки и полезные материалы для работы. Когда-то я проходил онлайн-курс по Tableau от DataYoga, и организаторы поделились гайдом по визуализации данных. В нем почти 50 советов о том, как должны выглядеть графики, когда стоит использовать таблицы и почему вариант с девушкой, как на обложке этой статьи, подойдет для медиа, а не для бизнеса. Заметил, что материал никогда не публиковался на Хабре, и решил это исправить.
Авторы гайда поддержали идею, поэтому статье быть: делюсь несколькими приемами, которые позволяют мне создавать понятные диаграммы, и пятью самыми интересными советами от DataYoga!
Команда DataYoga написала крутейшую книгу, в которой собрала все материалы по выбору и способам визуализации данных. Все эти классные визуалы, которые используются в статье, были позаимствованы у них. Рекомендую скачать и изучить, это бесплатно ?
Спросите себя: «Зачем и как?»
Задать себе базовые вопросы нужно еще до того, как что-то визуализировать. Лично мне ответы на них очень помогают. С их помощью легче выбрать нужные типы графиков и формат их представления — всё это шаги к созданию понятных диаграмм. Вопросы такие:
Что я хочу показать? Это будет тренд, распределение, сравнение, зависимости или что-то другое?
Кто будет смотреть график? Аналитики, бизнес-менеджеры или широкая аудитория?
Какую информацию нужно донести? Ключевые выводы, аномалии или прогнозы?
Когда ответы найдены, проверьте, нужна ли нормализация значений. Это необязательный шаг, но он важен в некоторых случаях:
Когда данные находятся в разных масштабах. Например, доход в миллионах и количество клиентов в тысячах, нормализация поможет сделать показатели сопоставимыми.
При построении тепловых карт и кластерных анализов нормализация (например, Min-Max или Z-Score) помогает выявить закономерности.
В сравнительных графиках, особенно при использовании цветовой градации, нормализованные значения могут улучшить восприятие.
Продумайте, как можно улучшить вашу визуализацию. Что можно сделать:
Добавляйте анимации, если нужно показать изменение во времени.
Используйте интерактивность с помощью Plotly или Dash.
Пишите аннотации вместо перегруженных подписей.
Это базовые советы от меня, а теперь перейдем к примерам от DataYoga!
Иногда можно не визуализировать
Ключевой вопрос, который нужно задать себе перед тем, как строить графики: «А точно ли нужна визуализация?» Например, странно будет сравнивать рост или возраст конкретных людей с помощью столбчатой диаграммы: зачем визуализировать, что условный Марк младше Андрея на семь лет?

Не визуализировать данные — нормально! Вспомогательную информацию или справочные данные лучше оставить в виде таблицы или текста и освободить место для более значимых диаграмм. Таблицы позволяют сравнить данные с высокой точностью. Это инструмент, который помогает опираться на конкретные значения. При этом категории данных в таблице лучше располагать вертикально, а информацию по конкретным позициям — строками.

Для наглядности в любую таблицу можно встроить небольшие визуализации. Например, спарклайны — маленькие графики, которые не показывают точный набор значений, но помогают отобразить общий тренд. Это полезно, когда важно понять, как менялись показатели между границами периода, и при этом не строить отдельные диаграммы для каждого тренда.

У каждого из таких графиков свой масштаб оси Y, поэтому сопоставлять их по значениям нельзя. Но отследить общую картину изменений — вполне.
Строить спарклайны можно даже в гугл-таблицах или экселе, а некоторые инструменты позволяют сделать их интерактивными, чтобы при наведении курсора показывались конкретные значения метрики.
Сравнивайте самое важное
Если вы используете диаграммы с накоплением, размещайте приоритетные категории у основания — так легче всего увидеть изменение данных.

Когда приоритетных категорий несколько, можно добавить интерактивность в одну диаграмму или разделить ее на разные графики.
Меняйте форму под содержание
Если у графиков длинные подписи и множество параметров, не бойтесь развернуть их на 90 градусов и расположить горизонтально: так все смогут и легко разобраться в подписях, и сравнить показатели.

Так, свои сценарии применения есть у круговых диаграмм. Если нужно показать квартильные значения, то есть близкие к 25, 50, 75%, это удобнее сделать в виде круга.

Географические тренды можно отражать с помощью карт, кодируя величину показателя цветом или оттенком площади, но если требуется показать небольшие различия, снова выручит барчарт, или столбчатая диаграмма. Например, Сбер не делает карты, а строит графики с выпадающими списками регионов.

В последнее время наблюдаю, что коллеги из академической среды и множество компаний используют для географических визуализаций достаточно олдскульный, но удобный подход. Например, чтобы разобраться, как работает интерактивная карта по изменению климата, нужно максимум две минуты.
Аккуратно используйте контрастные оттенки и следите за семантикой цвета
Градиентная палитра используется только для визуализации непрерывных показателей — например, если сравниваете площади или объемы инвестиций. Когда нужно отобразить категории, выбирайте контрастные цвета — так они будут сильно отличаться и не создадут путаницы.

Цвет считывается быстрее текста, поэтому используйте оттенки, которые будут вызывать правильные ассоциации у целевой аудитории. Зрителям будет сложнее воспринимать хорошее красным цветом, а плохое — зеленым.

Не забывайте про заголовки
Названия визуализаций считываются первыми и создают контекст всей картинки. В зависимости от цели можно использовать разные заголовки:
Нейтральные. Чаще всего используется формула «измеряемый показатель + дата / период времени», например «Выручка за 2024 год, млн руб.». Такие заголовки подходят для стандартной регулярной отчетности.
Инсайты. Для них нет четкой формулы, это содержательный вывод из инфографики. Пригодятся, когда нужно презентовать результаты аналитики. В зависимости от целевой аудитории инсайты могут отличаться: маркетологам и продактам одни и те же графики могут сказать о разном.

Больше советов о том, как визуализировать данные, ищите у DataYoga и подписывайтесь на канал команды Garage Eight в Телеграме. Там пишем о дизайне, аналитике, разработке и не только <3
А еще мы расширяем наше сообщество аналитиков и ищем коллег в продукт и маркетинг:
Functional Lead (Marketing Analysts)
Senior Data Analyst в маркетинг
В нашем внутреннем комьюнити аналитиков регулярно обмениваемся опытом, делимся полезными материалами и работаем над интересными задачами!