Основные стратегии дизайна для улучшения ваших визуализаций

Стрит-арт в Детройте, штат Мичиган. Фото автора.
Стрит-арт в Детройте, штат Мичиган. Фото автора.

Я преподаю студентам, которые только начинают развивать свои навыки работы с данными. Преобладает миф о том, что хорошая визуализация данных возникает благодаря (так называемому) хорошему программному обеспечению. Excel закрепил этот миф, позволив пользователям быстро преобразовывать необработанные данные в трехмерные гистограммы и круговые диаграммы с десятками срезов - или, что еще хуже, трехмерные круговые диаграммы. Плохие визуализации - это проблема не программного обеспечения, а выбора дизайна пользователем.

Моей мотивацией для написания этой статьи является желание вдохновить новичков, особенно моих студентов, на создание убедительных визуализаций данных путем вдумчивого и целенаправленного применения принципов дизайна. Я создал следующую инфографику с помощью Google Sheets. Как известно, сообщество визуализации данных не считает Google Sheets "профессиональным" программным обеспечением для визуализации, но эта графика достаточно эффективна для поставленной цели и аудитории.

Простая инфографика, созданная в Google Sheets. Графика предоставлена автором.
Простая инфографика, созданная в Google Sheets. Графика предоставлена автором.

Программное обеспечение не является ни необходимым, ни достаточным условием для создания убедительных визуализаций. Люди создали некоторые из самых впечатляющих визуализаций еще до появления компьютеров. Утверждать, что то или иное программное обеспечение лучше другого, равносильно заявлению, что ручки лучше карандашей. Или что молоток лучше отвертки. Вы будете развиваться быстрее и продвинетесь дальше, если станете уделять меньше внимания программному обеспечению и больше - решению проблем и проектированию.

В этой статье рассматриваются основные стратегии проектирования, которые вы можете быстро и незамедлительно применить для визуализации данных. Мой обзор не претендует на полноту. Напротив, эта статья служит ориентиром для изучения основных технических и концептуальных принципов дизайна.

Проектируйте для своей аудитории, а не для себя

Самая большая ошибка, которую допускают новички при создании визуализаций данных, - это проектирование для себя. Цвета и шрифты выбираются исходя из личных предпочтений. Аннотации, если они вообще используются, пестрят сокращениями и жаргоном. Начинающие пользователи располагают графические элементы таким образом, чтобы они были понятны им самим, а не аудитории.

Принимайте все дизайнерские решения с точки зрения ваших слушателей. Если вы не знаете свою аудиторию, то, возможно, еще не готовы к визуализации данных. Конечно, вы можете использовать визуализации для изучения данных, но я предпочитаю рассказывать истории о данных. После того как вы определились со своей аудиторией, можете использовать некоторые из следующих вопросов, которые помогают направить ваше дизайнерское мышление.

  • Что ваша аудитория уже знает об этой теме?

  • Что нужно знать вашей аудитории, чтобы понять визуализацию?

  • Есть ли у вашей аудитории особые информационные потребности? Каковы эти потребности?

  • Является ли визуализация данных наилучшим способом донесения информации? Визуализации по своей сути не отличаются от таблиц. Четко объясните, почему именно вы выбираете визуализацию.

  • Каковы информационные потребности аудитории?

  • Как будет представлена визуализация? (Электронная или бумажная копия?)

  • Как особенности аудитории повлияют на интерпретацию? Подумайте о культуре, языке, образовании, навыках работы с данными и т.д.

Не полагайтесь на настройки по умолчанию.

Полагаться на настройки программного обеспечения по умолчанию - прямой путь к созданию ужасной визуализации. На следующих рисунках показаны настройки по умолчанию для различных программных сред. Сколько графиков вы видели с такими цветовыми палитрами, шрифтами, размерами шрифтов и линиями сетки? Сообщество визуализации данных должно запретить настройки по умолчанию так же, как мы возненавидели трехмерные гистограммы и круговые диаграммы.

Набор данных Iris, визуализированный с помощью трех различных программных сред. Графика, к сожалению, авторская.
Набор данных Iris, визуализированный с помощью трех различных программных сред. Графика, к сожалению, авторская.

Если вы новичок в создании визуализаций данных, потратьте несколько минут, чтобы насладиться графикой, которую вы создали намеренно (в отличие от случайного клика). Следующей важной задачей является кастомизация. Изучение различных элементов, из которых состоит график, может сделать вашу работу более эффективной. Например, в Google Sheets можно дважды кликнуть на любом элементе графика, чтобы вызвать панель настройки. Вот элементы, которые я настроил для кастомизации моего графика марихуаны.

Изображение автора.
Изображение автора.

Узнайте о грид-системах и используйте их!

Йозеф Мюллер-Брокманн (Josef Müller-Brockmann) (1914-1996) был выдающейся фигурой в графическом дизайне, и его работы продолжают вдохновлять и влиять на дизайнеров во всем мире. Он популяризировал грид-системы, которые являются незаменимым помощником для организации графических элементов в визуальной коммуникации.

Изображение из WikiCommons.
Изображение из WikiCommons.

Мюллер-Брокманн (Müller-Brockmann) пишет:

Грид-система - это средство, а не гарантия. Она допускает множество вариантов использования, и каждый дизайнер может найти решение, соответствующее его личному стилю. Но нужно научиться использовать грид; это искусство, которое требует практики.

Я рекомендую избегать использования программных инструментов для построения грида. Начните с простого. Изучите концептуальные принципы грид-системы и сделайте наброски макетов от руки. Я могу оперативно итерировать идеи, зарисовывая различные формы.

Изображение автора.
Изображение автора.

По теме грид-систем написаны целые книги, поэтому мои предложения здесь - лишь отправная точка для вашего дальнейшего развития.

Используйте закономерности восприятия информации на примере обычного чтения.

Подумайте о том, как ваша аудитория будет воспринимать информацию. Откуда начинаются движения глаз и как они перемещаются по изображению. Люди читают слева направо и сверху вниз, поэтому левая верхняя область вашей диаграммы является наиболее ценной областью. Именно здесь люди приступают к восприятию визуализации. Не забудьте применить такой же подход ко всем графическим элементам. Например, рассмотрим следующие гистограммы из датасета Iris. Графики одинаковые.

Графика, созданная с использованием датасета Iris. Изображение автора.
Графика, созданная с использованием датасета Iris. Изображение автора.

В этом примере я оптимизировал левый график, придав горизонтальную ориентацию столбцам, поскольку люди читают именно так - слева направо и сверху вниз. Пользователь должен окинуть взглядом сразу весь график, а затем прочитать снизу вверх. Эта задача относительно проста в случае трех баров (вертикальные штрихи, столбцы), но чрезвычайно сложна если надо отобразить большое количество.

Шрифты и начертание

То, что люди обычно называют шрифтом, является гарнитурой. Выбор гарнитуры шрифта влияет на читабельность и тон визуализации. Если вы хотите, чтобы ваша визуализация выглядела как ученический проект, то, конечно, используйте шрифт Comic Sans - и добавьте несколько 3D-баров, чтобы графика выглядела интересно. На самом деле, пожалуйста, не делайте этого. Никогда.

График с использованием датасета Iris, который не должен был быть создан автором. Но это произошло.
График с использованием датасета Iris, который не должен был быть создан автором. Но это произошло.

Потратьте время на изучение различных гарнитур и узнайте о проблемах, которые они призваны решить. Принимайте взвешенные решения, чтобы убедиться, что ваша графика читабельна, а тон соответствует аудитории и сюжету. Следующее изображение - пример задания, которое я получил на одном из первых курсов графического дизайна по типографике. Задание включало в себя краткое изложение истории и использования гарнитуры. Я выбрал шрифт Avenir, который, согласно полученным знаниям, является исключительно универсальным для создания четкого, аккуратного текста.

Необходимый шрифт для повседневной типографики: Avenir 

Avenir означает «будущее» на французском языке и имеет сходство со шрифтом (гарнитурой) (англ. - typeface) Futura. Это геометрический шрифт без засечек, разработанный Адрианом Фрутигером (Adrian Frutiger) в 1987 году [1]. Оригинальный шрифт был выпущен в 1988 году, вскоре после первоначального дизайна, шрифт был пересмотрен в середине 2000-х и переиздан под названием Avenir Next.  Что отличает Avenir от Futura, так это то, что вертикальные штрихи толще, чем горизонтальные [2]. 

Avenir - интересный шрифт, кажется, что дизайнер больше гордился техническими, чем интеллектуальными достижениями. Это гуманистический шрифт без засечек. Он считается современным и элегантным шрифтом, подходящим для коммерческой деятельности с различными носителями (например, цифровыми, рекламными щитами, книгами, блогами и графикой) [3].  Другими словами, это может быть уместно как для формальных, так и для неформальных целей.  Ряд известных организаций используют Avenir для своего шрифта, в том числе (но не ограничиваясь ими): The City of Amsterdam, Wake Forest University, Girl Scouts of America. Один шрифт Avenir от компании myfonts.com стоит $35,00. Коллекция шрифта включает 24 стиля и ежедневные варианты пакетов и является  бестселлером под №8 на этом сайте.  

ABCDEFGHIJKLMNOPORSTUWWXYZ 
abcdefghijklmnopqrstuvwxyz
0123456789 

1 https://en.wikipedia.org/wiki/Avenir (typeface)
2 myfonts.com/fonts/linotype/avenir/ 
3 https://medium.com/@anton3377/avenir-a-time-for-fonts-with-a-human-touch-c88999575583

Выбор цвета

Выбор цвета - одна из самых сложных проблем при построении визуализации данных. Избегайте выбора цветов для того, чтобы визуализация выглядела интересно. То, что вам кажется привлекательным, может противоречить информационным потребностям вашей аудитории и усложнить или исказить историю, которую вы пытаетесь рассказать.

Избегайте стереотипного мышления при кодировании размерных показателей с помощью цвета. Использование голубого и розового цветов для обозначения пола - это слишком упрощенный способ решения проблемы, особенно с учетом нашего понимания гендерной идентичности. Кодирование расовых параметров может быть невероятно сложным и часто требует другого визуального канала, чтобы избежать стереотипных подходов или противоречивых графических подсказок. И, конечно же, необходимо продумать вопросы обеспечения доступности и того, как сделать так, чтобы та часть аудитории, которая страдает дальтонизмом, могла интерпретировать графику.

Тест Ишара (Ishara) для проверки дальтонизма, показывает число 74. Изображение из Википедии.
Тест Ишара (Ishara) для проверки дальтонизма, показывает число 74. Изображение из Википедии.

К сожалению, я не могу обобщить этот огромный объем информации в одном абзаце или короткой статье. Поэтому рекомендую добавить данную тему для исследования. У Асима Кашьяпа (Aseem Kashyap) имеется отличная статья для того чтобы приступить к изучению.

Используйте названия, заголовки и текстовые аннотации продуманно и с осторожностью.

Эффективная визуализация должна быть самостоятельной, насколько это возможно. Концепция автономности означает, что конечные пользователи должны иметь перед глазами всю информацию, для понимания того, что вы показываете. Им не следует искать дополнительную информацию в Интернете или гадать, что означают ваши сокращения или жаргон. Потратьте время на то, чтобы продумать названия или заголовки для вашей графики, которые помогут разобраться в ходе сюжета вашей истории. Большая часть моей работы - это научные исследования, поэтому мои заголовки, как правило, достаточно дескриптивны. При этом иногда в своей консалтинговой работе я использую заголовки, чтобы донести до читателя важную мысль.

Вы можете использовать текст для создания визуальной иерархии, но это требует применения определенной контрастности. Например, заголовки должны быть отличимы от основного текста. Достичь различия можно с помощью шрифтовых пар. Эстер Тео (Esther Teo) написала отличную статью по этой теме на Medium:

Сортировка и упорядочивание

При создании таблиц или графических отображений не игнорируйте важность сортировки или упорядочивания значений. Большинство графических систем при отображении размеров сортируют их в алфавитном порядке. Это может быть полезно, но не всегда является той информацией, которая нужна вашему пользователю.

Постобработка

Когда вы станете опытным создателем графики, то столкнетесь с ситуациями, когда ваши инструменты (т.е. программное обеспечение) будут работать не так, как хочется. Например, я немного подзабыл навыки работы с языком программирования R, но все еще могу создать пользовательский график с помощью расширения ggplot. Но иногда, чтобы сделать аннотации правильно, может потребоваться очень много времени. Когда я сталкиваюсь с этой проблемой, то делаю PDF-файл изображения и завершаю его настройку в Adobe Illustrator.

Если вы хотите выполнить подобную постобработку, сохраняйте графику в виде векторного изображения (например, PDF и SVG), а не растрового (например, JPEG и PNG). В векторном файле существует возможность прямого доступа и кастомизации к любым графическим элементам, включая текст. Растровыми изображениями можно манипулировать как фотографиями, но это громоздко. При любой постобработке следите за тем, чтобы не исказить масштаб данных. Кстати, нельзя просто выводить JPEG или PNG в PDF и рассчитывать при этом на доступ к элементам.

Вырезать, вырезать, вырезать

Этот совет основан на работе Эдварда Тафте (Edward Tufte) - одного из самых влиятельных людей в области визуализации данных. Изучите каждый элемент графики и спросите себя, имеет ли он информационную ценность. Кодирует ли он информацию? Упорядочивает ли он ее? Предлагает ли он визуальные подсказки для перемещения или потребления информации? Используя датасет о "Титанике", я создал простую гистограмму в Google Sheets, иллюстрирующую минималистский подход, подобный гистограммам  Тафте.

График, созданный в Google Sheets с использованием датасета "Титаника". График составлен автором.
График, созданный в Google Sheets с использованием датасета "Титаника". График составлен автором.

Конечно, я мог бы легко добавить к графику тонущий корабль, но это не поможет моей истории. Корабль, погружающийся в воду, не передает мою историю на основе данных. Многие стандартные графические элементы были лишними. Например, я указал точные значения на столбцах, чтобы читателю не пришлось просматривать их вперед и назад для сравнения. Таким образом, отпала необходимость в оси y. Не зная, как от нее избавиться, я решил закамуфлировать ее белым цветом. Чтобы усилить визуальное сопоставление по полу, я добавил цвет, но в легенде нет необходимости, поскольку заголовки дают эту информацию.

Избегайте добавления графических элементов для того, чтобы визуализация выглядела интересно. В сообществе по визуализации данных ненужные графические элементы называют "хламом" (chart junk). Опять же, лично вам может быть все понятно, но визуализация предназначена не для вас - она адресована вашей аудитории. История из ваших данных должна быть интересной. Если вы добавляете графические элементы для привлекательности, убедитесь, что они при этом не сбивают пользователя с толку. Еще раз повторю, то, что ясно в вашем сознании, может быть совершенно непонятно для остальных.

Заключительные мысли

Я создаю из всех своих курсовых заметок статьи, которыми можно поделиться. Большинство из них предназначены для новичков. Не стесняйтесь следить за мной, если хотите получать обновления о новых публикациях.

Перевод статьи подготовлен в преддверии старта курса "Аналитик данных". Всех, кому интересно данное направление, хочу пригласить на бесплатный урок по теме: "Обзорная экскурсия по основам визуализации данных и информационного дизайна".

Урок будет интересен новичкам в теме визуализации, специалистам, которые пока имеют в своём арсенале только Excel файлы, и хотят научиться получать из данных максимум пользы. Поговорим о том, как визуализация помогает информации править миром, как можно автоматизировать свою работу, обладая минимальными техническими навыками, и научиться представлять её качественно, не затрачивая огромных усилий. Еще мы коснёмся основных техник создания удобной и интуитивно понятной отчетности на примере современных Business Intelligence платформ.

- Зарегистрироваться на бесплатный урок

Комментарии (1)


  1. nahlogin
    06.10.2022 12:30

    Используйте закономерности восприятия информации на примере обычного чтения.

    Для отдельных диаграмм, это спорный совет. Кто-то изучал эти закономерности восприятия на примере диаграмм?

    На примере столбчатой диаграммы можно дать более полезный совет: упорядочивать столбцы. Чаще всего столбцы упорядоченные по высоте (а не по подписи) помогают лучше сравнить значения, чем столбцы разной высоты идущие в разнобой.