Всем привет!

А мы тут запускаем очередной поток курса «Разработчик JavaScript» и, по рекомендации преподавателей, готовим интересные материалы для чтения. Сегодня посмотрим на одну интересную заметку о визуализации вывода данных.

Поехали.

Круговая диаграмма — самый ужасный способ передачи информации, когда-либо изобретенный за всю историю визуализации данных.

Конечно, существуют и более неудобные методы. Но ни один из них не обладает популярностью и доверием в той же степени, что и круговая диаграмма.

Давайте, я объясню, что с ней не так, и почему вам необходимо перестать использовать ее как можно скорее.

Сперва, поговорим о том, зачем мы вообще используем диаграммы:

  • Диаграммы — способ взять некую информацию и сделать ее более понятной.
  • В целом, задача диаграмм — упростить сравнение разных сетов данных.
  • Чем больше информации диаграмма способна передать без увеличения сложности, тем лучше.

Я покажу, как круговая диаграмма терпит неудачу по всем эти критериям. “Задача” круговой диаграммы — показать взаимоотношения частей и целого.



Посмотрим, насколько плохо она справляется с единственной задачей, для которой она якобы создана. Посмотрите на эти три круговые диаграммы. Предположим, они отражают распределение голосов на местных выборах между пятью кандидатами в трех разных интервалах наблюдения A, B и C:


Открытый источник/ Wikipedia

Итак, что мы можем извлечь из этой информации? Поскольку эти доли голосов, которые получил каждый из кандидатов, читателю должно быть легко понять, что происходит в гонке. Но это не так. Показывает ли кандидат 5 лучшие результаты, чем кандидат 3? Кто показал лучший результат за время A и B — кандидат 2 или кандидат 4? У кого в гонке наибольший моментум?
Так если задача — сделать информацию проще для понимания, насколько вам помогли эти диаграммы? Действительно, если бы я просто дал вам таблицу со значениями голосов, не было бы это проще для восприятия информации?

Но пока посмотрим на ту же самую информацию, представленную в виде гистограммы:



Теперь гораздо понятнее. Мы с первого взгляда можем понять, что именно происходит с каждым из кандидатов в каждый промежуток времени гонки. Эта гистограмма гораздо четче выделяет части целого, чем круговая диаграмма, несмотря на то что это ее основная задача.

Посмотрим теперь на другой недостаток круговой диаграммы, который связан с тем, что люди на самом деле не понимают круги.

Ниже изображена круговая диаграмма с распределением партий Европейского парламента:



Основной вопрос — можем ли мы сравнить доли, чтобы выявить различия размеров всех частей диаграммы? Если единственное, что мы пытаемся узнать, что EPP больше, чем S&D, то какой смысл в диаграмме? Я мог бы понять это, просто посмотрев на два числа. Нет, диаграмма полезна только в том случае, если мы можем сравнить все ее элементы друг с другом.
Ниже представлены отдельные доли, для сравнения вырванные из контекста. Посмотрите на них, и подумайте, можете ли вы расставить их по порядку от наибольшего к наименьшему.



Люди вообще плохо умеют сравнивать доли круга, когда речь идет о размере.
Именно поэтому вы могли считать тригонометрию и радианы гораздо сложнее обычной геометрии прямоугольников.

Это не плохо, но такое стоит иметь в виду, когда пытаетесь сформулировать информацию наиболее исчерпывающим и доступным способом. Вот те же данные, но в виде столбчатой диаграммы:



Обратите внимание, что вы можете сравнить каждую партию с любой другой партией.
Просто сравнивните длины прямоугольников, чтобы понять, что происходит.
При большом желании, вы могли бы заменить левую ось на проценты, чтобы узнать распределения внутри парламента. Сейчас же вы можете посмотреть, сколько мест отведено каждой из партий — такой информации изначально не было представлено на круговой диаграмме.

А теперь, посмотрим, как легко можно манипулировать круговыми диаграммами.
Вот те же самые данные, что и выше, но теперь в виде 3D Круговой Диаграммы:



Люди постоянно этим пользуются, потому что трехмерная круговая диаграмма, расположенная под углом — отличный способ обмануть вас. Взгляните на диаграмму, S&D — красная партия — выглядит примерно равной партии EPP сине-зеленого цвета. Но такое впечатление создается лишь потому, что я исказил перспективу, создав впечатление, что красный большой.
Это настолько просто, что даже немного стыдно, что Excel позволяет делать такое.
Ниже представлен еще один пример недостатка круговой диаграммы. На самом деле, 10% мужчин, читающих эту статью, даже не поймут, о чем идет речь.


Красно-зеленый дальтонизм у мужчин

Самые элегантные диаграммы не требуют маркировки данных. Чтобы донести мысль, посторонние числа не требуются. А если требуются, вы используете не ту диаграмму.

Итак, сделаем выводы:

  • Если в представленной информации есть доли схожих размеров, круговая диаграмма — неподходящий выбор.
  • Если результатов наблюдений несколько (3 и более), круговая диаграмма — неподходящий выбор.
  • Круговой диаграммой можно с легкостью злоупотреблять.
  • Круговая диаграмма — неподходящий выбор, если вам нужно маркировать каждый процент.

Перед тем как перейти к финальной критике круговых диаграмм, посмотрим, в чем же они все-таки хороши. Единственная ситуация, в которой круговые диаграммы хороши — сравнение 2-3 результатов наблюдений с очень различающимся количеством информации.


Business Insider, данные из Детройта
Оплаченные и неоплаченные налоги на недвижимость в Детройте, 2011

И все.

То есть, если подумать, единственное, в чем они хороши, единственный способ использования — показать людям, как выглядят доли. Единственная задача диаграммы выше — показать, как выглядит 32 из 100.

На прошлой неделе я прокомментировал, что круговая диаграмма — это Nickelback от мира визуализации данных. Этот выпад широко распространился. Но я пришел к выводу, что есть даже более подходящая метафора. Круговые диаграммы — Аквамен от мира визуализации данных.

Аквамен хорош только в одном. Даже так, другие супергерои DC зачастую могут выполнить работу Аквамена лучше, чем он сам. Супермен задержит дыхание под водой, у Бэтмена просто есть подлодка. Если будет тонуть нефтяной танкер, кого вы позовете? Аквамена? Или Супермена? Начинаешь задумываться, зачем вообще пригласили Аквамена.



И когда появляется настоящий шанс для Аквамена или круговой диаграммы принести пользу — может вам нужно поговорить с рыбой или объяснить, как выглядит 32% в круге — возникает сомнение, а нужно ли это вовсе. Просто перестаньте использовать круговые диаграммы. Они бесполезны, с ними легко облажаться, и они не справляются с единственной задачей диаграмм — сделать информацию визуально наглядной. Круговые диаграммы — это Аквамен.

Так что же использовать?

Как твитнул Edward Tufte, дата-сайентист, который подробно писал о неудаче круговой диаграммы:
Пользователи круговых диаграмм заслуживают того же подозрения+скептицизма, что люди, которые путают тся/ться. Для сравнения используйте маленькие таблицы, предложения, но не круговые диаграммы. Edward Tufte (@EdwardTufte)
Как всегда ждём вопросы и комментарии тут или можно зайти на день открытых дверей к Александру.

Комментарии (18)


  1. apapacy
    27.09.2018 19:02
    +4

    Перед тем как перейти к финальной критике круговых диаграмм, посмотрим, в чем же они все-таки хороши. Единственная ситуация, в которой круговые диаграммы хороши — сравнение 2-3 результатов наблюдений с очень различающимся количеством информации.

    Круговой диаграммы есть оно явное преимущество — показать долю в части целого. При этом данных может быть много — их просто помещают в раздел «остальное». Сравнить два или три или сколько угодно резултатов можно и на столбиковой диаграмме. А вот узнать долю в целом на других типах лдиаграмм будет сложно.


    1. BugM
      27.09.2018 22:31
      +3

      Хорошо замечено. На любимых автором столбчатых диаграммах долю показать невозможно.

      На круговой диаграмме должно быть не больше 3-4 разных значений и она должна показывать какие проценты от общих 100% эти значения занимают. Тогда все будет наглядно и полезно.


      1. daiver19
        28.09.2018 09:16
        +2

        В чем проблема заменить ось Y на проценты вместо целых чисел и наблюдать те же доли, только удобнее?


        1. apapacy
          28.09.2018 11:51

          Рабочий пример можно?


        1. BugM
          28.09.2018 12:36

          Простые примеры.
          Выборы. 3 партии. 45, 40 и 15 процентов. Не вглядываясь в циферки понять есть ли большинство у одной партии невозможно.

          Те же выборы. 30 и 30 у двух партий. Остальные 40 у 5 мелкий партий. Понять могут ли эти 2 партии сформировать большинство не вглядываясь в циферки невозможно.

          На круговых это все будет видно в первого взгляда. Циферки и подписи не критичны.


        1. Steed
          28.09.2018 16:41

          Никаких проблем, 146%


  1. catsmile
    27.09.2018 20:54
    +1

    Перед тем как перейти к финальной критике круговых диаграмм, посмотрим, в чем же они все-таки хороши. Единственная ситуация, в которой круговые диаграммы хороши — сравнение 2-3 результатов наблюдений с очень различающимся количеством информации.


    Собственно вот суть, и я с этим полностью согласен. Это из разряда шуток про микроскоп и забивание им гвоздей; каждый инструмент нужно использовать в определенных, подходящих ему целях, пусть даже иногда удобнее заколотить этот торчащий гвоздь станиной микроскопа, раз уж он в руке.


  1. k12th
    27.09.2018 22:59
    +2

    Что эта статья делает в хабе JavaScript?


    1. slonopotamus
      28.09.2018 00:53

      Она в нём находится.


      1. Xazzzi
        28.09.2018 12:50
        +1

        Работодатель: Назовите вашу главную слабость.
        Кандидат: Я даю семантически корректные, но практически неприменимые ответы на вопросы.
        Работодатель: Могли бы вы привести пример?
        Кандидат: Да, мог бы.


        1. slonopotamus
          28.09.2018 19:41
          +1

          Неплохо. Хотя хочу заметить что несколько раз наблюдал ситуации когда на вопрос "а можете привести пример/а доказать сможете" простого "могу" оказывалось достаточно. Более того, вопрошающий это подтверждал словами типа "не надо, верю".


          Из подобного меня каждый раз умиляет вопрос на MSDN "была ли эта страница полезна?". К сожалению, среди вариантов ответов есть только да/нет. А хочется-то ответить "возможно когда-то и была, но сейчас — точно нет".


  1. mSnus
    28.09.2018 05:47

    Я дата-сайентолог. У вас найдется минута поговорить о Круге?


  1. LinearLeopard
    28.09.2018 06:40

    Немного передёргиваний самое то.
    Круговая диаграмма нужна для отображения частей целого, поэтому мы будем сравнивать похожие проценты по ней. Вот, вроде и правильную мысль пытаются донести, но средства используют, так себе и уже критикуемая идея кажется хорошей.
    В случае с европарламентом не помешала бы сортировка, заодно и зависимость проще вывести. А вообще, не так уже часто в научных статьях их и используют, пожалуй, самый распространнённый метод визуализации — старые добрые графики.

    P.S. Интересно, как тся\ться звучало в оригинале.


    1. mayorovp
      28.09.2018 09:47
      +1

      Pie chart users deserve same suspicion+skepticism as those who mix up its/it's, there/their.


  1. leex
    28.09.2018 09:02
    +1

    А теперь, посмотрим, как легко можно манипулировать круговыми диаграммами.

    Это и есть ответ на вопрос для чего используют круговые диаграммы.


  1. geher
    28.09.2018 13:45

    Круговые диаграммы из той же оперы, что и часы со стрелками.
    Они используют метафору разрезания на чвсти круглого пирога.
    И предназначены они для того, чтобы наглядно показать распределение долей целого через эту мктафору, очень удобную для многих людей и достаточно хорошо воспринимаемую большинством. Просто следует понимать ограничения этой диаграммы и не применять там, где можно из-за этого получить неверную оценку.
    Близкие доли трудно различить? Так во многих случаях просто не имеет значения различие между близкими долями, и 51/49 примерно те же 50/50, существенной разницы не будет.
    Это только нна выборах, когда доли процента решают, круговая диаграмма неуместна при подсчете голосов. А на тех же выборах для демонстрации результатов опроса на выходе из участка — вполне годится, поскольку точность восприятия вполне соответствует реальному соответствию результатов опроса и результатов голосования.
    Манипуляции восприятием через 3D?
    Некоторые другие виды диаграмм этому тоже подвержены.
    А еще можно поиграться шкалой (линейная, логарифмическая, еще какая, начало и конец шкалы).


  1. Max_JK
    28.09.2018 17:13

    Несколько правил которые улучшат восприятие вашей круговой диаграммы:

    1. Сортировать доли по возрастанию или убыванию
    2. Объединять значения менее 1% процента в другое
    3. Не использовать вырвиглазные цвета
    4. Обозначить процент занимаемый каждой долей

    Эти правила решают большинство проблем описанных в статье.


  1. MIKEk8
    28.09.2018 18:22
    +2

    Круговые ещё читаемы, а

    вот такие
    image