На нашей планете 4.3 миллиарда пользователей интернета. Каждую минуту они добавляют 46,740 фото в Instagram, пишут 456,000 твитов, 120 профессионалов регистрируются в LinkedIn и происходит 990,900 свайпов в Tinder. А у Facebook 2 миллиарда пользователей — больше четверти населения планеты! [1]
Данные везде и их количество только возрастает. Как пишут в своём отчёте McKinsey & Company “Data Science — это простая часть. Получить правильные данные и данные, пригодные для анализа — куда более сложна задача” [2]. Визуализация данных упрощает восприятие, делает данные более доступными и понятными, помогает понять, какую часть лучше всего использовать. А ещё за это хорошо платят. Давайте проследим как в разные эпохи люди по разному решали проблему визуализации, посмотрим на самые древние и самые известные примеры.
Самая ранняя визуализация, известная на сегодняшний день — это схема расположения домов города Чаталхёюк в современной Турции. Эта схема была создана приблизительно 6300 до н.э. Вы можете возразить, что наскальная живопись куда древнее. Но наскальная живопись не несла информационной нагрузки, она была больше предметом искусства, чем источником информации. Именно по этому мы начали именно с этой схемы.
Примером первой известной диаграммы, похожей на визуализацию в декартовой системе координат, является диаграмма движения небесных тел. Она была создана в X веке. Обратите внимание, что она содержит временную шкалу (30 клеточек по горизонтали) и изображает сразу несколько небесных тел. Это именно то, что мы так часто делаем сейчас – визуализация сразу нескольких временных рядов. Мне не удалось найти причину почему клеточек на шкале времени именно 30, может быть у вас есть какие-то идеи?
В XIV веке человечество прийдёт к идее построения графиков функции на базе табличных данных, когда данные логически взаимосвязаны. Но по настоящему массовая потребность в визуализации зависимостей возникнет тремя веками позже.
В XVII веке значительная часть научного сообщества была занята измерениями базовых физических величин: время, расстояние и пространство. Это было связано с значительным развитием астрономии, картографии, навигации и созданием новых колоний странами Европы. Это время бурного расцвета аналитической геометрии и систем координат. Мы посмотрим на один знаковый одномерный график (1664 г.), который считается первой известной визуализацией статистических данных. Автор, Михаэль Флоран ван Лангрен, опросил 12 астрономов и изобразил измерения расстояния по долготе между Толедо и Римом. По графику чётко видно, что он получил бимодальное распределение и даже подчеркнул этот факт словом “Roma” полагая, что истина где-то посредине. Но, к сожалению, ни одна из групп и ни один из астрономов не оказался прав. Реальное значение лежит чуть ниже от минимального значения.
В следующей статья я расскажу про золотой век развития визуализации данных и про тёмные времена статистического анализа. Кроме того мы посмотрим на 3 наиболее выдающихся визуализации и поговорим об эффекте, который они произвели на мир.
Если вы хотите более подробно познакомиться с историей визуализации данных, я хочу обратить ваше внимание на небольшую книгу “A Brief History of Data Visualization”, Michael Friendly которая бесплатно доступна на сайте автора.
[1] “How Much Data Do We Create Every Day? The Mind-Blowing Stats Everyone Should Read
” www.forbes.com/sites/bernardmarr/2018/05/21/how-much-data-do-we-create-every-day-the-mind-blowing-stats-everyone-should-read
[2] www.mckinsey.com/~/media/McKinsey/Business%20Functions/McKinsey%20Analytics/Our%20Insights/Analytics%20comes%20of%20age/Analytics-comes-of-age.ashx
Данные везде и их количество только возрастает. Как пишут в своём отчёте McKinsey & Company “Data Science — это простая часть. Получить правильные данные и данные, пригодные для анализа — куда более сложна задача” [2]. Визуализация данных упрощает восприятие, делает данные более доступными и понятными, помогает понять, какую часть лучше всего использовать. А ещё за это хорошо платят. Давайте проследим как в разные эпохи люди по разному решали проблему визуализации, посмотрим на самые древние и самые известные примеры.
Схема города Чаталхёюк
Самая ранняя визуализация, известная на сегодняшний день — это схема расположения домов города Чаталхёюк в современной Турции. Эта схема была создана приблизительно 6300 до н.э. Вы можете возразить, что наскальная живопись куда древнее. Но наскальная живопись не несла информационной нагрузки, она была больше предметом искусства, чем источником информации. Именно по этому мы начали именно с этой схемы.
Движение небесных тел
Примером первой известной диаграммы, похожей на визуализацию в декартовой системе координат, является диаграмма движения небесных тел. Она была создана в X веке. Обратите внимание, что она содержит временную шкалу (30 клеточек по горизонтали) и изображает сразу несколько небесных тел. Это именно то, что мы так часто делаем сейчас – визуализация сразу нескольких временных рядов. Мне не удалось найти причину почему клеточек на шкале времени именно 30, может быть у вас есть какие-то идеи?
В XIV веке человечество прийдёт к идее построения графиков функции на базе табличных данных, когда данные логически взаимосвязаны. Но по настоящему массовая потребность в визуализации зависимостей возникнет тремя веками позже.
Расстояние от Толедо до Рима
В XVII веке значительная часть научного сообщества была занята измерениями базовых физических величин: время, расстояние и пространство. Это было связано с значительным развитием астрономии, картографии, навигации и созданием новых колоний странами Европы. Это время бурного расцвета аналитической геометрии и систем координат. Мы посмотрим на один знаковый одномерный график (1664 г.), который считается первой известной визуализацией статистических данных. Автор, Михаэль Флоран ван Лангрен, опросил 12 астрономов и изобразил измерения расстояния по долготе между Толедо и Римом. По графику чётко видно, что он получил бимодальное распределение и даже подчеркнул этот факт словом “Roma” полагая, что истина где-то посредине. Но, к сожалению, ни одна из групп и ни один из астрономов не оказался прав. Реальное значение лежит чуть ниже от минимального значения.
Заключение
В следующей статья я расскажу про золотой век развития визуализации данных и про тёмные времена статистического анализа. Кроме того мы посмотрим на 3 наиболее выдающихся визуализации и поговорим об эффекте, который они произвели на мир.
Если вы хотите более подробно познакомиться с историей визуализации данных, я хочу обратить ваше внимание на небольшую книгу “A Brief History of Data Visualization”, Michael Friendly которая бесплатно доступна на сайте автора.
Источники
[1] “How Much Data Do We Create Every Day? The Mind-Blowing Stats Everyone Should Read
” www.forbes.com/sites/bernardmarr/2018/05/21/how-much-data-do-we-create-every-day-the-mind-blowing-stats-everyone-should-read
[2] www.mckinsey.com/~/media/McKinsey/Business%20Functions/McKinsey%20Analytics/Our%20Insights/Analytics%20comes%20of%20age/Analytics-comes-of-age.ashx
orange82
Вы уверены, что схему расположения домов можно считать визуализацией данных? Какую смысловую нагрузку она несет? Какие именно данные она визуализирует? Применительно к домам я бы считал первой визуализацией творение Джона Сноу (другого, не того, который ничего не знает). Вспышка холеры на Брод-стрит. В Вики есть карта и краткое описание того случая. Указанный вами автор тоже затрагивает тему холеры, но только доктор Бейкер не сделал никаких выводов из своей карты.
xSkyFoXx Автор
Это очень правильный и спорный вопрос. Я много думал над этим утверждением и дискутировал со своим преподавателем по визуализации данных перед тем, как его написать. С одной стороны это карта. С другой стороны — «картография» появится на 8000 лет позже. В то же время схема не показывает, как добраться куда-то. Она визуализирует расположение объектов.
Если обобщить — я согласен, это субъективно. И мой субъективизм сказал «таки визуализация».
orange82
Пусть так. Слегка отклонюсь от темы визуализации, как таковой. Очень интересно выглядит исходная версия изображения, которая, почему-то, отсутствует в Вики-статье про этот город. Почему бы вам не дополнить ее? Вот здесь краткая версия научных изысканий, может в сети имеются еще фотоснимки.