Привет! Это команда курса «Аналитик данных» в Яндекс Практикуме. Собрали подборку полезных ресурсов для тех, кто только начинает осваивать визуализацию данных или хочет расширить арсенал инструментов и источников вдохновения. Здесь вы найдёте книги, статьи, онлайн-ресурсы и телеграм-каналы, которые помогут разобраться, как правильно, наглядно и красиво представлять данные.

Книга «Графики, которые убеждают всех», Богачев Александр

Первая книга об эффективном представлении данных от русскоязычного автора. Книга рассказывает, как подготовить данные к работе, как выбрать подходящий для своих данных график или диаграмму, как грамотно оформить график, чтобы он максимально доносил ваше сообщение, как распознать ситуацию, когда статистикой пытаются манипулировать.

Александр Богачев — один из ведущих в стране специалистов по визуализации данных, инфографике и дата-журналистике. Работал ведущим дизайнером в Студии инфографики сайта РИА.ру, руководителем отдела дата-спецпроектов в РБК, сотрудничал как информационный дизайнер и руководитель проектов с крупнейшими российскими компаниями. Преподает визуализацию данных в Высшей школе экономики.

Купить на сайте издательства

Читать первые главы бесплатно в блоге автора → 

Скачать приложение к книге: постер, который помогает выбрать график →

Книга «Библиотека Matplotlib», Devpractice

Книга представляет собой серию уроков по работе с библиотекой Matplotlib, которые помогут научиться решать большинство задач, возникающих при работе с графиками. В ней рассматриваются темы визуализации данных, включая построение линейных, точечных, ступенчатых, stem-графиков, столбчатых и круговых диаграмм, а также 3D-графиков. Также уделено внимание настройке внешнего вида графиков: работе с легендой, текстовыми элементами, цветовой шкалой и компоновкой графиков.

Скачать книгу бесплатно на сайте Devpractice → 

Статья «Библиотека Matplotlib для построения графиков, диаграмм и 3D-моделей», Блог Яндекс Практикума

Статья поможет разобраться, как с помощью коротких команд строить графики, присваивать заголовки, визуализировать функции и применять другие способы форматирования с помощью инструментов библиотеки Matplotlib. Внутри большое количество иллюстраций и примеров кода.

Читать статью →

Урок по визуализации из открытого курса машинного обучения, Open Data Science

Открытый курс машинного обучения mlcourse.ai сообщества Open Data Science — это сбалансированный по теории и практике курс, дающий как знания, так и навыки по машинному обучению для джуниор дата-сайентиста. 

Второе занятие курса посвящено визуализации данных в Python. Сначала авторы рассматривают основные методы библиотек Seaborn и Plotly, затем проводят анализ набора данных по оттоку клиентов телеком-оператора и строят t-SNE представление всё тех же данных. Чтобы занятие принесло максимум пользы, советуем начать с первого урока, но выбор за вами.

Читать статью «Визуальный анализ данных c Python» →

Слушать лекцию «Визуальный анализ данных c Python» →

Перейти к первой статье цикла

Перейти на сайт ML-курса на русском → 

Галерея графиков на Python, The Python Graph Gallery

Сотни графиков, созданных с помощью Python. Каждый пример сопровождается воспроизводимым кодом вместе с подробными объяснениями. На сайте есть туториалы как для новичков, так и для продвинутых пользователей. 

На сайте можно найти разделы с инструкциями по установке и началу работы в библиотеках Matplotlib, Seaborn, Pandas, Plotly и Plotnine. Также есть страница, помогающая подобрать палитру для графика. В общем, на сайте есть всё, что может понадобиться для быстрого старта: и вдохновение, и инструменты, и пошаговые руководства.

Перейти на сайт →

Статья «7 малоизвестных пакетов для визуализации на Python, о которых вы должны знать», NOP

Короткий обзор библиотек для визуализации данных в Python. Рассматриваются такие инструменты, как Bokeh, Seaborn, ggplot, Plotly, Altair и другие, с акцентом на их особенности, преимущества и способы применения. Каждая библиотека сопровождается кратким описанием и командой для установки. Опытный аналитик, скорее всего, не найдёт для себя ничего нового, но обзор может пригодиться начинающим специалистам, которые хотят узнать больше о разных инструментах.

Читать статью →

Телеграм-канал «отвратительные графики»

Название говорит само за себя: в этом канале вы не найдёте ничего хорошего. Автор никак не комментирует публикации (возможно, у него нет слов), поэтому эта задача полностью ложится на плечи подписчиков. Также у канала есть бот, через который вы можете прислать свой пример того, как делать не надо.

Подписаться на канал → 

Телеграм-канал «Чартомойка»

Канал автора первой книги из нашей подборки Александра Богачева, посвящённый визуализации данных. Слоган канала: «О графиках: плохих, хороших и других. От восхищения до ненависти — один chart». Александр делится критическими обзорами графиков, обсуждает качество данных, выбор типов визуализаций и дизайн. Подписчики могут присылать автору подозрительные или интересные графики для публикации в канале.

Подписаться на канал →

Телеграм-канал Reveal the Data

Проект Романа Бунина про визуализацию данных, развитие BI-систем и дашборды. Больше всего канал будет полезен аналитикам и дизайнерам, кто занимается аналитическими системами. Внутри подробные разборы, эксперименты, конкурсы, подборки полезных материалов, вакансии, лайфстайл, чего только нет — и всё полезное.

Роман — Head of Data в компании Nebius Group, где отвечает за аналитику финансов и HR. До этого был евангелистом DataLens и ещё раньше 3 года руководил группой развития BI-систем в Яндекс Go. А ещё раньше управлял проектами по визуализации данных в Фармакей и Δλ Лаборатории данных.

Подписаться на канал →

Комментарии (1)