В четверг 4 октября я побывал на конференции DataVizDay в Минске в качестве спикера. Поделюсь самыми интересными идеями и впечатлением от Миснка.
Ключевые идеи:
- 80% ваших усилий будет до BI и визуализации, потому что данные бывают или плохие или очень плохие и в основном вы будете тратить время на подготовку и сбор данных.
2.Тем не менее визуализация создает ценность вашего дата продукта. Без визуализации получается просто куча цифр. - К сожалению очень часто визуализация плохая, используют плохие подходы, типы графиков и гистограмм, перегружают представления деталями. В итоге часто мы видим Kill by powerpoint и обилие данные не добавляет прозрачности в аналитике.
- Эксель продолжает занимать значительную роль в процессах. И часто компании не готовы перейти на что-то продвинутое. Но даже на экселе можно построить много чего интересного, потому что хорошая аналитика скорее начинается с чистоты и подготовки данных, а не с красивых дашбордов.
- Из бизнес кейсов — использование данных о социальных сетях для построения карты “мыслей” о частях города. Например, в Москве все твиты о центре, а о жизни вокруг центра никто не пишет. Его как бы нет в социальном пространстве, хотя там живет большая часть жителей Москвы.
- Более традиционные кейсы это сквозная аналитика от контакта до продажи. Правда пока никто не пришел с кейсом не просто сквозной аналитики от контакта, а с учетом того, что у клиента может быть много контактов и последний контакт, приведший к покупке не самый надежный указатель на канал привлечения. Так что пока все наша сквозная аналитика несколько перекошена на избыточную важность каналов и недооценку того, что люди могут иметь много контактов с брендом.
- Много было обсуждений плохих визуализаций и как можно их поправить. Узнал, что люди злоупотребляют круговой диаграммой и преодолению этой проблемы был отведен целый блок одной из презентаций. Круговые диаграммы предлагают менять на столбчатые, санкей диаграммы или вообще заменять линии.
- Борются две парадигмы — аналитик данных должен только тыкать на кнопки и аналитик данных должен уметь писать код (R/python, SQL) для своих визуализаций и pipeline обработки данных. Лично я сторонник второго подхода, что-то вроде парадигмы DevOps, только в аналитике, когда технический вопрос не должен быть препятствием в доставке аналитический продуктов.
- Многие люди с кем я общался часто жалуются, что у них так и не построено удобное хранилище данных и им приходится доделывать много чего в экселе. Это не смотря на то, что у них много бородатых Итшников, которые пилят это хранилище годами.
- Еще одна проблема — это сильное разделение ИТ/не ИТ. Люди не умеют говорить на одном языке и не решают проблему, а лишь решают задачи в “своей зоне ответственности”. От этого и стоят не нужные хранилища, а рядом с ними люди пилят свои pipeline на экселе.
- Поговорили с коллегой еще об одной актуальной проблеме — как поднять Data Literacy в компании. Какие бы не были данные и хранилище их неверное извлечение, интерпретация и обработка означает фейковую аналитику. А так как данные становятся все более демократичными, то каждый пользователь должен как-то получать минимальную подготовку, чтобы этими данными пользоваться. Но часто в компаниях все не так хорошо с этой подготовкой, обучением и документацией по использованию хранилища. Если кто-то смог организовать хорошее обучение по Data Literacy, то можно выступить — актуальная тема и я буду сидеть в первых рядах.
- Часть тем затрагивали работу с картами. Я к сожалению эти выступления пропустил. Могу лишь сказать, что работа с картами и их визуализация реально интересный и важный тул для управления компанией. Табло и power BI могут рисовать различные карты, точки, полигоны и линии на картах, кругом полно источников геоданных, которые вы можете скомбинировать с данными вашей компании и получить интересные инсайты: новые точки для бизнеса, концентрацию конкурентов, сведения о расстоянии до ваших клиентов, связь между уровнем жилья и уровнем потребления и многое другое. Скоро напишу мой опыт работы с картами и какие инструменты мы попробовали.
- Моя тема доклада была посвящена опыту организации работы отдела аналитики по скраму. Про это я сделаю отдельный пост.
Стоит ли ехать на конференцию? Да, стоит. Но только рассчитывайте, что сопоставимую часть полезной информации вы должны получить не от докладов, а от общения с людьми, кто приехал с проблемами похожими на ваши. Не тупите на кофебрейках, а общайтесь с как можно большим числом людей!
Сам Минск прекрасный город. Я почему-то ожидал “замороженного совка”. Во всяком случае такое впечатление остается от международной части аэропорта Минска. Но сам город выглядит смесью Санкт-Петербурга, сталинской Москвы и совсем не много “Совка”. При этом все аккуратно, не перегружено уплотнительной застройкой, много пространства и даже “совковые” дома выглядят прилично.
Организаторы обещали в следующем году провести конференцию на двух площадках в Москве и Минске, так что если у вас не выйдет приехать в Минск, то пробуйте прийти в Москве.
У меня тоже был доклад и совсем не про визуализацию, а про то, как мы делали scrum в аналитической команде. Поделюсь докладов в следующей статье.