Перед тем как написать эту статью, я почитала материалы в интернете и заметила, что чаще всего о задачах аналитиков данных рассказывают через призму инструментов. Мне кажется, это не совсем правильный подход — как будто анализировать данные можно только в Python, а строить графики исключительно в Tableau. Конечно, это не так.
В своём рассказе я буду отталкиваться от бизнес-потребностей. Ведь аналитик — это не тот, кто просто строит красивые графики или проводит исследования ради самого исследования, а тот, кто помогает бизнесу принимать обоснованные решения на основе данных. А какой инструмент он выберет, во многом зависит от того, какие задачи перед ним ставит компания и что больше подходит для решения этих задач.
Дисклеймер: я в основном работала с интернет-рекламой, сайтами и геймдевом. Мой опыт связан с интернет-продуктами, и многое из того, что я расскажу, будет релевантным именно для этих сфер. При этом я ничего не понимаю в банковской сфере, и, возможно, там типовые задачи выглядят по-другому.
Проверка идеи
Первый этап, с которого всё начинается, — это этап идеи. Бизнесу приходит мысль, что определённая гипотеза может сработать, и здесь аналитик сразу включается в процесс.
Возьмём пример интернет-магазина: продуктовый менеджер думает, что пользователи часто отваливаются после того, как положили товар в корзину. Возникает идея — предложить скидку, чтобы подтолкнуть людей к завершению покупки. На первый взгляд, решение выглядит логичным, но прежде чем двигаться дальше, важно понять, действительно ли проблема существует.
Первая задача аналитика данных — убедиться, что всё это не булшит. Это типичный пример ad-hoc запроса или исследования, когда нужно оперативно собрать данные под конкретную бизнес-задачу, чтобы подтвердить или опровергнуть гипотезу.
Что может сделать аналитик в такой ситуации? Для начала собрать данные о конверсии — сколько пользователей действительно отваливаются после того, как положили товар в корзину, сколько из них завершает покупку и как быстро это происходит. Может оказаться, что проблема надуманная: такой паттерн есть у самого менеджера, поэтому ему кажется, что все так делают.
Если данные показывают, что 95% пользователей всё-таки покупают товар, а среднее время между добавлением в корзину и покупкой — меньше минуты, значит, никакой проблемы нет — и можно не тратить ресурсы на дополнительные стимулы.
Может быть и другой сценарий: данные подтверждают, что только 20% пользователей завершают покупку, а время между добавлением товара в корзину и оплатой превышает 10 минут. Тогда аналитик помогает бизнесу не только подтвердить существование проблемы, но и предлагает подходящие метрики для её решения. Например, он может проанализировать временные интервалы между добавлением товара в корзину и покупкой или этапы, где пользователи чаще всего отваливаются.
A/B-тесты
Допустим, мы подтвердили проблему: действительно, пользователи часто отваливаются после добавления товара в корзину. Заказчик рад, проблема выявлена, и он предлагает решение: «Просто сделаем баннер “Купи в ближайшие 5 минут и получишь скидку 5%”. Или лучше 10%, чтобы точно купили». Здесь мы переходим к постоянной задаче аналитика — он должен стать «отрезвляющим человеком», который напоминает, что не всё так просто.
Иногда приходится говорить: «Стоп, подождите. Чтобы понять, как это повлияет на результат, нужно запустить A/B-тест». Это супертиповая задача, которая состоит из нескольких этапов.
Дизайн A/B-теста. В первую очередь нужно создать грамотный дизайн эксперимента, чтобы его результаты были корректными и достоверными. Итак, вы решаете проверить, поможет ли баннер с предложением скидки завершить покупку. Для этого делим аудиторию на две группы: одной группе вы показываете баннер со скидкой, а другой — нет. Один и тот же пользователь не должен в разные моменты находиться в обеих группах: если в первый раз человек увидит скидку, а потом вернётся на сайт и не увидит — это может повлиять на его поведение, приведёт к путанице и вызовет негатив.
-
Наблюдение за A/B-тестом. Вы расписали дизайн теста, заказчик дал зелёный свет, начинается тестирование. Теперь важно следить за тем, чтобы всё шло правильно. Во-первых, необходимо удостовериться, что тест запущен. Это может показаться очевидным, но иногда тест действительно забывают запустить или запускают некорректно. Поэтому первое — проверяем корректность запуска A/B-теста.
Во-вторых, следим за тем, чтобы группы наполнялись так, как задумано. И наконец, в-третьих, наблюдаем за поведением пользователей: если в одной группе вдруг ноль покупок, а в другой — 1000, это может указывать на сбой. Стоит перепроверить.
Анализ результатов. Когда прошло достаточно времени для сбора данных, наступает самая интересная часть — анализ результатов. Аналитик должен дать рекомендации, помочь бизнесу принять решение: оставляем изменения и выкатываем их на всех пользователей, откатываем назад или проводим дополнительный эксперимент.
Принять это решение не всегда просто. Если баннер со скидкой не дал ожидаемых результатов и уменьшил выгоду компании, это не значит, что нужно убрать его совсем. В такой ситуации аналитик может предложить другой подход, например: «Закажи, пока товар не закончился». И снова запустить A/B-тест.
Создание дашбордов
Предположим, что наш баннер со скидкой всё-таки показал хорошие результаты: люди чаще завершали покупки, и это компенсировало нам 10% скидки. Мы решили выкатить такой баннер. Что происходит дальше? После теста и анализа результатов мы можем выявить точки роста и определить метрики, за которыми стоит следить в разных разрезах.
Возможно, мы обнаружили, что разные группы пользователей ведут себя по-разному: например, люди от 18 до 30 лет охотно откликаются на предложение, а люди постарше — чаще игнорируют его. Это может навести на мысль, что пора делать персонализированные предложения для каждой аудитории. Или сейчас все привыкли к скидкам с ограниченным сроком (тайм-прессингу), но со временем эта модель может начать раздражать пользователей и перестанет работать — придётся придумывать новые стимулы.
И вот здесь появляется третья задача — создание дашбордов. Иногда это инициатива самого аналитика, иногда — заказчика. Если заказчик постоянно просит одни и те же данные, конечно, можно каждый раз делать ad-hoc запросы через SQL. Но в какой-то момент это просто начинает надоедать, и ты думаешь: «Господи, давайте я уже сделаю дашборд, чтобы вы могли сами смотреть все эти метрики». Или заказчик может прямо попросить: «Хочу видеть определённые показатели каждый день».
Аналитик вместе с заказчиком определяет цели дашборда и выбирает метрики, а затем собирает дашборд с помощью инструментов, которыми пользуются в компании. Обычно это BI-инструменты: Database, Tableau, Power BI.
А дальше круг замыкается. Вот у нас есть дашборд, заказчик в нём ковыряется и вдруг замечает, что конверсия на iOS и Android отличается. Он удивляется и говорит: «Блин, как странно», и ставит задачу аналитику: «Исследуй воронку отдельно для iOS и Android, сравни их». Аналитик разбирается, находит проблему, снова запускает A/B-тест и делает анализ.
Ad-hoc задачи
Иногда возникают менее типовые, но всё же важные задачи. Например, что-то сломалось на сайте: пользователи добавили товары в корзину, а они внезапно пропали. Мы замечаем это по дашборду — видим, что количество покупок резко упало.
Заказчик прибегает с вопросом: «Почему конверсия снизилась?» Аналитик начинает разбираться, смотрит логи и видит, что корзины обнулились. В итоге он предлагает решение: «Давайте выгрузим список пользователей, которые столкнулись с этой ошибкой, снова наполним их корзины товарами и отправим им письма со скидкой, чтобы они вернулись и завершили покупку». Проблему можно решить разными способами, но чаще всего это задача для аналитика — его просят выгрузить данные.
Когда нужно делать ad-hoc запросы или выгрузки, чаще всего хватает SQL— поэтому я всегда говорю, что это важный навык. Если задача посложнее, можно подключить ещё и Python для обработки данных.
Новичку придётся столкнуться с большинством задач из этой статьи. Разница лишь в том, что поначалу уровень ответственности и сложности будет ниже. Например, начинающему специалисту могут доверить тестирование цвета кнопки: аналитик проведёт A/B-тест и сделает выводы — это типовая задача, которая не требует обширного опыта в анализе данных.
А вот обновление ценовой политики или программы лояльности — это уже про комплексные изменения. Нужен опыт, чтобы проанализировать их влияние на продажи, удержание клиентов и прибыль компании. Это задачка для синьора.
В любом случае новичков никогда не оставляют одних — всегда есть наставник, который направляет и даёт советы. Но чем больше инициативы и интереса вы проявите, тем быстрее начнёте брать на себя более серьёзные задачи.
Комментарии (6)
NikolayRussia
18.11.2024 07:31Добрый день!
Допустим ли этически такой А/В-тест, когда одним пользователям дается скидка на товар, а другим при прочих равных условиях - нет? Это как прийти в магазин за хлебом, и одним на кассе считают 35 рублей за батон нарезной нарезанный, а другим 40 рублей. Да, по идее это нужно проверять А/В-тестом, такой баннер, где "Купите сейчас и будет вам скидка". Но ведь:
Пользователи могут общаться между собой, покупать одновременно с разных устройств. Они узнают об этом, напишут в техподдержку, там принесут извинения, чтобы "замять", дадут скидку пользователям, м.б. накинут бонусов сверху.
Это увидят компании-конкуренты. И подадут жалобу на Ценовую дискриминацию.
Давайте спросим у GigaChat, что это такое (можно задать тот же вопрос YandexGPT).
Ценовая дискриминация – это практика установления различных цен для разных потребителей на один и тот же товар или услугу без учета различий в издержках производства. В России такая практика регулируется антимонопольным законодательством, а именно Федеральным законом №135-ФЗ «О защите конкуренции».
Ответственность за ценовую дискриминацию может наступать в соответствии со следующими положениями:
Запрет на злоупотребление доминирующим положением. Если компания занимает доминирующее положение на рынке (то есть имеет долю рынка свыше 35%), она обязана соблюдать правила добросовестной конкуренции. Ценовая дискриминация может рассматриваться как нарушение этого положения, так как ведет к ущемлению интересов других участников рынка или потребителей.
Антимонопольный контроль. Федеральная антимонопольная служба (ФАС) контролирует соблюдение законодательства о конкуренции. При выявлении случаев ценовой дискриминации ФАС может наложить штрафы на компании-нарушители и обязать их прекратить такую практику.
Штрафы. За нарушения антимонопольного законодательства предусмотрены административные штрафы. Размер штрафа зависит от оборота компании и характера нарушения. Например, штраф может составлять до 15% от выручки нарушителя на соответствующем товарном рынке.
Иски потребителей. Потребители также могут обратиться в суд с исками против компаний, практикующих ценовую дискриминацию. Суд может обязать компанию возместить ущерб потребителям и выплатить компенсацию морального вреда.
Таким образом, ценовая дискриминация является нарушением антимонопольного законодательства в России и влечет за собой серьезные последствия для компаний-нарушителей.
Спасибо за статью и успехов!
P.S.: в статье от Яндекс-Практикума в списке BI-инструментов, возможно, стоит упомянуть Yandex DataLens.
wapskill
Сейчас на некоторые junior позиции уже требуют опыт работы с ETL/ELT, DWH и т.д. Что думаете по этому поводу? Хотя мне кажется это обязанности дата инженера
kalesik
Самая частая причина ошибки "Почему цифры не сходятся" - это как раз расписание ETL/ELT или некорректный сбор данных в скрипте. Дата-инженер сделает только так, как вы ему поставите задачу, а вот сформировать логику, чтобы с точки зрения бизнеса, было все корректно и на ваши цифры можно равняться другим - тут и пригодится опыт работы с ETL/ELT.
Darina_Kukhtina Автор
Спасибо большое за вопрос!
Действительно, это больше для дата инженера. Однако, в небольших компаниях аналитик данных может выполнять и эту роль тоже)