Однажды в ходе рабочей сессии возник вопрос: а какие позиции в ассортименте дают нам приток новых клиентов? Какие категории, подкатегории, бренды?

Задача пришла ко мне (аналитику), со словами: "что мы можем здесь посчитать?"

Контекст:

Работаю я в розничной компании «Спорт‑Марафон», которая торгует топовой спортивной и туристической экипировкой.

Времена для импорта сложные, и риск ошибки повышается. Поэтому тщательно планируем наш ассортимент, оптимизируем и размышляем.

Кого позвать?

Начинаю разбираться.

Сначала делаю более строгую формулировку вопроса: можно ли утверждать, что какие-то категории товаров и/или брендов активнее приводят к нам новых покупателей или нет? Если да, то какие?

Следовательно, основной подход: сравнить покупки у новых покупателей и у постоянных. Попытаться найти различия.

Любых новых клиентов или не любых? 

Из недавней работы по сегментации (расскажу как-нибудь в другой раз) у меня есть подтвержденные данные, что не все клиенты одинаково прибыльны. 

Значит, первый параметр: уровень прибыльности клиента. От какой суммы должна быть наценка в рублях на его покупках. 


Далее нужно выделить новых: первая покупка, вроде просто. 

Но есть нюанс: человек может вернуться через несколько лет. А значит либо надо проверять с момента основания магазина (таких данных нет), либо взять момент отсечки несколько лет назад и пойти на компромисс.

Ранее я получил данные о распределении периода времени между первой и второй покупками. 

Поэтому выбираю такой период, чтобы число ошибочно идентифицированных “новичков” было невелико (большинство тех, кто совершил повторную покупку, укладывается в этот период).

Первая прикидка в расчетах показала, что пошел сильный перекос в дорогие товары. 

Тут я понял, что поскольку многие совершают только одну покупку, то в список новичков вошло много единоразовых покупателей с большим чеком.

Так не пойдет: смысл найти тех, кто и дальше покупает.

Ввожу ограничение (которое можно регулировать в дашборде) по числу повторных покупок (точно больше 1).

Теперь «перспективный новичок» (ПН) выглядит так: 

  • приносит в год маржу N рублей или более, 

  • Не отмечен в базе покупателей до первой покупки

  • совершил не менее 3 (к примеру) покупок (я считаю покупко‑дни, об этом тоже напишу подробнее). 

Нахожу дату его первой покупки в Спорт-Марафоне и изучаю его корзину.

Там столько всего интересного…

Изучать корзину интересно, но не у тысяч новичков.

Рассчитываю affinity как отношение долей покупок за период у ПН к долям покупок у всех покупателей. Чем показатель >1, тем характернее, что этот товар привлек нам нового покупателя. 

Чем < 1 тем товар интереснее нашему постоянному покупателю.

Доли считаю от сумм продаж в рублях, а не штуках.

Почему в рублях? Потому что в штуках мы получаем очень сильный перекос из-за специфики товаров в разных категориях. Например, динамические веревки для скалолазания продаются по метрам (и 1 метр это 1 единица товара), а горные лыжи только парой, и это тоже одна единица товара. Одну продать не сможем, но сможем продать сплитборд. Это когда вверх на двух лыжах, а вниз на одном сноуборде.

Я уже знаю, что обсуждения у нас проходят активно, коллеги стараются посмотреть на проблему с разных сторон, поэтому готовлю дашборд сразу на нескольких уровнях:

  1. Общая структура по категориям в эффектном treemap с цветовой кодировкой генераторов новичков и потребителей новичков.

  2. Добавляю настраиваемые фильтры: таблица по категориям - подкатегориям и брендам. Вывожу сразу и affinity, и маржу на этом уровне. 

  3. Маржа очень важна, потому что чем меньше продажи, тем вероятнее случайные выбросы.

Вторая таблица строится наоборот: от бренда к категории. Тут уже скорее специфика закупок. 

Часто удобнее и эффективнее покупать широкий ассортимент у одного бренда. К тому же так мы видим силу бренда. А заглянув от бренда на уровень категорий, можем проверить, насколько эта сила стабильна.

Дополнительно в дашборде ставлю параметры для “перспективного новичка” сколько покупко-дней, какая сумма маржи за год. При желании можно быстро поменять и исследовать дальше. 

Так выглядит общий дашборд

Вот, к примеру, как меняется treemap категорий при переходе от 3 покупко-дней к 2м.

Революции не происходит. И это очень хорошо, потому что в противном случае пришлось бы задуматься о случайности результатов, а здесь мы видим, что тенденции стабильны. 

Но 3 покупки уже немного сглаживают показатель. 

Здесь видно, что две главные категории имеют разные свойства: одна генерит новых, а другая пользуется потоком. 

Также для оптимизации таблиц ставлю минимальное значение для суммарных продаж и наценки по товарам.

При анализе результатов я заглянул внутрь каждой категории.

Как правило, там находились свои генераторы новичков. И это тоже важно было учесть.

Также нашлось некоторое количество позиций, которые имели очень высокий индекс, но в силу небольших объемов остается неясным: это действительно товар-завлекалочка или ошибка маленького объема.

Им нужно уделить больше внимания уже на качественном анализе и решить, смогут ли они нам помочь. 

Я всё ловлю на лету, но что конкретно ты имела в виду?

Были общие выводы?

ДА 

Во-первых, прослеживается разделение на трафикогенерирующие категории и трафикопотребляющие (это когда категория скорее всего пользуется уже существующим потоком магазина).

Во-вторых: дорогие известные западные бренды по-прежнему очень привлекательны, и за ними “гоняется” покупатель.

Несмотря на активизацию китайских марок на российском рынке (уже во многих сегментах), на данный момент они - товары трафикопотребляющие. Когда ехал за австрийским брендом, но в силу обстоятельств купил китайский. 

Российские бренды (кто не в курсе, есть несколько действительно крутых марок в беговой и туристической экипировке) скорее середнячки. Они не выделяются ни в одну из сторон.

Есть ли у подхода недостатки? Конечно есть.

  1. Влияние объемов продаж. Довольно часто большие объемы тянут значения к 1, а маленькие к экстремальным значениям.

  2. Специфика поставок играет свою роль. В сложившихся обстоятельствах невозможно привезти все коллекции в полном объеме строго к началу сезона. Поэтому в один момент ассортимент может быть одним, а через месяц один бренд почти закончится, но приедет новый. И новичок будет выбирать из наличия (но может и подождать).

  3. Первая покупка — это все позиции из чеков первого покупко‑дня. Я не считаю ни по времени, ни по порядку товаров в чеке. Поэтому, что именно из чека было реальным драйвером, а что купили заодно не ясно.

  4. Есть «неопределенная» группа: те, кто совершили первую покупку, но еще не совершили вторую. Мы не можем однозначно сказать, что они не станут постоянными покупателями. Мы точно знаем, что они пока не стали. Поэтому как вариант: исключить их из расчетов, но с другой стороны — это довольно значимая часть. А чем больше исключений, тем более искусственные данные и неточные выводы.

  5. Можно было бы задуматься о статистической значимости различий. Но, на мой взгляд, это избыточно. Ассортимент очень большой, смотреть комбинации практически нереально. При новых закупках учитывают не только статус драйвера, но и оборачиваемость, текущие запасы, наценку и тому подобное Таким образом, данная методика скорее поиск точек роста, которые требуют проверки на полке.

  6. Наверняка вы заметили что‑то еще. Пишите, обсудим.

Комментарии (0)