В данной статье, состоящей из трёх частей, мы поделимся нашим исследованием о метриках, на которые стоит ориентироваться для увеличения долгосрочной выручки онлайн-магазина.
В первой части обсудим проблемы, возникающие при оценке долгосрочной ценности пользователя онлайн-магазина, и как можно решить их с помощью прокси-метрик. Также расскажем, как компании из разных областей ищут подобные метрики, и поделимся собственным списком разработанных метрик, которые применимы в e-commerce.
Во второй части мы предоставим техническое описание. Как метрики работают, смогут ли их использовать магазины с разными категориями товаров, как можно отобрать полезные прокси-метрики из множества вариантов, и насколько хорошо они предсказывают долгосрочную ценность пользователей.
В третьей части обсудим бизнес-интерпретацию полученных метрик и как можно использовать их для оптимизации долгосрочной ценности пользователей, а значит и долгосрочной выручки онлайн-магазина.
Что такое прокси-метрики и зачем они нужны
Одна из ключевых метрик, которую оптимизирует большинство компаний (в том числе интернет-магазины) – это LTV, т.е. показатель прибыли, которую получает бизнес за всё время работы с клиентом.
Знание LTV позволяет прогнозировать выручку, планировать затраты на рекламу, оценивать окупаемость инвестиций, вычислять самых лояльных посетителей, сегментировать аудиторию по ценности и т.д. Соответственно, это очень важный показатель, и когда планируется какое-либо значимое изменение, важно знать, как оно повлияет на LTV.
То, как изменение повлияло на показатель, оценивают по отношению к другому изменению или его отсутствию. Обычно для этого проводится проверка гипотез с помощью тестов. Если при этом используются долгосрочные показатели – такие, как фактический LTV, мы сталкиваемся со следующими проблемами:
Проверка гипотез занимает больше времени и, как следствие, изменения долго внедряются;
Если проводится сразу несколько тестов, не всегда понятно, какое именно изменение в итоге увеличило или уменьшило LTV;
При длительном тестировании нужно всё время поддерживать и рассчитывать все тестируемые версии алгоритмов;
Онлайн-магазины часто вносят не связанные с гипотезой изменения, которые с высокой вероятностью затрагивают поведение теста;
Чем дольше проводится тест, тем чаще возникают ошибки в работе магазина, которые делают результат недостоверным;
В e-commerce уникального пользователя обычно идентифицируют с помощью cookie-файлов, которые часто теряются при длительном тесте. Например, в этой статье описан эксперимент Facebook, где на одного пользователя приходилось несколько разных cookie – они попадали в разные сегменты теста и усложняли выявление реального эффекта от изменения.
Из-за перечисленных проблем тестировать улучшения, ориентируясь на изменения фактического LTV, практически невозможно. В качестве решения мы предлагаем использовать прокси-метрики LTV, на обнаружение изменений в которых требуется гораздо меньше времени.
Прокси-метрика — это косвенная мера целевой метрики, с которой она сильно коррелирует. По изменению в прокси-метрике мы как минимум должны понять направление изменения целевой метрики. Например, ВВП на душу населения может быть прокси-метрикой качества жизни в некотором регионе.
Часто наши клиенты (интернет-магазины) выбирают в качестве прокси-метрик LTV признаки, связанные с заказами: например, конверсию в покупателя, среднее количество заказов на пользователя, средний чек, среднюю выручку на пользователя в прошлом и т.д. Эти признаки коррелируют с будущим LTV, так как если пользователь совершил покупку в прошлом, то вероятность повторной покупки в будущем увеличивается.
Но остается открытым важный вопрос: нет ли прокси-метрик более полезных для оценки влияния на будущий LTV текущих изменений в магазине? Мы решили это исследовать.
Как выбирают и используют прокси-метрики вне E-commerce
С помощью прокси-метрик формируется общий критерий оценки изменений – OEC (overall evaluation criterion, подробнее – в статье от Microsoft). Это количественный показатель цели эксперимента, который должен отражать бизнес-цели компании – например, быть связанным с LTV. Он нужен, чтобы автоматизировать и формализовать процесс принятия решения о внедрении тех или иных изменений. При формировании OEC метрики всех целей эксперимента сводят к единому показателю.
Современная проблематика онлайн-экспериментов хорошо освещена в обзорной статье от сотрудников Microsoft, Google, Facebook, LinkedIn, AirBnb, Netflix, Amazon, Yandex, Uber, Twitter. В ней рассмотрены проблемы, возникающие при оценке долгосрочного эффекта, и перечислены свойства хороших прокси-метрик для OEC:
Прокси-метрики должны быть связаны с долгосрочным целевым показателем, например, с LTV. Как минимум, должно быть понятно, в какую сторону изменится показатель при изменении метрик;
Хорошие прокси-метрики сложно улучшить, делая «неправильные» вещи. Например, в YouTube вместо конверсии в клики (CTR) используют метрику long CTR, где клик засчитывается, только если пользователь просмотрел существенную часть видео. Это связано с тем, что CTR можно увеличить, используя «кликбейт» в названии и вводя пользователя в заблуждение о содержании ролика, что в итоге снижает удовлетворенность сервисом;
Прокси-метрики должны быть чувствительны к изменениям, которые влияют на долгосрочный целевой показатель. Например, пользователи отдельного типа устройств могут существенно влиять на долгосрочный целевой показатель, но увеличить эту долю довольно сложно;
Вычисление прокси-метрик не требует много ресурсов. К примеру, в качестве таких метрик не подойдут опросы общественного мнения;
Критерий, сформированный на основе прокси-метрик, может учитывать новые сценарии. Пример негибкого критерия — в магазине продавали телевизоры и взяли метрику, основанную на диагонали экрана. Затем в ассортименте появились пылесосы, к которым эта метрика не применима, поэтому ее нельзя использовать для учёта нового вида товара.
Найти подходящие прокси-метрики для OEC не всегда просто. В материале Microsoft приведен пример, как в поисковой системе Bing от Microsoft выбрали интуитивно понятные метрики для оптимизации: количество запросов к поиску и выручку. В какой-то момент возник баг, и поисковые выдачи стали работать явно хуже – пользователям показывали по 10 рекламных строк за выдачу в начале списка. Чтобы найти нужный результат, людям приходилось делать больше запросов, соответственно, рекламы тоже стало больше, а с ней увеличилась и выручка.
Данные изменения краткосрочно увеличили количество запросов на одного пользователя на 10%, а выручку – на 30%, но если бы их внедрили, это уменьшило бы лояльность пользователей и те в конечном счете ушли бы к конкурентам. Этот пример наглядно показывает, как краткосрочные показатели могут расходиться с долгосрочными целями компании.
Подобное несложно сделать и в интернет-магазине — увеличить все цены, что, возможно, приведет к увеличению среднего чека и выручки, но в долгосрочной перспективе пользователи предпочтут конкурентов.
Еще одним минусом использования признаков о заказах в качестве прокси-метрики является их слабая чувствительность, так как часто из всего потока пользователей заказы совершает малая его часть – обычно до 5%. Поэтому, чтобы зафиксировать значимые изменения по этим метрикам, нужно проводить длительные тесты.
Существует два популярных способа, к которым компании обращаются для поиска полезных прокси-метрик долгосрочного целевого показателя:
Использовать знания о предметной области и бизнесе. Например, поисковые системы Bing и Google таким образом определили, что для них долгосрочным целевым показателем является удовлетворенность пользователя сервисом, а прокси-метриками – количество сеансов и число поисковых запросов за один сеанс. Мало запросов за один сеанс и много самих сеансов означают, что пользователь быстро находит нужный ответ и регулярно возвращается к поисковику.
Использовать алгоритмы машинного обучения, чтобы выявить признаки, которые будут хорошо предсказывать долгосрочную метрику. Например, в этой статье описано, как Netflix научился предсказывать, сохранит ли пользователь подписку в течение следующего месяца или нет (retention). Они обнаружили сильную корреляцию между retention и временем, которое пользователь тратит на просмотр контента (мера вовлеченности пользователя) и использовали меру вовлеченности пользователя в качестве прокси-метрики для retention. Примерно так же свои прокси-метрики вывели в LinkedIn и построили модель предсказания LTV.
Эти два способа хорошо комбинируются – можно найти ряд кандидатов в прокси-метрики с помощью машинного обучения и отобрать только те, которые имеют смысл для бизнеса.
К каким прокси-метрикам мы пришли
Чтобы найти кандидатов в прокси-метрики к LTV мы использовали алгоритмы машинного обучения. Далее мы выбрали среди них наиболее полезные и понятные бизнесу. В своем исследовании мы опирались на данные 27 магазинов с различными категориями товаров. Такое разнообразие позволило найти наиболее универсальные и полезные прокси-метрики, которые должны работать на многих магазинах.
Чтобы предсказать LTV этого набора магазинов, мы использовали следующие метрики:
Количество заказов;
Факт подписки пользователя;
Давность последнего посещения магазина;
Количество просмотренных разных товаров;
Длительность взаимодействия пользователя с магазином;
Сколько раз посетитель пользовался внутренним поиском магазина;
Количество добавленных в корзину товаров.
На графике – результат работы модели, основанной на перечисленных выше прокси-метриках (пример одного из магазинов).
Мы разбили пользователей на три сегмента в зависимости от их действий в прошлом:
Покупали
Добавляли товары в корзину, но не покупали
Ничего не добавляли в корзину
Затем в каждом сегменте разбили пользователей на группы по вероятности покупки в соответствии с моделью. В каждой группе показано число и процент пользователей, которые совершили покупку в следующие полгода. Как мы видим, модель умеет выделять более склонных к покупке в будущем посетителей даже среди тех, кто ничего не покупал и не добавлял в корзину.
В следующих частях мы подробно расскажем, как отбирали прокси-метрики из обширного списка кандидатов, и насколько точно они помогают предсказать LTV. Также мы опишем технические детали исследования.
Авторы: Айбатов Серик, Носков Артем, аналитики RetailRocket
mogrein
Интересно почему вы выбрали именно такие метрики и как они влияют.
Метрика влияет на всех пользователей или только тех кто хотя бы раз потратил бонусы?
Именно товаров или категорий тоже? Смотрели насколько пользователи придерживаются любимых категорий товаров?
В какую сторону это работает? Больше ищет=больше заинтересован или больше ищет=больше времени на передумать? Есть ли разница в остальных метриках для пользователей делающих регулярные или импульсивные покупки и пользователей которые долго выбирают?
Ну и наверно главный вопрос который у меня возникал по ходу чтения - используются ли подобные модели для дальнейшего прогнозирования притока/оттока лояльных пользователей и выручки, или они применяются только постфактум для оценки эффективности бонусных и рекламных компаний?
sxwat
Мы выбрали такие метрики после анализа большого числа альтернативных метрик, вся следующая часть статьи будет как раз посвящена описанию процесса отбора этих метрик. Но, если кратко, то выбирали метрики по способности предсказать LTV, чтобы они не коррелировали друг с другом, были стабильны во времени и имели как-то смысл для бизнеса.
Факт подписки - в нашем случае это просто факт того, что пользователь передал свой email интернет-магазину, без информации об их дальнейшем взаимодействии. Такой вариант более универсален.
Смотрели разные вариации этой метрики, в том числе и число разных категорий, с которыми взаимодействовал пользователь. Для одного магазина может быть полезнее большое число разных просмотренных товаров (например, у магазинов с 1-5 категориями товаров), для другого полезнее число разных просмотренных категорий. В любом случае эти метрики на всех магазинах оказались сильно скоррелированы, поэтому нет большой разницы что именно использовать. Насколько пользователи придерживаются "любимой категории" мы подробно не смотрели, но отметили, что есть множество пользователей в магазинах, которые смотрят очень много категорий.
Чем дольше пользователь взаимодействует с магазином, тем лучше для магазина. Обычно это означает, что пользователь заходит на сайт магазина с некоторой регулярностью, например, раз в месяц, главное тут то, что пользователь возвращается на этот сайт. Возвращаемость вообще очень важная метрика не только в e-commerce, обычно чем выше тем лучше. Мы не анализировали отдельно пользователей, которые быстро покупают и которые долго бродят по сайту перед покупкой. Но долгосрочно те, кто долго бродят по сайту перед покупкой лучше, так как они посмотрят больше разных товаров, лучше узнают магазин и с большей вероятностью верутся.
Насколько нам известно, подобные модели используют для прогнозирования будущей выручки, т.е. имея модель LTV, онлайн-магазин может точнее планировать свои финансы с учётом той выручки, которую они получат с текущей клиентской базы. Аналогично можно предсказывать какая доля пользователей уйдет в отток и что можно сделать с теми, у кого вероятность оттока высока (например предложить индивидуальную скидку/дать промокод).
Но цель статьи другая - найти способ оценки долгосрочного эффекта от внедряемого изменения в онлайн-магазине. И наблюдение за прокси-метриками помогают с решением этой задачи.