Важность данных в динамическом ценообразовании
Традиционно ценообразование в розничной торговле устанавливалось на основе статичных ценовых правил, которые использовали ограниченное количество данных (например, структуру затрат, коэффициент конверсии и т.д.) При таком подходе огромное количество важных данных - как о покупках, так и не связанных с покупками - оставалось неиспользованным.
На сегодняшнем быстро меняющемся и высококонкурентном рынке розничных продаж становятся все популярнее стратегии динамического ценообразования, основанные на данных. Взрывной рост больших данных и заложенный в них потенциал для разработки подходов ИИ и машинного обучения к стратегиям ценообразования открыл новые возможности для интеллектуальных решений в области продаж и ценовой политики. Технология машинного обучения выводит динамическое ценообразование на новый уровень: можно обрабатывать большие массивы данных, учитывать различные факторы влияния для прогнозирования эффекта от изменения цен и делать это достаточно быстро.
Сегодня, благодаря искусственному интеллекту и машинному обучению, ритейлеры могут с большей легкостью получить полное представление о том, что делают конкуренты и покупатели в любой момент времени, а также лучше понять влияние и причины их покупательского поведения. Это позволяет разрабатывать новые, более обоснованные стратегии для повышения удовлетворенности клиентов и прибыльности компании.
Большие данные в розничной торговле
В связи с быстрым ростом числа покупок через Интернет, мобильные устройства и социальные сети произошел взрыв в объеме поступающих данных, что привело к появлению "больших данных". Изменения цен теперь происходят мгновенно, несколько раз в день для миллионов товаров во всей экосистеме онлайн, что составляет десятки миллионов ценовых решений по всему миру каждый день.
В секторе розничной торговли покупатели оставляют следы данных каждый раз, когда совершают покупки в Интернете. Кроме того, существуют и другие источники данных, такие как цены конкурентов, данные о погоде и внутренние данные компании, например, о маркетинговой деятельности, рекламных акциях и т.д.
Обычно большие данные делят на две основные категории:
Структурированные данные: этот тип данных включает имена, адреса, историю транзакций, программы лояльности и, в основном, любые другие данные, которые предполагают измерение в виде "количества".
Неструктурированные данные: к этому типу данных относятся отзывы о продукции, изображения, социальные лайки и упоминания, а также любые другие данные из социальных сетей.
Любой ритейлер или бренд, использующий динамическое ценообразование, зависит от данных, которые используются для принятия решений. В этой связи качество данных очень важно, поскольку от него зависит эффективность алгоритма, который будет использоваться для прогнозирования спроса и автоматизированных решений по ценообразованию.
Данные и алгоритмы динамического ценообразования
Ритейлеры могут оптимизировать свои цены для покупателей с помощью алгоритмов, анализируя доступные данные.
Можно выделить два типа алгоритмов, которые используются в ценообразовании:
Традиционные, основанные на правилах, алгоритмы
Логика этих алгоритмов запрограммирована явно. Они часто состоят из ряда правил "если/то", которые определяют цены на основе ряда влияющих факторов.
Алгоритмы на основе машинного обучения
Эти алгоритмы не запрограммированы в явном виде и предварительно обучаются на размеченном наборе данных, чтобы научиться делать прогноз о влиянии цены на продажи, выручку или прибыль. На основе этого прогноза можно проводить оптимизацию для достижения бизнес-целей. Далее алгоритм постоянно обучается на основе новых данных.
Ограничением традиционных алгоритмов является то, что они могут учитывать лишь заданное небольшое количество влияющих факторов (зачастую менее трех). Управление и мониторинг такого подхода, основанного на правилах, также требует достаточного количества времени и усилий. Напротив, используя большие данные в сочетании с подходом, основанным на машинном обучении, ритейлеры имеют больше возможностей для определения наиболее подходящей ценовой стратегии для своего бизнеса и могут запускать процессы на таких объемах данных, с которыми не смог бы справиться отдельный менеджер по ценообразованию.
Подход, основанный на машинном обучении, может рассчитать спрос на отдельные товары в ассортименте компании - что при работе с тысячами SKU является монументальной задачей - и автоматически учесть ряд влияющих факторов, как внутренних (например, уровень запасов, целевые даты продаж), так и внешних (данные конкурентов, временные и погодные факторы и т.д.).
Типы данных, используемых для оптимизации динамического ценообразования
Помимо "структурированных" и "неструктурированных" типов данных, упомянутых выше, при разработке оптимизации цен на основе машинного обучения важно использовать данные микро- и макроуровня. К ним относятся:
Данные микроуровня: внутренние данные, включая данные о продажах и транзакциях, основные данные о продукции, данные о затратах, исторические цены, маркетинговые данные и бизнес-стратегии.
Данные макроуровня: это данные внешнего рынка и влияющие факторы, такие как данные конкурентов, временные данные (например, день недели, сезон), и данные по местоположению (например, региональные данные, данные о погоде).
Внутренние данные (микроуровень)
Атрибуты продукта (или основные данные продукта) - это цифровое представление ассортимента розничной компании и важный инструмент для динамической оптимизации цен. Эти данные включают идентификатор продукта, возможные варианты базовых характеристик, текущую цену, рекомендуемую розничную цену (устанавливается производителем или региональным представительством бренда), нижний и верхний предел цены, сезонную принадлежность (например, зимний или летний товар), бренд, цвет, размер, уровень запасов, срок годности или целевую дату продаж и многое другое. Группировка этих атрибутов по категориям является важным способом использования данных такого типа. Часто моделям трудно учиться на данных об отдельных продуктах, поэтому важно иметь возможность их сегментации.
Уровни запасов - данные о текущем уровне запасов и общем предложении на рынке. Существующее предложение объединяется (через отслеживание запасов) с существующим спросом, что является ключевым фактором, определяющим, как программное обеспечение для динамического ценообразования рассчитывает оптимальные цены в соответствии с рынком.
Транзакционные данные включают все транзакции, проданные единицы, конверсии и историю цен. Сюда также входит информация о покупателях и затраты на производство или поиск поставщиков. Любое программное обеспечение для динамического ценообразования на основе машинного обучения нуждается в данных о продажах и транзакциях компании для расчета спроса на каждый продукт в вашем ассортименте. Это формирует основу для каждого ценового решения ИИ. Как минимум, необходима вся информация о продажах, например, какие товары были проданы по какой цене.
Дополнительная информация о сделках повышает качество прогнозирования ИИ и снова улучшает его результаты. Сюда могут входить товары, которые клиент просматривал, товары, которые он положил в свою корзину, товары, которые он удалил или отменил из своей корзины, товары, которые он сохранил или внес в список желаний, а также товары, которые он искал.
Внешние данные (макроуровень)
Данные о конкурентах могут включать такие элементы, как цены товаров, цена доставки, цена наборов, присутствие на маркетплейсах, отсутствие товара на складе, география, отзывы и рейтинги. Эти данные могут быть собраны с помощью парсинга (программное обеспечение, которое собирает информацию из общедоступных источников в сети Интернет). Предприятия становятся все более изощренными в попытках ограничить возможности своих конкурентов по сбору этих данных.
Дни недели оказывают влияние на потребительский спрос. В зависимости от бизнес-модели компании, они могут наблюдать рост или падение продаж в выходные. Стратегия динамического ценообразования может использовать эти данные и устанавливать цены на повышение или понижение в конкретные дни. Решения по оптимизации цен позволяют компаниям создавать индивидуальные временные рамки для точного внедрения разовых, постоянных или ограниченных по времени изменений цен.
Праздники повышают спрос на определенные товары, например, оберточную бумагу перед Новым годом или цветы на 8 марта, а также могут иметь глобальное влияние на продажи, например в Черную пятницу. Используя исторические данные о транзакциях, привязанные к праздничным сезонам, розничные торговцы могут точно определить, на какие товары в их ассортименте наблюдается повышенный спрос и когда. Эти данные помогают алгоритму динамического ценообразования прогнозировать спрос и устанавливать оптимальную цену на соответствующие товары.
Региональные тенденции Местные факторы и условия могут влиять на спрос в различных региональных или географических сегментах в зависимости от того, что происходит в их регионе. Например, в одном регионе может отмечаться какой-либо фестиваль или событие, что повышает спрос на определенные продукты. Возможность использовать данные для измерения этих региональных различий может помочь в создании ценовых стратегий и различий вплоть до регионального уровня, если это необходимо.
Погодные и сезонные данные Погода может влиять на продажи как в целом, так и определенных продуктов. Например, хорошая погода - это плохо для розничной торговли в Интернете, если на улице плохая погода, то люди будут оставаться дома и делать покупки в Интернете. С точки зрения продукта, когда температура повышается, потребители начинают искать стоячие вентиляторы и с большей вероятностью покупают их (например, повышается вероятность конверсии). Еще один случай, когда данные о погоде могут оказаться ценными, - приближение зимы. Когда температура понижается, объем поиска лыж увеличивается. Таким образом, данные о температуре и прогнозы погоды могут помочь в прогнозировании спроса и соответствующей оптимизации цен.
Как данные влияют на алгоритм динамического ценообразования?
Количество данных
Подходы машинного обучения к динамическому ценообразованию проявляют себя наилучшим образом при обучении на больших массивах данных. Чем больше данных доступно, тем лучше модель машинного обучения может быть обучена делать точные прогнозы. Алгоритм машинного обучения учится на основе прошлых изменений цен и влияния этих изменений на продажи. Поэтому желательно иметь данные хотя бы о 2-3 изменениях цен на каждый продукт со значительным объемом соответствующих продаж.
Качество данных
Качество собранных данных напрямую влияет на модель машинного обучения, построенную для динамического ценообразования. Чем выше качество данных, тем проще их использовать. Критерии:
Полнота: в лучшем случае, данные не имеют пропущенных наблюдений; таблицы данных соответствуют друг другу (например, можно легко сопоставить атрибуты товара с данными о транзакциях).
Чистота: ошибки, такие как отсутствие отслеживания продаж, неверные данные о продукте или плохо введенные числовые значения, не оказывают негативного влияния на общий набор данных.
Согласованность: при рассмотрении различных срезов данных прослеживается корреляция - например, прибыль может быть четко рассчитана на основе выручки и затрат.
Управление большими и сложными массивами данных при динамическом ценообразовании
Сбор данных
Когда речь идет о создании специализированного решения для динамического ценообразования на основе машинного обучения, целевые внутренние данные собираются и передаются в модель на ежедневной основе.
Что касается внешних данных, то они собираются на основе стратегии и потребностей бизнеса. Например, если компания продает солнцезащитные очки, для нее особенно важно регулярно отслеживать данные прогноза погоды. Для таких типов данных используются открытые API, позволяющие ежедневно собирать эту информацию.
Данные о конкурентах собираются разными способами, обычно с помощью специализированных веб-сервисов или собственных парсеров.
Обработка данных
После сбора данных их необходимо очистить от ошибок и подготовить к дальнейшей обработке. Этот этап часто является самым сложным, поскольку требуется объединить данные разных форматов из разных источников.
После того как данные собраны и прошли процесс первичной очистки, они хранятся в отдельных таблицах, которые затем шаг за шагом объединяются для дальнейшей подготовки данных для подачи в алгоритм. Этими подготовительными мероприятиями обычно управляют через облачное хранилище данных.
Ввод данных
На основе подготовленных данных создаются признаки (фичи) - входные переменные для моделей машинного обучения, - которые предназначены для конкретных компаний и учитывают их уникальные стратегические потребности.
Например, у компаний могут периодически заканчиваться запасы важных продуктов. Поэтому для этих конкретных продуктов важно, чтобы модель машинного обучения знала, есть ли они в наличии или нет. Или конкретные товары могут часто приобретаться в наборе – это тоже полезный признак.
Что в итоге?
При наличии огромного ассортимента и всех сопутствующих данных сегодня компаниям слишком дорого и долго анализировать тысячи продуктов вручную. Используя динамическую оптимизацию цен на основе машинного обучения, эти системы могут выявить узкие сегменты, определить, что создает ценность для каждого из них, и сопоставить это с историческими данными о транзакциях. Это позволяет компаниям устанавливать оптимальные цены для кластеров продуктов и сегментов на основе данных. Автоматизация также значительно упрощает воспроизведение и настройку анализов, поэтому нет необходимости каждый раз начинать с нуля, поскольку алгоритм ценообразования учится и адаптируется к данным с течением времени.
klimkinMD
Про что это Вы? Кто, по-Вашему, мгновенно (!) меняет цены несколько раз в день? Или имеются в виду все возможные компании?