В 2022 году в Hoff Tech была сформирована команда для реализации проекта по ценообразованию гипермаркетов Hoff. Все это проходило в рамках цифровой трансформации, и в команду были включены эксперты по ценообразованию, бизнес-анализу, программисты и специалисты по data science.
Для эффективного управления ценой необходимо понимать три вещи:
какие цели ставит перед собой компания и как она их планирует достигать, используя стратегии ценообразования;
какова себестоимость нашего товара;
по каким ценам продают аналогичный товар наши конкуренты.
Так как Hoff уже много лет работает на рынке мебели и товаров для дома, его специалисты прекрасно ориентируются в рыночных тенденциях. Управленческая аналитика компании находится на весьма высоком уровне развития, поэтому первый и второй пункты были для нас понятны. А информации о конкурентном окружении у нас было мало. Ценовым мониторингом было покрыто только около 10% нашего ассортимента, и процесс мониторинга цен конкурентов был реализован в ручном режиме.
Ситуация осложнялась еще и тем, что мы не смогли воспользоваться существующими на рынке сервисами для автоматизации процесса подбора товаров-аналогов. Сервисы, которые мы нашли, неплохо справляются в секторах продуктов питания и FMCG — в них все товары похожи. А вот в сегменте мебели и товаров для дома продукция зачастую различается не только потребительскими свойствами, но и дизайном, поэтому существующие решения не могли ее анализировать. Мы в Hoff Tech решили разработать свое решение.
Как подобрать аналог товара конкурента?
Для начала, чтобы понять, как подбирать аналоги товаров Hoff у конкурентов, мы решили классифицировать основные трудности, с которыми мы сталкиваемся в процессе сопоставления.
В результате сформулировали задачи, которые нужно решить в процессе матчинга товаров.
Уметь различать товары, которые близки по потребительским свойствам, но отличаются по дизайну.
Например, диваны могут быть одинаковыми по части параметров (размеры, материалы обивки и наполнения, механизмы раскладывания и т. п.), но при этом существенно отличаться по внешнему виду.
Уметь различать товары, которые близки по дизайну, но отличаются по потребительским свойствам.
Например, кастрюли могут иметь абсолютно одинаковый внешний вид, но отличаться по объему, который является одной из основных характеристик.
Уметь правильно сопоставлять товары, близкие по характеристикам и дизайну, но отличающиеся по наименованию. Опыт показывал, что бывают случаи, когда полностью одинаковые по внешнему виду и функциональным характеристикам товары (например, диваны) имеют разные названия у разных продавцов.
Модель поиска аналогов
После ряда экспериментов мы пришли к убеждению, что имеет смысл создать две модели, которые будут работать независимо, и на выходе объединить результаты их работы.
Первая модель производит сравнение товаров по характеристикам, а вторая производит сопоставление товаров по изображениям. Результатом работы каждой модели является число, характеризующее дистанцию между сравниваемыми товарами. Дистанция является мерой похожести одного товара на другой. Чем меньше дистанция, тем больше похожи товары.
Эффективность модели
Как понять, что объединение двух моделей — это правильная история, повышающая эффективность поиска аналогов?
Для этого мы сформировали тестовую выборку из почти 500 примеров, среди которых заранее были найдены и отмечены 108 аналогов. По этой выборке провели два эксперимента.
Первый — поиск аналогов только по изображениям товаров (на картинке это верхние таблица и график).
Второй — поиск аналогов по изображениям и потребительским свойствам товаров (нижние таблица и график).
На оси абсцисс отображается дистанция между сравниваемыми товарами.
На левой оси ординат (красной) — точность сравнения как отношение количества подобранных аналогов к количеству правильно найденных внутри диапазона расстояний от 0 до заданного значения.
На правой оси ординат (синей) — полнота как отношение правильно найденных аналогов внутри диапазона расстояний от 0 до заданного значения к общему числу аналогов в выборке.
После анализа результатов нами принято считать, что в диапазоне расстояний между товарами от 0 до 0.2 модель подбирает аналоги товаров достаточно эффективно, а точность сравнения товаров по изображениям и потребительским свойствам на 31% выше точности сравнения по изображениям.
После проведения теста мы приняли решение использовать в системе мониторинга модель подбора аналогов товаров по изображениям и потребительским свойствам.
Бизнес-процесс мониторинга
ИТ-сервис по подбору товаров аналогов конкурентов был готов. Но насколько бизнес был готов «слепо» довериться нейронной сети?
Дополнительно необходимо было учитывать высокую долю собственных торговых марок в собственном ассортименте (не маркетплейс) Hoff. Найденные аналоги конкурента к нашим СТМ наши категорийные менеджеры предпочли верифицировать вручную, так как экспертная оценка в этом случае была крайне важна.
В результате нами было принято решение построить бизнес-процесс мониторинга цен с возможностью ручной верификации результатов. По крайней мере, на первых порах.
После опытно-промышленной эксплуатации мы сформировали окончательный бизнес-процесс мониторинга.
Отдел ценообразования формирует запрос на мониторинг. В нем должна содержаться информация о группе товара для мониторинга, перечень его ключевых свойств и информация о компании-конкуренте.
Отдел предиктивной аналитики производит сбор и обработку информации из открытых источников. После этого с помощью модели производится сопоставление наших товаров с товарами конкурентов. Найденные пары «Товар Hoff и товар конкурента» передаются на верификацию категорийным менеджерам.
Категорийный менеджер производит верификацию найденных сопоставлений и помечает ошибочные.
Подтвержденные пары передаются в отдел ценообразования для мониторинга. Также информация о подтвержденных и ошибочных сопоставлениях передается в отдел предиктивной аналитики, чтобы мы могли повышать эффективность модели.
Этот бизнес-процесс показал свою жизнеспособность, поэтому мы поставили следующую задачу — уменьшать число найденных товаров-аналогов, требующих ручной верификации.
Описание обновления цены конкурента в нашей базе данных мы оставляем за кадром, так как это чисто технический вопрос: автоматически по ссылке загрузить цену конкурента и обновить ее в базе.
Текущее покрытие
Я уже говорил, что в начале проекта (август 2022 года) мониторингом было покрыто около 10% ассортимента товаров Hoff. Поиск аналогов товаров конкурентов производили вручную категорийные менеджеры и еще пара компаний-подрядчиков.
Мы присоединились к этому процессу и в приоритет взяли ассортимент маркетплейса Hoff. Этот ассортимент был покрыт мониторингом меньше всего и содержал наибольшее количество артикулов (около 85 000).
Нужно было учитывать, что ассортимент маркетплейса более широко представлен у конкурентов, в то время как среди товаров собственного ассортимента была высока доля своих торговых марок.
Что это значит: поставщик выставляет свой товар не только в маркетплейсе Hoff, но и где-то еще. С поставщиком нет договоренности об эксклюзивности, но при этом нам нет смысла выставлять товар дороже, чем у конкурентов, — его не будут покупать. Поэтому цены нужно было срочно брать под контроль. Задача усложнялась еще и тем, что мы заранее не знаем, есть ли искомый товар у конкурента, есть ли разница в описании и названии товаров. В общем, дело сложное, но мы с ним справились.
С ноября 2022 по март 2023 года увеличили покрытие мониторингом ассортимента маркетплейса с 9% до 85%. Из них 55% покрытия произведено за счет использования модели. Так как в собственном ассортименте Hoff высока доля СТМ, поэтому прирост покрытия мониторингом был несколько ниже — с 12% до 51%. При этом наша модель добавила 18% покрытия.
Куда двигаемся дальше
Мы продолжаем расширять ассортимент, покрываемый мониторингом. И если сейчас для разных товарных категорий производится мониторинг цен нескольких конкурентов, мы постепенно наращиваем число конкурентов.
С другой стороны, погрузившись в вопросы матчинга товаров в нашем секторе рынка, мы увидели, что эти наработки можно использовать в механизмах поиска товаров по изображениям и рекомендательных блоках интернет-магазина Hoff. Поэтому ведем работу и в этом направлении.
Okker
А каким образом вы брали информацию из «открытых источников данных»? Ручная работа или же тут тоже присутствовал момент автоматизации (мб написали свои парсеры или что-то в этом духе). И было бы интересно узнать, что за стек технологий и как задеплоили?
AKirpo Автор
Добрый день. Да. Писали парсеры, чтобы получать данные с интересующих нас сайтов. Язык программирования python и всякие разные библиотеки )). Парсеры запускаются по расписанию. Тут можно использовать все, что угодно. Нам было удобно использовть job из MS SQL Server. Модули, которые занимаются матчингом работают как сервисы.