Привет, Хабр! На связи команда продуктового матчинга ecom.tech. В серии статей мы расскажем о разработке матчера для маркетплейса Мегамаркет. Первым делом – давайте вместе  посмотрим с разных сторон на задачу продуктового матчинга и разберёмся, почему любому маркетплейсу критически важно уметь её решать (и решать хорошо).

Часть 1. Братство товаров.

Disclaimer: все названия вымышлены, все совпадения случайны. Кроме Мегамаркета – он настоящий.

Вы точно уже занимались матчингом

Все мы знакомы со старыми добрыми маркетплейсами – онлайн-рынками, на которых продается абсолютно все: от булавок до автомобилей. Каждый маркетплейс имеет свой джентльменский набор: уникальное название (желательно запоминающиеся), сайт (где можно заказать товар), мобильное приложение (чтобы сделать заказ было еще проще и удобнее), службу логистики (чтобы привести заказ покупателю как можно скорее), дальше через запятую.

Когда вы приходите на обычный рынок, то вряд ли покупаете что-то с первого раза, правда? Вы ходите, торгуетесь, пробуете, выбираете лучшее. С онлайн-рынками все точно так же. Допустим, вам надо срочно купить стиральную машинку. Вы открываете приложение Мегамаркета‎, вбиваете в поисковую строку запрос и видите, например, Indesit EWSD 51031.

Как опытному покупателю, вам хочется посмотреть, а что могут предложить другие продавцы и рынки. Вы заходите на второй маркетплейс, вбиваете в поисковой строке заветное “Indesit EWSD 51031”.

Названия похожи, цены отличаются. 
Названия похожи, цены отличаются. 

Как дела на каком-нибудь ещё маркетплейсе?

Что-то похожее.
Что-то похожее.

Тогда, засучив рукава, вы принимаетесь за дело. Открываете характеристики Indesit EWSD 51031 и начинаете сравнивать их со всеми предложенными стиральными машинками, которые выпали в поиске на всех маркетплейсах. После определенного количества времени вас неизбежно будет ждать успех: вы отберете предложения-финалистов, сравните цену, название, изображение, атрибуты и, наконец, сделаете долгожданный заказ — лучшие характеристики за оптимальную стоимость и на самых удобных для вас условиях.

Поздравляем! Вы только что решили задачу продуктового матчинга.

Продуктовый матчинг: что за зверь?

Наш сегодняшний главный герой — это процесс сопоставления товаров на основе различных критериев. Кажется, это тот случай, когда определение звучит обманчиво просто.  Давайте разбираться.

Продуктовый – (от английского “product”) – товар/продукт/изделие. Всё то, что мы сравниваем.
Матчинг – (от английского “to match”) – сопоставлять/сравнивать. Это то, что мы делаем
Итак, в продуктовом матчинге мы сравниваем товары, но как мы это делаем?

Это самая важная часть – сравнение/сопоставление всегда делается на основании каких-то критериев. Любой товар на маркетплейсе – это набор характеристик, которые его определяют. Например: фото, название, цена, параметры товара, отзывы и остальное.

Теперь собираем все вместе и получаем продуктовый матчинг. Решить задачу продуктового матчинга – это значит сопоставить характеристики товаров между собой и найти наиболее похожие, а желательно идентичные товары.

Зачем продуктовый матчинг маркетплейсу?

Разберем на примере Мегамаркета. Здесь на витрине – миллионы товаров. На примере стиральной машинки мы видели, что один и тот же товар продается на различных маркетплейсах. Если говорить о Мегамаркете, то для его ассортимента есть около 100 миллионов товаров на площадках конкурентов, которые хочется найти и сопоставить, чтобы решить задачу динамического ценообразования.

Представим, что точно такая же стиральная машинка на другом маркетплейсе будет стоить вдвое дешевле, чем на Мегамаркете. Прагматичный покупатель пойдет туда, а не к нам. А мы не хотим терять клиента. Значит, есть смысл следить за ценами всех схожих товаров на других маркетплейсах, а для этого их нужно найти и сопоставить. 

Если бы продуктовый матчинг использовался только для решения задачи динамического ценообразования, он уже был бы критически важен для маркетплейса. Однако есть и другие причины.

На Мегамаркет ежемесячно заходят миллионы новых продавцов. Они присылают описания новых товаров, а маркетплейсу важно понять: насколько эти товары новы и уникальны, нужно ли заводить новую карточку товара или в нашем ассортименте уже есть точно такой же товар? Узнать это можно, сравнив новый товар с текущим ассортиментом. Тут матчинг помогает решить задачу добавления новых карточек товаров. 

Ок, пусть мы завели много новых товаров. Все они имеют какие-то общие свойства, по которым их можно было бы объединить в группы (с помощью матчинга). Ведь когда мы приходим на рынок, то помидоры разных сортов лежат с помидорами, а огурцы с огурцами, потому что похожие товары должны держаться вместе. Это гораздо удобнее, как для покупателя, так и для продавца. Наконец, сравнивать товары – полезно даже внутри только своего ассортимента, например, для поиска и удаления дубликатов.

Таким образом, мы можем выделить основные направления, где продуктовый матчинг крайне полезен и позволяет значительно увеличить прибыльность маркетплейса: 

  • динамическое ценообразование;

  • добавление товаров от новых продавцов;

  • объединение товаров в группы.

Насколько сложно матчить и что для этого нужно?

Первое, что приходит в голову – это просто взять и сравнить каждый товар с каждым. В математике такая операция называется декартовым произведением. Допустим, мы хотим провести сравнение нашего текущего ассортимента с конкурентами. Берем ассортимент Мегамаркета и делаем декартово произведение 50 миллионов товаров на 100 миллионов товаров. 

И тут у нас начинаются проблемы: вычисление такой огромной матрицы займет внушительное количество времени и ресурсов. Кажется, более разумным будет поиск определенного малого числа кандидатов для каждого товара и анализ только их. Ведь сравнивать стиральную машинку и огурцы – не имеет особого смысла. Это слишком разные товары (хотя…). Сравнивать каждый товар с каждым – слишком затратно да и не нужно.

Давайте теперь посмотрим, насколько сложно в принципе проводить сравнение атрибутов товаров? Перед вами две карточки товаров, как думаете: это один и тот же товар?

На первый взгляд — да. Ведь картинки абсолютно идентичны. Но внимательный читатель может заметить, что у товаров отличается цвет, о чём написано в карточке товара. Из чего можно сразу сделать вывод, что полагаться только на изображения нельзя.

Атрибуты почти идентичны, название тоже. Но видим сильное различие по ценам. Из чего можно заключить, что один из товаров является репликой, другого, а значит, это разные товары. На Мегамаркете, разумеется, реплик нет.

Цены очень близкие, атрибуты идентичны. Но посмотрите внимательно на фото: на товаре слева внизу на упаковке указано, что зерна полной обжарки, а на товаре справа, что средней. Да, это тоже разные товары. Дьявол кроется в деталях. А теперь представьте, что таких товаров – десятки миллионов и для каждого нужно найти похожий. 

Итак, подведем итог. Решение задачи продуктового матчинга крайне важно для любого маркетплейса. Сама задача продуктового матчинга – сложная и многоуровневая. Для того, чтобы грамотно сопоставлять товары, необходим детальный анализ как текстовой информации, так и изображений, что подводит нас к мысли о том, что мы должны уметь эффективно работать сразу в двух модальностях. Для эффективного матчинга необходимо для каждого товара находить определенное количество кандидатов.

Давайте считать, что вводных понятий нам на этом будет достаточно, чтобы дальше углубиться в технические подробности.

В следующей части мы расскажем, с помощью чего решаем задачу продуктового матчинга для Мегамаркета и обходим обозначенные выше проблемы. Не переключайтесь!

Комментарии (4)


  1. Zivaka
    08.10.2024 17:17
    +1

    Написано красиво, но по факту ведь не работает. МегаМаркет до сих пор товар из наших остатков не может связать с карточкой товара на самом маркетплейсе по заводскому артикулу, не говоря уж о куче других свойств. И это при том, что у нас выгружаются всего два типа товара - легковые шины и мотошины. Качество же самих карточек товара на МегаМаркете не просто плохое, а отвратительное, к сожалению.


    1. ivan_mordovets Автор
      08.10.2024 17:17

      Привет! Спасибо за комментарий.
      Действительно, не всегда и не всё работает идеально.
      Постараемся посмотреть на ваш конкретный случай, если есть возможность — напишите детали, а мы найдем специалиста, который сможет проконсультировать


      1. Zivaka
        08.10.2024 17:17

        Вот вам пример, на котором помимо того, что изначально по артикулу не нашелся товар, так еще и минимум три дубля на витрине присутствуют. Таких примеров очень много, хотя категория для матчинга достаточно простая в сравнении с одеждой и прочими.