Здравствуйте дорогие хабровчане, в этой статье я сравнил цены трёх известных интернет магазинов wildberries, lamoda и kupivip, которые специализируются на продаже одежды. Я сравнил цены в общем, а также нашёл одинаковые товары и сравнил их. Также сосчитал уникальное количество брендов в каждом магазине. В общем получилась небольшая аналитика, кому это интересно прошу под кат.


Актуальность данных: 20 августа 2020 года


Конечно же я сравнил не все товары во всех магазинах их там сотни тысяч, я выбрал один сегмент — мужские мокасины:



Забегая вперёд, скажу, что изначально я старался выбрать сегмент, где будет одинаковое количество товаров в каждом магазине. Мой выбор пал на женские ботильоны, их было примерно по 1000 штук у каждого из продавцов, но (может быть мне просто не повезло) на тот момент я не нашёл ни одного одинакового товара для сравнения, поэтому я остановился на мужских мокасинах (что очевидно можно подметить — в женском сегменте уникальных товаров намного больше, чем в мужском).


Для начала я решил посмотреть к какому сегменту на самом деле относится каждый магазин, для этого я нашёл минимальную, максимальную, медианную и среднюю цены:



Из таблицы видно, что самый дешевый магазин это wildberries, на втором месте lamoda, а самый дорогой — kupivip, такой вывод можно однозначно сделать исходя из данных в колонках медиана и среднее, однако если посмотреть на колонки минимальной и максимальной цен, то можно сделать не верный вывод, что самый дорогой магазин lamoda, но это не так.


Для большей наглядности рассмотрим подробнее график функции плотности цен каждого магазина (для читабельности из графика были удалены самые дорогие товары, что никак не влияет на выводы):



Чтобы можно было корректно сравнивать между собой графики для каждого магазина данные были нормализованы (графически это значит, что площади под каждым графиком равны между собой, самый простой способ это проверить — подсчитать количество прямоугольников, которые находятся внутри графика). Сразу видно, что половину всех товаров в магазине wildberries можно купить меньше, чем за примерно 3500 руб, и самые дорогие смещены влево по отношению к другим магазинам. По той же логике видно, что kupivip занимает сегмент более дорогих товаров, чем lamoda.


Исходя из этого ещё более интересно посмотреть, будет ли цена на одни и те же товары отличаться в зависимости от того, какой ценовой сегмент занимает магазин.


Чтобы это узнать, необходимо найти бренды, которые представлены во всех трёх магазинах. Рассмотрим подробнее круговую диаграмму, на которой показано количество уникальных и общих брендов:



Стоит заметить, что у wildberries намного больше уникальных брендов, чем у других магазинов, это объясняется тем, что изначально у wildberries было больше товаров (строго говоря wildberries самый большой магазин).


Таким образом рассмотрим более подробно 13 брендов, товары которых представлены во всех трёх магазинах (названия брендов без пробелов и строчных букв из-за возможной разницы написания в различных магазинах):



В таблице выше показано сколько товаров каждого из брендов продается в каждом магазине, исходя из этого найдём одинаковые товары:



Как и следовало ожидать, больше половины самых дешевых товаров можно найти в wildberries, однако, это далеко не всегда так и, например, несмотря на то, что kupivip находится в самом верхнем ценовом сегменте, там можно найти товары дешевле (3 и 5 справа), чем в wildberries или в lamoda. Можно также заметить любопытную деталь: когда товары стоят одинаково в wildberries и/или в kupivip, lamoda накидывает к цене 1 рубль (например, 4 слева).


Для тех, кому эта статья показалась интересной, напишите в комментах, а какие ещё магазины стоит включить для рассмотрения или какую аналитику можно добавить. Спасибо.