Скажите, что представляется вам наиболее фантастичным: полет в другие звёздные системы или качественная и динамично развивающаяся модель данных отечественных маркетплейсов? Несмотря на очевидность ответа, все же задумайтесь, межзвездные перелеты – это тоже не простая штука!

В прошлый раз мы касались качества данных в целом. Ну, в смысле отсутствия такого понятия как «качество данных» в лексиконе современных отечественных маркетплейсов. Но стоит помнить, что любая товарная карточка – это не просто данные, а в первую очередь структурированные по особым правилам данные. Изрядная доля этих самых правил регламентируется, в первую очередь, моделью данных, PDM (Product Data Model), принятой на той или иной площадке-маркете. А что такое модель данных, применительно к маркетплейсу? К примеру, возьмем самую простую, но исключительно полезную вещь: набор детских разноцветных кубиков. Давайте попробуем написать примитивную модель данных для подобных детских игровых развивающих наборов.

- производитель

- бренд (может совпадать с производителем)

- название набора (если есть)

- тип продукта (например, «набор кубиков»)

- количество предметов в наборе

- материал

- цвет

- для детей какого возраста подходит (например, «от 1 до 3 лет»)

- предназначение («развитие мелкой моторики, обучение цветам, обучение счету»)

- особенности (например, «не содержит ПВХ» или «скругленные углы»)

- размеры предметов, входящих в набор

- тип упаковки («картонная коробка», «пластиковый пакет»)

- размер и вес упаковки

- страна-производитель

Можно придумать еще дюжину характеристик-атрибутов, но как база, сойдет и так. Да, стоит отметить, что не редко атрибуты делят на standard и advanced, т.е. на основные атрибуты продукта и атрибуты для расширенной спецификации, дополняющей базовые характеристики продукта. К «основным» обычно относятся «тип-цвет-материал-количество», а к расширенным можно отнести «особенности-упаковка-вес».

Заполнение характеристики-атрибута должно регламентироваться строгими правилами. Эти правила могут зависеть или от физического смысла, или нести какой-то свой смысл, заложенный создателем конкретной модели данных. Например, в размерах помещаются только числовые характеристики с указанием размерности или без оной, если размерность уже заложена в названии атрибута (например, «Ширина, мм»). В атрибуте «цвет» указывается строго цвет продукта, но никак не его форма или дизайн. Атрибуты могут быть free-text (т.е. заполняющий карточку может вбить в него любое свое значение, слово или словосочетание), а могут иметь фиксированный список значений (value list), из которого предлагается выбрать подходящее для описываемого продукта. Оба варианта имеют свои плюсы и минусы. Значения из free-text атрибутов необходимо жестко модерировать на предмет ошибок самого разного характера. В противном случае там будет ад. А для атрибутов со списком значений следует давать возможность заполняющему карточку запрашивать новое значение, если это требуется.   

Ну и как обстоит дело у отечественных маркетплейсов?

Маркетплейс №1.

Прежде всего видим, что спецификация товара разделена на два сегмента. Это «дополнительная информация», выдаваемая в первую очередь и по своей сути являющаяся основной. И «общие характеристики», которые (по названию) вроде как должны быть основными на деле состоят из единственного, пусть и важного, атрибута «количество в упаковке».

Ладно, принимаем «дополнительную информацию» за основную и разберемся с ней. «Возрастные ограничения» – отлично (абстрагируемся от качества заполнения данной конкретной карточки, нас в этой статье больше интересуют PDM и ее атрибуты на примере категории, где находятся детские кубики). Важный и нужный атрибут.

«Назначение подарка». Гм. А этот товар будут покупать строго как подарок? Какой глубокий смысл этого атрибута? Очевидно, что он и смысловой нагрузки не несет, и даже вреден для маркетинга. «Любимые герои». Небесполезный атрибут. Но его никто из заполняющих карточку или не понимает, или по собственной инициативе наполняет откровенным мусором. Что должно быть в листе значений у такого атрибута? «Фиксики», «Барби», «Гарри Поттер» и т.п. Т.е. некие медиа-франшизы или имена героев из них. Если логотипы этих самых франшиз или изображения героев используются в оформлении нашего продукта. А что на деле получается? Да то, что запихали в этот атрибут, то там и будет. Хотим - «куртка замшевая», а хотим – «кубики для малышей».

Замечательный атрибут «повод» (гусары, молчать!). Что характерно, заполняющие карточку тоже в шоке от него. Потому и видим в нем странное значение «для себя».

«Материал». Ну тут не придраться.

«Страна». Тоже полезно.

«Комплектация». Тоже атрибут со смыслом, пусть и перекликающийся в этом примере с «Количеством предметов в упаковке».

Маркетплейс №2.

Тут всё куда логичнее. Тип-цвет-размер-страна-навыки-возраст-материал – все по делу. Но недочеты есть. Причем такие, которые откровенно режут глаз.

«Дополнительные функции». Как понимаю, это атрибут, аналогичный предложенному мною «особенности». Но нельзя в таких атрибутах использовать значения вида «без особых особенностей» или «без эффектов». Ну странно всё это смотрится.

Аналогично и «0» в «количестве батареек», особенно с учетом, что это не электрическая игрушка и батарейки к ней неприменимы.

Перечисление навыков в «развитие навыков» дается с заглавных букв, что нарушает языковые правила.

Казалось бы, вроде все терпимо, если отцепить воз мелких недочетов. Согласно спецификации, мы имеем набор из 12 картонных разноцветных кубиков. А знаете, что это на самом деле? Это кубики с напечатанными на них буквами, словами и изображениями. Для обучения малышей алфавиту. Вот поди и догадайся по такой куцей спецификации. И где тут проблема? Плохо заполненная карточка или модель данных не позволяет хорошо описать продукт?

Маркетплейс №3

Своеобразная PDM. Тут нет откровенных чудес, как у нашего №1, но есть нечто свое, особое, оторванное от клиента-покупателя напрочь.

К «Основным характеристикам» отнесены «тип» (разумно), «интерактивная» и «на радиоуправлении» (спорно, но ладно). А т.к. интерактивные кубики на радиоуправлении выглядят странно, то в этих атрибутах стоят правильные значения «Нет». В них есть смысл, т.к. на основе этих заполненных атрибутов вполне можно сделать хороший поисковый фильтр, помогающий покупателям найти интерактивные игрушки. Вот только зачем выводить эти атрибуты в спецификацию, если «их нет»? С тем же успехом можно добавить еще штучек 400 атрибутов a la «круглое», «может летать», «не тонет в воде» и «легко моется». И гордо заполнить их значением «Нет». И вывести в «основные характеристики».    

Итак, в чем необходимость качественной и постоянно модернизируемой модели данных для маркетплейса? А в том, что это превосходный инструмент, облегчающий работу с данными и их анализ. Когда данные правильно структурированы, это позволяет:

- тонко настраивать поисковые системы на сайте;

- легко создавать новые критерии поиска;

- упрощает настройку инструментов сравнения продуктов;

- повышает корректность выдаваемых результатов;

- облегчает анализ данных и сбор статистики для внутренних задач.

Это улучшает качество самих данных, не позволяя использовать неподходящие для атрибутов значения. Упрощает менеджмент, позволяя массовые замены в атрибутах или переименование значений в них.  

Как ведется работа над PDM. Прежде всего, все продукты разбиваются на классы (например, офисные продукты). Далее, выделяются категории продуктов (например, «письменные принадлежности» или «органайзеры»). И для каждой из категорий разрабатывается собственная модель, связанная с типовыми характеристиками продуктов, которые будут относиться к этой категории. После идет работа с этими самыми характеристиками-атрибутами. Проработка правил их заполнения, определение их типа (числовой атрибут, free-text, бинарный (да/нет), с листом значений и т.п.). Выделение т.н. поисковых атрибутов, т.е. тех, на значениях из которых будет строиться поиск товаров на сайте. Настройка отображения атрибутов в карточке, в зависимости от типа продукта и значения в нем (ну, смешно выглядят все эти атрибуты вида «Инкрустирован кристаллами Сваровски: Нет»). Ну а под конец, группировка и определение последовательности атрибутов, что бы карточка была для удобна для чтения и полезна покупателю.

Но пока всё это не про отечественные маркетплейсы. Тут все пронизано идеологией героя из советского мультфильма: «И так сойдет!»

Комментарии (2)


  1. Ser_Kom
    14.09.2022 09:30

    Всё верно и по делу. Хочется добавить, что создание и поддержание в актуальном виде модели данных - совсем не бесплатное занятие.

    Иногда приходится делить один атрибут на несколько или, наоборот, сливать атрибуты вместе, что, в свою очередь, затрагивает все продукты, у которых есть значения в указанных атрибутах. Иногда атрибут устаревает и его надо спрятать как из спецификаций, так и из формы заполнения, но, например, оставить в поисковых запросах. Модель данных можно переводить на другие языки - тут мы встречаемся с различиями в терминологиях, форматах данных, порядке слов и т.п. И да, человек, который занимается ПДМ, должен быть или экспертом в предметной области, либо обладать хорошими аналитическими способностями. Особенно это важно при создании новых категорий.


    1. Kaffeekanne Автор
      14.09.2022 09:59

      А любое дело, если его выполнять качественно и с профессиональным подходом, стоит денег и требует специалистов в этом деле. И компании это понимают, раз готовы вкладываться в спецов и занимаются их активным набором: https://habr.com/ru/company/habr_career/blog/687126/

      Тут скорее вопрос в ином. Если одни сферы развиваются активно и сравнительно успешно, то остальные превращены в нелюбимых падчериц. Как, к примеру, качество данных "как у китайцев" и PDM, застрявшие в своем развитии на уровне "нулевых" или периода "бума доткомов". Эдакие "Лада-классика с карбюратором" в эпоху электромобилей и серийных автопилотов третьего поколения. Но если АвтоВАЗ что-то пытается творить, то отечественные маркетплейсы к этой своей "PDM-классике" лишь периодически приворачивает "синие писалки".