Обсуждая качество продуктового поиска и способы его автоматизированного тестирования, в прошлый раз, пришли к пониманию некоторой непрозрачности проблемы. Огромное количество интернет-магазинов часто ставят покупателей в тупик, не находя требуемого по простейшим запросам, а проблемы как бы и нет. Одним словом, смотрим на реальные проблемы не очень релевантного поиска очень популярного интернет-магазина (который очень хочет быть «маркетплейсом»).



Пример с велосипедом иллюстрирует простую истину: не можешь найти требуемое, не показывай лишнего. Кроме того, не так сложно выделить «велосипед» как основной требуемый продукт.

Столь интересный результат получен поскольку мотокосы действительно являются бензиновыми (на что указывает отдельное поле «тип»), кроме того, в дополнительных характеристиках можно найти «тип ручки: велосипедная». Аналогичным образом сработают: «бензиновый нож», «бензиновая леска» и т.д. Неразумно использовать второстепенную информацию настолько прямолинейно.

Дело о пропавшем торте


Так, нам бы сладенького. Категорий тысячи, продуктов сотни тысяч — будем искать. Что может быть проще? Хочут торт!



Так, странно, что значит эко гель для стирки? Тут вечер, чай, настроение… Нет торта? «А если найду?»



Не супер результат, конечно, но торт ведь есть. Таким образом, получаем достаточно серьезную проблему: в ассортименте магазина присутствуют торты, но по конкретному запросу их найти невозможно. Было бы интересно узнать, как много других товаров «исчезают» из поля зрения потенциального покупателя.

Ситуация, конечно, странная. Складывается впечатление, что малое количество результатов по первоначальному запросу (состоящему из одного слова), включает подозрение на имя бренда и поиск с транслитерацией. Любое уточнение первоначального запроса «торт вафельный», «торт с декором» решает проблему.

Настроение испортили, где топор?


Что может быть проще чем поиск позиции по названию бренда и названию конкретной модели? Школьник, используя простой полнотекстовый поиск, справится с задачей за смешное время, а тут:



Была бы проблема в отсутствии конкретной модели или бренда вообще. Но ведь нет, искомый топор есть в каталоге, даже акционную стоимость имеет.



В данном случае работает человеческий фактор. Человек, добавлявший позицию, набрал Х27 используя кириллицу. Естественно, набирая название бренда, потенциальный покупатель продолжит набор конкретной модели не переключая раскладку.

Фекальный насос?


Зная специфику исследуемого поискового решения, можно легко показать насколько нерелевантные результаты может увидеть покупатель.



Стоит учесть, что многие продукты не имеют дополнительных характеристик вообще. Другие, наоборот, изобилуют массой деталей, которые учитываются во время поиска. Одна проблема — поиск не учитывает ни контекст ни расстояние между ключевыми словами в блоке. Более того, очень вредно настолько агрессивно использовать второстепенную информацию о продукте, которую, скорее всего, проверяют бегло или не проверяют вообще.



Автор не берется оценить, какую прибыль теряет магазин, но любая системная проблема однозначно требует решения. Не все запросы являются однозначно точными и четкими. Кроме того, редкий покупатель решит остаться и выяснить, почему ему показывают откровенную ерунду в ответ на более или менее очевидный запрос.



Излишнее упрощение сильно сказывается на результате. Будет интересно проследить за эволюцией поиска данного интернет-магазина. Но самый главный вывод предельно очевиден — поиск необходимо тестировать. К слову, проблема с «fiskars x27» была найдена с помощью автоматизированного инструмента. Скоро в свободном доступе, не пропустите.

Разное


Комментарии (24)


  1. APLe
    11.10.2018 08:20
    +1

    Ссылка "Самый простой способ оценить качество продуктового поиска" не работает, надо "edit" на "post" заменить.


    1. aarner Автор
      11.10.2018 10:20

      Благодарю. Внимательность в нашем деле — все, но часто она является не самой приятной функцией от времени.


      1. UksusoFF
        11.10.2018 17:17

        Так все равно не работает, там topic лишний.


  1. HiMem-74
    11.10.2018 09:26
    +1

    Такое ощущение, что половину сайтов для инет-магазинов пилил «сын главбуха, они в техникуме компутеры проходили», а акт приемки подписывали с закрытыми глазами.
    Оцените качество поиска elbi74.ru и vseinstrumenti.ru, это же трэш, угар и содомия(с).


    1. UksusoFF
      11.10.2018 17:14

      У Леруа Мерлен тоже не понятно как оно работает. Причем я знаю что товар есть, ввожу его название, а выдается совсем не то.


  1. aamonster
    11.10.2018 09:43
    +4

    Настолько привык к корявому поиску на сайтах, что рука на автомате тянется к адресной строке — чтобы просто искать «site: домен запрос» — благо, домен уже там.


    1. user-vova
      11.10.2018 10:47

      del


  1. StrikerusRus
    11.10.2018 10:23

    Многие описанные «ошибки» довольно спорны.
    — Поиск по всему контенту (Название товара, Характеристики, Описание) напротив позволяет находить товары по таким фразам как «бензиновый генератор на 5 кВт» или «бетономешалка ременная»
    — Выводить в результаты поиска хоть что-то лучше, чем не выводить ничего. По крайней мере здесь клиент не уйдет сразу увидев «Ничего не нашлось», а рассмотрит выдачу, сделает еще пару попыток поиска.


    1. aarner Автор
      11.10.2018 10:29
      +1

      Отмечу два важных момента:

      • Из вашего комментария следует, что статья предлагает не искать по всему контенту, хотя все как раз наоборот, поиск по всему контенту критичен, просто он должен учитывать контекст и зависимости, а не тупо находить ключевые слова
      • Есть много стратегий, которые позволяют выдать сколь-нибудь релевантные продукты. Если следовать вашей логике — священный рандом наше все


  1. igor198811
    11.10.2018 11:42

    Это можно объяснить не только кривым поиском, но ещё и отсутствием нужной номенклатуры и поэтому выдаются «запчасти» и «релейшены».


    1. aarner Автор
      11.10.2018 11:43

      Да, вполне можно, но не в этом случае:


  1. 02A
    11.10.2018 12:06

    довольно странно работает поиск в Rozetka… с одной стороны, они отлично отрабатывают сложные запросы и в то же время лажают на таких простых как «торт»



    VS


    1. 02A
      11.10.2018 12:31

      кстати словосочетание «slim fit» отсутсвует в описании товара… тем не менее судя по картинкам, поиск отработал верно


    1. aarner Автор
      11.10.2018 14:33

      А вот любопытно, это именно один запрос такой (подразумевается бизнес-правило) или тип запроса (работает более сложная структура данных и анализ). Ваше мнение?


  1. seri0shka
    11.10.2018 13:07
    +1

    В результате по запросу «торт ореховый» не хватает презервативов. )
    Вообще больная тема поиск в интернет-магазинах. Приходится вникать в замысел «строителей» сайтов и повторять запрос многократно в разных вариациях. Но больше всего меня нервирует отсутствие в некоторых интернет-магазинах сортировки по цене, причём она исчезает даже там, где была, после очередных «улучшений». Попробуйте выбрать реле с нужными характеристиками (размер, ток контактов, напряжение катушки) из 2000 вариантов! С сортировкой по цене я выбирал из первых подходящих по параметрам, начиная с самых дешвых (просмотрев примерно 50 первых позиций), без сортировки по цене это просто невозможно. Ещё вариант «всё для людей»- когда в списке товаров картинки отсутствуют или очень маленькие, увидеть нормально можно только открыв страницу с конкретным товаром. Попробуйте такое с тем же примером из 2000 позиций! Кстати, оба «улучшения» одновременно на одном сайте, раньше у них было всё отлично.
    Другая крайность- чрезмерное количество параметров сортировки (при этом именно нужные могут отсутствовать). К примеру, кому может понадобиться выбрать электролитический конденсатор с параметрами Hср.=7.7мм или Dср.=6.3 мм (только точно, не до какой-либо величины)? Или выбрать диод весом именно 0.37 г?


    1. Vladzimir
      11.10.2018 13:24

      А все потому что параметры, обычно, указывает контентщик без профильного (хотя бы базового) образования.


  1. xRay
    11.10.2018 13:43

    Странно что тут встроенный странный поиск Bitrix не виноват т.к. на Rozetka другой движок


  1. grisha-chasovskih
    11.10.2018 13:49

    Все познается в сравнении. Мало каких интернет-магазинов с таким огромнейшим каталогом товаров могут сравниться с Розеткой и её поисковой системой. Поиск на сайте решает почти все проблемы, и если у пользователя прямые руки и круглая голова, то получится найти искомый товар, если не через поиск, то через каталог с фильтрами. Кто ищет, тот найдет. И заметьте, это интернет-магазин, а не Google c Machine Learning & AI. Да, пока что нет возможности искать по загружаемой картинке или описывать товар своими словами (кстати, для некоторых категорий товаров это работает и учитывает характеристики и даже вот так можно, а для некоторых алгоритм не исключает параметры, что не всегда выдает релевантный поиск). Потому что никто так не ищет, это редкий «use case». И да, в том поиске намного больше фишек чем ваших «находок», просто нужно нормально искать. Тем не менее, спасибо за статью и PR, вы подкинули разработчикам немного идей по улучшению поиска.


    1. aarner Автор
      11.10.2018 14:50

      Рад, что вы даже зарегистрироваться решили ради этого комментария :) Давайте разберем основные моменты:

      1. Конструктивная критика всегда во благо. Было интересно посмотреть, как работает розетка, поскольку в большинстве моментов поиск действительно адекватный.
      2. Упоминание прямых рук очень напоминает владельцев ВАЗов — машина ок, едет, двери закрываются, если руки прямые — вообще проблем нет, даже ТО дешевле. Но смысл ведь «найти и купить», а не «попытаться найти, решить логическую задачу и возможно найти, а может быть и нет»
      3. Что значит «и круглая голова»? :)
      4. Если у вас нет ML и знаний (подразумевается knowledge graph) — как жить собираетесь?
      5. Синонимы и бизнес-правила — крутые инструменты, вот только пока все проблемы найдутся, пока для них все правила пропишутся… А ведь это еще поддерживать нужно
      6. «Нормально искать» это как? Использовать «широкий запрос», который уточнять фасетами? Или «не нашел — иди в каталог»?


      Посыл статьи в другом — сложно улучшать поиск, не имея полной картины и более или менее быстрого способа проверить «глобальную ситуацию». Прикрутили характеристики — отвалился какой-то процент хороших запросов. И так со всем. «fiskars x27» — четкий сфокусированный intent, который должен в большинстве случаев приводить к покупке.


    1. aarner Автор
      11.10.2018 14:53

      «Телефон без кнопок», кстати, отвалился или не работал:


  1. legolegs
    11.10.2018 14:00

    Вы так говорите, будто на обычных поисковых системах таких проблем нет, хех. Как поётся в известной песне, «загуглить хотел грозу, а получил козу».


    1. aarner Автор
      11.10.2018 14:37

      Подобные проблемы есть везде, но мы говорим о двух разных классах задач. Поиск по продуктам работает с хорошо структурированной информацией, с конечным количеством продуктов и более или менее понятным поведением пользователей (они хотят что-то купить).


  1. Am0ralist
    11.10.2018 15:03

    Пф… яндекс маркет на запрос чистящей ленты по конкретному артикулу производителя спамит обычными lto лентами. Это ж прям эпиквин. Фигнайдешь.
    Техподдержка только отписываться умеет в духе «а вы попробуйте более конкретный запрос дать». Блин, куда конкретней то?


  1. mishael
    12.10.2018 10:08

    Какая вообще статистика использования поиска? Видел на одном не самом мелком магазине 2% людей пользовалось поиском. Причем строка поиска была в дизайне очень назойливой, как на Розетке. Видимо очень отличается этот процент в зависимости от ниши…