На первом митапе команды AliTech мы обсудили то, как решают задачу поиска совпадений среди миллиардов сущностей команды AliExpress Россия, Ozon, Яндекс.Маркета. Успехи, неудачи, прикладные задачи ML-команд, пайплайны и способы оценки качества — в записи.
Андрей Русланцев из команды AliTech рассказал о том, какие модели используются в продакшене, почему нужно два разных BERT’a, с каких пор мы не любим мусорные мемные картинки к товарам и о многом-многом другом!
На пути к успеху мы повстречали немало подводных камней — о них и рассказал Денис Ивашков. В этом докладе: проблемы межкультурного взаимодействия и восприятия цвета российскими покупателями и китайскими продавцами, графы из котов и решения, которые не сработали.
У товара есть множество атрибутов — и это делает задачу матчинга сложнее, Александр Голубев из Ozon рассказал о том, как объединить около десятка эмбеддингов в один вектор.
Макар Красноперов из Яндекс.Маркета рассказал о «кухне» матчинга: прикладных задачах, метриках и процессе оценки качества.
Спасибо всем, кто был с нами лично и онлайн — и до новых встреч! А чтобы не пропустить анонсы и полезные материалы от команды AliTech, подписывайтесь на наш телеграм-канал.