Всем привет! Публикуем отчёт с митапа Avito Data Science Meetup: Personalization, который проходил у нас в офисе. Участники обсуждали моделирование пользовательских предпочтений в мультимодальных данных и кластеризацию волатильных объявлений с помощью EM-алгоритма. Под катом — видеозаписи, презентации, ссылка на фотоотчёт.
Моделирование пользовательских предпочтений в мультимодальных данных. Hady W. Lauw, Максим Ткаченко (Singapore Management University)
Ключ к хорошим рекомендациям — моделирование огромных массивов поведенческих данных, которые возникают в результате взаимодействия пользователей с онлайн-системами. Эти взаимодействия мультимодальны, то есть составлены из различных типов данных, таких как пользовательские рейтинги, отзывы, фотографии или их социальные взаимодействия. Это усложняет задачу. Докладчики рассказывают о методах интеллектуального анализа данных и машинного обучения для моделирования пользовательских предпочтений в мультимодальных данных и их использовании при создания полноценной рекомендательной системы.
Доклад прозвучал на английском языке, мы перевели его и добавили субтитры на русском:
Кластеризация волатильных объявлений с помощью EM-алгоритма. Василий Лексин (Avito)
Работая над развитием рекомендаций на Avito, коллеги приняли решение сделать кластеризацию короткоживущих объявлений: это поможет пользователям видеть больше актуальных рекомендаций, а нам — реже переобучать модели и делать это быстрее. Василий представляет оптимизированный EM-алгоритм, способный эффективно обрабатывать огромные массивы данных и рассказывает про методики оценки качества кластеризации и о прикладных применениях алгоритма.
Спасибо всем, кто пришёл на митап, посмотрел видеозаписи. Фотоотчёт со встречи мы выложили на Facebook. Чтобы раньше всех узнавать о мероприятиях для технических специалистов в Avito, подписывайтесь на наш Timepad. И обязательно расскажите в комментариях, на какие темы вам бы хотелось послушать доклады.
До новых встреч!