image

Друзья, до самого долгожданного события года в сфере data science остался 1 день! 28 апреля состоится пятый московский Data Fest. Под катом наш рассказ о докладах и активностях Mail.Ru Group на конференции.

Мы подготовили 6 докладов в основную программу фестиваля и 4 выступления на нашем стенде.



Дмитрий Парпулов из команды машинного обучения Почты Mail.Ru расскажет про алгоритм подсказки ответов на входящие письма (Smart Reply), запущенный почтой в декабре 2017 г. Вы узнаете, что находится под капотом сервиса, какие подходы пробовали и что в итоге выбрали, как сделать предлагаемые ответы лучше и разнообразнее, как оценить качество получившейся модели, и еще много интересного.



Дмитрий Бугайченко рассмотрит основную архитектуру библиотеки машинного обучения Spark ML, а также расскажет об особенностях её использования для решения реальных задач по обработке больших объёмов данных. Особое внимание будет уделено ряду ограничений, усложняющих применение библиотеки. Также Дмитрий расскажет, какие расширения для стандартных элементов пришлось разработать, чтобы эти ограничения обойти и раскрыть потенциал массивного распределённого машинного обучения. Работу стандартной библиотеки и её расширений мы продемонстрируем на примере задачи ранжирования новостной ленты Одноклассниках.



Всеволод Викулин рассмотрит задачу рекомендации на примере магазина китайских товаров Pandao. Он покажет типичные ошибки, предложит нетипичные решения. Всеволод расскажет про построение системы рекомендаций, которую любой специалист по data science сможет сделать на коленке с помощью sklern’а.



Александр Тоболь в своём докладе рассмотрит:
  • конвейер для построения векторов пользователей и поиска пользователя на загруженном фото;
  • обучение нейросети: построение датасета из реальных пользовательских данных > обучение нейросети > построение датасета — варить до готовности;
  • построение нормализованного вектора пользователя;
  • кластеризация лиц на пользовательском фото и определение вектора владельца аккаунта;
  • железо и оптимизации, запуск в облаке, отказоустойчивость, запуск нейросетей на CPU и GPU.



Осенью ВКонтакте сделали редизайн мобильных приложений, в рамках которого обновили Ленту рекомендаций. В процессе работы возникло много трудностей, связанных как с реализацией машинного обучения, соединяющего миллионы пользователей с миллионами авторов, так и со скоростью работы, и даже с дизайном. Андрей Якушев поделится нашим опытом создания таких продуктов практически с нуля небольшой командой, а также расскажет, как мы следим за происходящим на платформе и как находим следующие точки роста.



Сейчас наша компания развивает более 150 проектов, большинство из которых использует искусственный интеллект. Михаил Фирулик сделает обзор используемых нами AI-технологий: «AI в продуктах Mail.Ru Group: обзор кейсов и технологий»

Tech Talks от экспертов Mail.Ru Group

  • 12.50—13.00 — «Распределенный обучатор», Сергей Чепарухин, программист-исследователь;
  • 14.50—15.00 — «Кейсы использования компьютерного зрения», Владимир Конев, менеджер продукта;
  • 15.05—15.15 — «Face Recognition: from scratch to hatch», Алан Басишвили, программист-исследователь;
  • 17.35—17.45 — «Sequence to sequence диалоговые модели», Олег Шляжко, ведущий программист-исследователь.

На стенде весь день угощаем фрешем и свежими фруктами, рассказываем о жизни в Mail.Ru Group и общаемся. Покажем работу нашей стойки Face Recognition.

Также вы можете получить футболку от Mail.Ru и другие подарки:

  1. Найди наших фотографов в футболках Mail.Ru.
  2. Сфотографируйся у них один или с друзьями.
  3. Приходи на наш стенд через 1,5 часа после фотосессии.
  4. Залогинься на стойке Face Recognition и получи свои фото с #datafest на почту.
  5. Забери свой подарок, не отходя от стойки!

В предыдущей публикации про Data Fest мы рассказали о секциях конференции.

Смотрите расписание, приходите на доклады и на наш стенд!

Комментарии (0)