Привет, Хабр! Х5 Retail Group совместно с Russian Hackers проводит онлайн-хакатон по data science в ритейле с 18 по 21 июня. Цель — найти новые идеи по использованию больших данных в ритейле, что позволит улучшить качество обслуживания клиентов, оптимизировать процессы в сети, развивать и расширять бизнес.

У X5 Retail Group — тысячи магазинов и десятки тысяч товарных позиций, звеньев логистических цепей, миллионы покупателей и неисчислимое количество транзакций. Все это — Big Data, и мы очень-очень надеемся на то, что хакатон поможет найти новые способы использования данных в ритейле. Все как всегда — очень нужны новые и классные идеи. Под катом — интервью с Михаилом Неверовым, Head of Product в департаменте монетизации Big Data в X5 Retail Group. Он рассказывает о том, как работают с большими данными в ритейле. Ну а потом — описание хакатона со ссылочкой на регистрацию.



Немного о больших данных в ритейле с Михаилом Неверовым


Начнем сразу с фактов. В нашем блоге публиковалось довольно много всего о работе компании, но вот о департаменте монетизации, вероятно, мы рассказываем впервые. Так вот, у X5 есть 3 торговые сети и корпоративный центр. В рамках центра работает дирекция по большим данным, и вот уже в состав дирекции входит департамент монетизации.

Он создает продукты, ориентированные на внешний рынок на основе данных, накопленных X5. Поскольку это щепетильный момент, поясню — на внешний рынок поставляются не первичные данные, а результаты анализа и обработки этих данных, деперсонализированные настолько, насколько это возможно.

По факту, департамент монетизации делает нечто вроде Similar Web и «Яндекс.Вордстат» для ритейла. Сейчас в монетизации данных работает сразу 4 продуктовые команды:


Специфика Big Data в ритейле


Огромное количество информации. Объем данных, которые генерируются ритейлом, в частности, сетями X5, огромно. В сутки это несколько терабайт, причем весь этот огромный массив информации не структурирован, данные поступают из нескольких источников, которые часто не связаны между собой.

Влияние внешних факторов. Еще один очень специфичный для ритейла момент в том, что результаты анализа первичных данных можно использовать для формирования гипотез с оглядкой на внешние факторы. А их огромное количество. Например, специалист посчитал, что на выгрузку товара нужно полчаса. На самом деле, времени может понадобиться больше… гораздо больше. Так, при разгрузке машины с рыбой иногда случается неприятность — падает паллет, разбрасывается содержимое коробок. В этом случае требуется уже не полчаса, а три — сначала на то, чтобы ликвидировать проблему, потом — на продолжение разгрузки. И пример с рыбой — одна из сотен реальных ситуаций.

Новизна. Кстати, большие данные стали активно использоваться в ритейле относительно недавно. Об этом можно судить хотя бы по тому, что наш департамент появился пару лет назад, может, чуть больше. А X5 Retail Group — компания, которая активно и повсеместно использует технологии.

Технологичность. Сейчас Big Data используются практически повсеместно. В этой сфере огромное количество инструментов. Благодаря им продавец пытается более эффективно обслуживать покупателя и предлагать ему то, что он хочет, а не просто угадать его потребности, устраивая «ковровую бомбардировку» предложениями. Одно из таких решений — персонализация предложения. При этом речь здесь не только о пресловутых смсках или рекламе вконтакте, а о полном цикле аналитики, позволяющим не только находить тех, кому и что нужно сказать или показать, но и обучаться на своих ошибках, оценивать возврат каждого затраченного рубля, понимать зачем тот или иной покупатель совершает покупку и анализировать более глобальные тренды в покупательском потреблении.

Помимо этого, сейчас большинство ритейлеров идет в сторону оптимизации и автоматизации внутренних процессов: динамическое ценообразование, ассортиментное управление, планирование и прогнозирование спроса и другое. При этом бывшие ранее в ходу местечковые отчёты уже не в почёте. Бизнес требует готовое технологическое решение, готовое с места рассказать, как надо делать и дать четкие ответы на вопросы: «А какой будет эффект?» и «А что, если?». Также за последние пару лет особенно полезными для ритейла оказались capture vision (например, компьютерное зрение для выявления пустот на полках и обнаружения формирующейся очереди) и распознавание речи, что позволяет принимать в режиме real time.

Примеры? А пожалуйста


Один из показательных кейсов работы дата сайентистов в ритейле — анализ нашими специалистами динамики объемов продаж самых популярных продуктов среди болельщиков ЧМ-2018. Сюрпризов не было, но статистика все равно оказалась интересной.

Так, «бестселлером №1» оказалась вода. В городах, которые принимали мундиаль, продажи воды выросли примерно на 46%. Лидером оказался Сочи, где оборот увеличился на 87%. В дни матчей максимальный показатель зафиксирован в Саранске — здесь объем продаж вырос на 160% по сравнению с обычными днями.

Кроме воды болельщики покупали пиво. С 14 июня по 15 июля в тех городах, где проходили матчи, оборот пива вырос в среднем на 31,8%. Лидером также стал Сочи — здесь пиво покупали на 64% активнее. А вот в Питере рост был небольшим — всего 5,6%. В дни матчей в том же Саранске объем продаж пива увеличился на 128%.

Зачем? Данные, которые мы получаем в пиковые дни потребления продуктов, в будущем позволяют более точно прогнозировать спрос с учетом событийных факторов.

Семь раз отмерь, один — отрежь


Несмотря на то, что технологии в ритейле используются все шире, нужно учитывать тот факт, что сама отрасль — просто огромна. Если у вас когда-либо возникал вопрос, почему цифровизация здесь идет не так быстро, как хотелось бы, то ответ простой — не все сразу. Технологические инновации не должны и не могут бежать впереди паровоза.

К примеру, категорийному менеджеру дали возможность подписывать все цифровой подписью. Но это лишь одно направление. Чтобы цифровизация была полезной для всей отрасли, та же технология цифровой подписи должна быть внедрена везде. Если один менеджер работает с цифрой, а второй, из соседнего отдела — с бумагой и ручкой, то технология будет скорее вредной, а не полезной.

В целом, внедрение новых технологий в большой компании должны происходить постепенно. Девиз ритейла в этом отношении — «не революция, а эволюция».

А теперь — все о хакатоне!


Когда? DataMonetize проводится с 18 по 21 июня.

Роадмап следующий:

  • 14 июня — дедлайн тестового задания.
  • 17 июня — результаты и распределение.
  • 18-21 июня — хакатон DataMonetize.
  • 21 июня — демо.

Где? Это простой вопрос, ответ — в онлайне, вот ссылка для регистрации (заявку нужно подать до 14 июня!).

Зачем? Для поиска новых идей использования больших данных в ритейле. Идеально, если новая идея поможет больше зарабатывать. Бизнес есть бизнес.

X5 интересны любые идеи приложений или сервисов на основе геймификации, которые помогут покупателям сделать выбор в пользу магазинов сетей X5 Retail Group — именно за счёт игровой механики. Например, это может быть приложение-компаньон для любителей здорового питания, в котором они могут играя считать калории и выбирать продукты.

Кто может участвовать?

  • Датасайентисты.
  • Разработчики.
  • Аналитики.
  • Дизайнеры.

Принять участие можно только командой. Если ее нет, то организаторы помогут найти тиммейтов.



Что получают участники?

  • Знания о биг дата в ритейле.
  • Шанс побороться за призовой фонд 600 000 ?.
  • I место — 250 000 ?, II место — 150 000 ?, III место — 100 000 ?, специальный приз — 100 000 ?.
  • Экспертную поддержку от X5 и Russian Hackers.
  • Ежедневную доставку еды на время хакатона от организаторов.
  • Крутой тематический мерч, при условии попадания в топ-20 по итогам хакатона.

На хакатон будут приглашены все команды с релевантными идеями, предложенными в рамках тестового задания. 20 командам, лучше всех выполнивших это задание, будут доступны индивидуальные консультации с менторами. На самом хакатоне будут организованы воркшопы и общие менторские сессии, также все вопросы можно будет задать в чате @DataMonetize в Telegram.

На этом все, не пропустите! Дублируем ссылку для подачи заявки.