Первоначально у меня была идея провести исследование и написать статью об алгоритмах анализа данных и машинного обучения, которые можно было бы применить для оптимизации работы небольшого интернет-магазина. Но по мере погружения в тему пришел к выводу, что намного полезнее будет сосредоточиться на уже готовых сервисах и инструментах доступных в сети.
На рынке Data Science высокая конкуренция, которая подстегивается постоянно растущей автоматизацией. Решение всех стандартных задач постепенно упаковывается в готовые программные решения и сервисы. И конечную ценность для бизнеса представляет наличие цельных и интегрируемых между собой платформ.
Иными словами, вместо того, чтобы с лопатой в руках соревноваться с трактором, лучше самим сеть на трактор.
Ниже для каждого этапа будет рассмотрено буквально по несколько примеров. Но этих примеров достаточно, чтобы понять суть существующих сейчас на рынке предложений.
1) Яндекс.Wordstat
Статистика запросов в поисковой системе яндекс по ключевым словам. Зависимость от региона и сезонности.
2) Google Trends
Статистика поисковых запросов в Google. География и сезонность запросов.
3) similarweb.com, pr-cy.ru
Посещаемость сайтов потенциальных конкурентов в динамике. Распределение по источникам трафика (поисковики, соц. сети, реферальные ссылки и т.п.). Популярные запросы в поисковых системах, приводящие на сайт. Ключевые слова в поисковых системах, по которым осуществляются переходы.
4) mpstats.io
Мониторинг маркетплейсов Wildberries и Ozon: объемы продаж, цены, остатки на складе. Показатели доступны в динамике.
1) Mindbox
Платформа: персональные рекомендации за счет машинного обучения (лучшие предложения, аналоги, сопутствующие товары), сегментированная рассылка предложений, возможность ручной кастомизации рекомендаций и рекламных кампаний.
2) Рекомендательный виджет Яндекса
Показывает наиболее релевантные статьи с Вашего сайта, увеличивая тем самым глубину просмотра и время проводимое посетителем на сайте. Полезный инструмент для увеличения конверсии и поисковой оптимизации.
3) 1C-Битрикс BigData
Товарные рекомендации посетителю магазина на основе его поведения на вашем собственном сайте или исходя из анализа поведения пользователя на сторонних сайтах.
4) Яндекс.Метрика, Google Analytics
Веб-аналитика, в том числе анализ конверсии в различных каналах привлечения клиентов.
5) retailrocket.ru
Персонализация сайта и рассылок в реальном времени.
1) Navicon S&OP
Система управления бизнес-процессами. Планирование продаж с учетом прогнозирования спроса алгоритмами машинного обучения.
2) Business Scanner
Прогнозирование продаж средствами предиктивной аналитики. Позволяет оптимизировать управление складскими запасами.
3) Visiology
Аналитическая платформа. Прогнозирование продаж.
Все представленные на рынке сервисы с машинным обучением решают два типа бизнес-задач:
Обучение прогностических моделей, по всей видимости, происходит на данных той платформы, которая предоставляет сервис. После того, как модель обучена, сервис встраивается в интернет-магазин и вычисляет прогнозы, опираясь как на данные самой платформы, так и на данные продаж и поведение пользователя в интернет-магазине. Впоследствии возможно дообучение или обновление модели на новых данных.
На рынке Data Science высокая конкуренция, которая подстегивается постоянно растущей автоматизацией. Решение всех стандартных задач постепенно упаковывается в готовые программные решения и сервисы. И конечную ценность для бизнеса представляет наличие цельных и интегрируемых между собой платформ.
Иными словами, вместо того, чтобы с лопатой в руках соревноваться с трактором, лучше самим сеть на трактор.
Этапы применения аналитических инструментов
Ниже для каждого этапа будет рассмотрено буквально по несколько примеров. Но этих примеров достаточно, чтобы понять суть существующих сейчас на рынке предложений.
Этап 1. Выбор продуктовой ниши
1) Яндекс.Wordstat
Статистика запросов в поисковой системе яндекс по ключевым словам. Зависимость от региона и сезонности.
2) Google Trends
Статистика поисковых запросов в Google. География и сезонность запросов.
3) similarweb.com, pr-cy.ru
Посещаемость сайтов потенциальных конкурентов в динамике. Распределение по источникам трафика (поисковики, соц. сети, реферальные ссылки и т.п.). Популярные запросы в поисковых системах, приводящие на сайт. Ключевые слова в поисковых системах, по которым осуществляются переходы.
4) mpstats.io
Мониторинг маркетплейсов Wildberries и Ozon: объемы продаж, цены, остатки на складе. Показатели доступны в динамике.
Этап 2. Персонализация сайта и рекомендательных сервисов, проведение рекламных кампаний
1) Mindbox
Платформа: персональные рекомендации за счет машинного обучения (лучшие предложения, аналоги, сопутствующие товары), сегментированная рассылка предложений, возможность ручной кастомизации рекомендаций и рекламных кампаний.
2) Рекомендательный виджет Яндекса
Показывает наиболее релевантные статьи с Вашего сайта, увеличивая тем самым глубину просмотра и время проводимое посетителем на сайте. Полезный инструмент для увеличения конверсии и поисковой оптимизации.
3) 1C-Битрикс BigData
Товарные рекомендации посетителю магазина на основе его поведения на вашем собственном сайте или исходя из анализа поведения пользователя на сторонних сайтах.
4) Яндекс.Метрика, Google Analytics
Веб-аналитика, в том числе анализ конверсии в различных каналах привлечения клиентов.
5) retailrocket.ru
Персонализация сайта и рассылок в реальном времени.
Этап 3. Оптимизация товарного ассортимента и складских запасов
1) Navicon S&OP
Система управления бизнес-процессами. Планирование продаж с учетом прогнозирования спроса алгоритмами машинного обучения.
2) Business Scanner
Прогнозирование продаж средствами предиктивной аналитики. Позволяет оптимизировать управление складскими запасами.
3) Visiology
Аналитическая платформа. Прогнозирование продаж.
Где именно спрятано машинное обучение
Все представленные на рынке сервисы с машинным обучением решают два типа бизнес-задач:
- Прогнозирование продаж на уровне клиента
Какая вероятность продажи конкретного товара в зависимости от истории покупок клиента на данном сайте или других сторонних сайтах, контекста запроса, цвета кнопки на сайте или канала, из которого пришел клиент. «Под капотом» решаются задачи бинарной классификации, коллаборативной фильтрации или вычисления сходства с уже купленными товарами (content-based рекомендации). - Прогнозирование продаж на уровне товара и магазина
Прогнозирование временных рядов.
Таким образом, прогнозируется либо событие с двумя исходами (купит, не купит), либо временной ряд. Прогноз бинарного события в свое очередь сводится либо к стандартной задаче бинарной классификации, либо к задаче коллаборативной фильтрации.
Обучение прогностических моделей, по всей видимости, происходит на данных той платформы, которая предоставляет сервис. После того, как модель обучена, сервис встраивается в интернет-магазин и вычисляет прогнозы, опираясь как на данные самой платформы, так и на данные продаж и поведение пользователя в интернет-магазине. Впоследствии возможно дообучение или обновление модели на новых данных.