Хабр, привет! Проанализировали кейсы по big data, в которых технологии больших данных помогли компаниям более эффективно работать с клиентами или оптимизировать внутренние процессы.

Кстати, совсем скоро у нас стартует первый набор программы Big Data for Executives, цель которой подготовить руководителя или владельца бизнеса к использованию данных в своей деятельности. Почитать о ней подробнее можно здесь.

Ориентация на клиента


1.Компания: Bookmate.


Отрасль: предоставление контента по подписке — электронные книги.

Bookmate – российский сервис для чтения электронных книг по подписке на мобильных устройствах, имеет более 3 млн. пользователей по всему миру. Совместно с компанией E-Contenta компании удалось решить проблему «холодного старта» — рекомендаций новым пользователям, которые еще не выбирали никаких книг в приложении. Для предложения книг новым пользователям была разработана рекомендательная система, использующая внешние данные – данные социальных сетей и DMP (история кликов, поисковых запросов в Интернете и другие данные о поведении пользователей).

Результат: число просмотров рекомендованных книг новыми пользователями выросло в 2,17 раз, конверсия в платных пользователей выросла в 1,4 раза.

image

2. Компания: BikeBerry.


Отрасль: розничная торговля, интернет-магазин.

BikeBerry.com – американский интернет-магазин велосипедов, мотоциклов и запчастей и аксессуаров к ним. При помощи компании RetentionScience были внедрены сложные алгоритмы машинного обучения и статистические модели для отслеживания и предсказания покупательского поведения. Используемые технологии позволили выявлять и использовать в моделях схемы поведения на сайте, также использовались данные по истории покупок, демографическая и поведенческая информация. В результате магазин смог рекомендовать клиентам наиболее релевантные для них товары и делать персонализированные предложения о скидках только тем клиентам, которые действительно в них нуждались, что позволило увеличить прибыльность, более чем удвоить объем продаж и улучшить ряд других показателей.

Результат: увеличение продаж на 133%, прирост активности пользователей на 200%, удвоение числа клиентов, совершающих повторные покупки, увеличение среднего чека таких клиентов на 30%.

3. Компания: Red Roof Inn.


Отрасль: гостиничный бизнес.

Зимой 2014 г. американская сеть гостиниц Red Roof Inn столкнулась со снижением потока туристов в связи с суровой зимой и неблагоприятными погодными условиями. Однако из-за таких погодных условий в аэропортах ежедневно отменяли большое количество рейсов, пассажиры надолго оставались в аэропортах и нуждались в гостинице. Используя открытые данные о погодных условиях и отмене рейсов, компания смогла отправлять пассажирам задержанных рейсов персонализированные предложения с контактными данными ближайшей к аэропорту гостиницы сети как раз тогда, когда они были наиболее востребованы.

Результат: дополнительный прирост выручки на 10% к предыдущему году даже в условиях сниженного потока туристов.

4. Компания: Skillsoft.


Отрасль: образование.

Skillsoft – американская компания, разрабатывающая образовательное программное обеспечение и контент, один из мировых лидеров в сфере корпоративных образовательных программ. В партнерстве с IBM компания использовала внутренние данные о взаимодействии пользователей с системой, напрямую через программу и через e-mail рассылки, чтобы персонализировать их опыт, увеличить вовлеченность и улучшить результаты обучения. Данные о поведении пользователя в программе использовались для контроля вовлеченности, для определения лучшего времени и канала коммуникации, с помощью которого можно привлечь внимание пользователя. Также на основе предпочтений данного и других пользователей была построена рекомендательная система образовательного контента (84% пользователей оценили рекомендации как релевантные), были предложены оптимальные для каждого пользователя способы визуализации материала.

Результат: рост вовлеченности пользователей во взаимодействие с контентом на 128%.

image

5. Компания: Huffington Post.


Отрасль: медиа, журналистика.

Huffington Post – популярное американское интернет-издание, агрегатор и блог, имеющее множество локализованных версий для различных территорий и языков. Компания использует A-B тестирование для выбора лучших заголовков статей, изучает поведение и предпочтения целевой аудитории, чтобы публиковать материалы, интересные отдельным группам, в часы их наибольшей активности (например, материалы для родителей публикуются поздно вечером по будням, когда дети уже уснули). Компания использует анализ поведения пользователя в браузере и рекомендательные системы, чтобы предлагать пользователям наиболее интересный им контент и делать его наиболее доступным и привлекательным начиная с главной страницы сайта (технология Gravity).

Результат: в августе 2014 г. превышен порог в 100 млн. уникальных посетителей в месяц, достигнуто первое место по популярности в США среди интернет-изданий, среднее число просматриваемых статей за одну сессию возросло до 10-12.

6. Компания: VidiMax.


Отрасль: предоставление контента – фильмы.

VidiMax – российский сервис, предоставляющий лицензированный доступ к художественному и документальному кино, сериалам, мультфильмам, спортивным трансляциям и телешоу. Доступен через смарт-ТВ, имеет около 1 млн. пользователей. Для повышения лояльности пользователей во время бесплатного пробного двухнедельного использования сервиса совместно с компанией E-Contenta была внедрена рекомендательная система, появился блок персональных рекомендаций.

Результат: фильмы в блоке персональных рекомендаций смотрят в 2,5 раза чаще, чем фильмы в подборке из самых популярных фильмов.

Внутренняя оптимизация


1.Компания: Сбербанк.


Отрасль: банки.

Сбербанк использует большие данные и машинное обучение во многих областях, в том числе в кредитном скоринге. Для решения этой задачи компания использует не только традиционные данные, такие как социально-демографические параметры, кредитная история, история трансакций, финансовая отчетность, но и ряд других. Для кредитного скоринга Сбербанк использует также графы связей клиентов, построенные на основе данных о денежных переводах и данных социальных сетей. Для кредитного скоринга компаний используются тексты новостей с их упоминанием, для которых проводится автоматический анализ тональности. В 2015 году компания добавила в модели данные сотовых операторов, что позволило улучшить качество классификатора на 7 п.п. по коэффициенту Джини. Большое число активных сим-карт и небольшое время их работы, мелкие и многочисленные пополнения счетов, подозрительная география звонков указывают на мошенничество и снижают вероятность одобрения кредитной заявки. Для розничных клиентов использование алгоритмов машинного обучения позволило повысить качество скоринговых моделей на 4 п.п. по коэффициенту Джини за счет более точного отбора факторов.

Результат: постоянный рост качества скоринговых моделей, в том числе за счет последних нововведений.

2. Компания: Union Pacific Railroad


Отрасль: транспорт.

Union Pacific Railroad – крупнейшая железнодорожная компания США, имеет более 8 тыс. локомотивов и владеет крупнейшей в США сетью железных дорог. На дне каждого состава компании были установлены термометры, акустические и визуальные сенсоры и другие датчики. Данные от них передаются в центр обработки по волоконно-оптическим кабелям, протянутым вдоль сети железных дорог. Центр обработки также получает данные о погодных условиях, данные о состоянии тормозных и других систем, GPS-координаты составов. Собранные данные и построенные по ним предиктивные модели позволяют отслеживать состояние колес и железнодорожного полотна и предсказывать сход составов с рельсов за несколько дней или даже недель до возможного инцидента. Этого времени достаточно для того, чтобы оперативно устранить проблемы, избежать повреждений состава и задержки остальных поездов.

Результат: компании удалось снизить число схождений составов с рельсов на 75% и избежать значительных потерь (ранее потери от одного схода с рельсов могли достигать 40 млн. $).

3. Компания: Los Angeles Police Department.


Отрасль: государственный сектор – полиция.

Используя решения, разработанные компанией PredPol, полиция Лос-Анджелеса смогла получать наиболее вероятное время и районы (с высокой точностью, порядка 50 кв. м) совершения различных типов преступлений и для их предотвращения направлять туда дополнительные силы полиции. Система использует исторические данные о времени, типе и районе совершения преступлений, обрабатывает их с помощью алгоритмов кластеризации в пространстве и во времени. Предсказательное моделирование осуществляется с помощью математических моделей точечных процессов (Self-Exciting Point Process Modeling). Никакие персональные данные находящихся в городе людей и данные об их местонахождении при этом не используются, что позволяет соблюсти требования приватности частной жизни. Снижение числа преступлений привело к сокращению затрат в полиции, судебной системе и системе исполнения наказаний.

Результат: сокращение числа краж на 33%, снижение числа насильственных преступлений на 21%.

4. Компания: Entro.py.


Отрасль: эксплуатация зданий.

St. Vincent’s – крупная австралийская сеть государственных и частных клиник, расположенных преимущественно в Сиднее и Мельбурне. Управляющая зданиями клиник компания Entro.py совместно с компанией BuildingIQ провела внедрение решения, анализирующего текущие данные по использованию помещений, температурному режиму и погодным условиям, а также характеристики зданий и исторические данные по энергопотреблению для снижения затрат на отопление и охлаждение зданий.

Результат: в 2014 г. затраты на климат-контроль снизились на 12%.

5. Компания: United Parcel Service (UPS).


Отрасль: логистика.

UPS – американская логистическая компания, крупнейшая в мире по доставке посылок и управлению цепями поставок, доставляет более 16,9 миллионов грузов в день в более чем 220 странах мира. UPS использует большие данные для оптимизации маршрутов, сокращения затрат топлива и нагрузки на окружающую среду. Компания применяет радиолокацию для отслеживания грузов, собирает и анализирует показатели множества датчиков для контроля состояния транспортных средств и поведения водителей, использует данные мобильных CRM для мониторинга доставки и качества обслуживания клиентов. Для оптимизации маршрутов и сокращения затрат в компании внедрена система ORION – одна из крупнейших в мире систем, основанных на результатах математической теории исследования операций. Построение оптимальных маршрутов производится в реальном времени с использованием огромных вычислительных мощностей. Для решения этой задачи система использует картографические данные, данные о пунктах отправления и прибытия, размерах и требуемых сроках доставки грузов.

Результат: экономия порядка 6 млн. литров топлива в год, сокращение выбросов углерода в атмосферу на 13 тыс. тонн ежегодно, повышение скорости доставки.

image

6. Компания: ThyssenKrupp AG.


Отрасль: машиностроение.

ThyssenKrupp AG – один из ведущих мировых производителей лифтов, обслуживает более 1,1 млн. лифтов по всему миру. В партнерстве с Microsoft компания запустила систему MAX, которая через Интернет вещей собирает данные от множества датчиков, установленных в лифтах компании (отслеживают скорость кабины, функционирование дверей, температуру мотора и др.) и по ним строит предиктивные модели на платформе Azure Machine Learning. Модели позволяют предупредить инцидент до его возникновения и передать технику конкретный код поломки, один из 400 возможных, чтобы сократить время обслуживания. В результате сокращаются затраты на обслуживание и ремонт (одна поломка обходится минимум в 300$) и создается дополнительная ценность для клиентов: лифты становятся более надежными, безопасными, владельцы расположенных в зданиях магазинов, гостиниц и других организаций не несут убытки.

Результат: время бесперебойной работы лифтов выросло в среднем на 50%.

Узнать о нашей программе Big Data for Executives можно здесь. А тут новый набор на программу «Специалист по большим данным», и до 15 ноября действует скидка 15%.
Поделиться с друзьями
-->

Комментарии (12)


  1. SemperFi
    10.11.2016 18:00
    -3

    «когда биг дата приносит деньги — но в статье ни полслова конкретно про деньги =(


    1. corr256
      11.11.2016 13:20

      биг-дата приносит деньги только от инвесторов :)


  1. atelenga
    11.11.2016 10:00
    +1

    В 2015 году компания добавила в модели данные сотовых операторов, что позволило улучшить качество классификатора на 7 п.п. по коэффициенту Джини. Большое число активных сим-карт и небольшое время их работы, мелкие и многочисленные пополнения счетов, подозрительная география звонков указывают на мошенничество и снижают вероятность одобрения кредитной заявки.

    Очень интересно, как Сбер получает эти данные? Это же очень похоже на тайну связи…


    1. atikhonov
      11.11.2016 11:08

      Билайн программатик


      1. atelenga
        11.11.2016 12:52

        Типа всё автоматизировано и люди в принятии решенй не участвуют? Но всё равно, оно принимается на основании информации ограниченного доступа.


        1. atikhonov
          11.11.2016 12:57

          да, были какие-то разговоры, что с ЗПД что-то не так, с продажей этой информации,
          но они говорили, что данные обезличены, поэтому можно.


          1. atelenga
            11.11.2016 13:07

            Сбер проводит кредитный скоринг для конкретного субъекта (или группы), а обезличенность данных подразумевает невозможность однозначно его/её установить. Противоречие, однако :)
            Мы у себя пару проектов по bigdata для внешнего рынка потому и зарубили, что были ненулевые риски нарушения ЗПДн и ТС.


    1. EreminD
      11.11.2016 13:20

      Видимо, под тайной связи понимается содержание. Никто же не анализирует, о чем вы говорите и пишете.
      Просто время и место. Обычные логи смотрят))


  1. latonita
    11.11.2016 13:20

    Весьма интересно, каким легальным образом, без получения разрешения на использование персональных данных, Сбербанк получает информацию «Большое число активных сим-карт и небольшое время их работы, мелкие и многочисленные пополнения счетов, подозрительная география звонков указывают на мошенничество и снижают вероятность одобрения кредитной заявки»
    Тут банки действуют на грани добра и зла, скорее даже за гранью. Мне один из банков позвонил, когда я перевыпустил симкарту и не смог оператор не смог ответить разумно, откуда они узнал о замене карты. Ситуацию я не развивал, не было времени. Но надо попробовать еще раз )


    1. atelenga
      14.11.2016 12:05

      Если у вас есть привязка номера телефона к карточному счёту в банке, то банк может, помимо номера телефона, запросить у сотового оператора IMSI для авторизации абонента. Это делается для защиты от мошенничества при замене sim-краты или смене владельца номера. Сбер, кстати, снял с себя ответсвенность, прописав в условиях «Мобильногго банка» следующее: «Держатель обязан информировать Банк о прекращении использования номера мобильного телефона, подключенного к услуге «Мобильный банк».»


  1. newartix
    11.11.2016 13:20

    Непонятно как считали результат, применение бигдата скорее всего тюнилось и было размазано по времени, а часть «результата» могли принести какие-то совсем другие изменения в бизнесе.


  1. amakhrov
    12.11.2016 22:22

    Обработка данных сотового оператора по конкретному человеку- это не биг-дата ни разу.