Ежедневно в мире создаётся 2,5 квинтиллиона байтов новых данных — это десять миллионов Blu-Ray-дисков общим весом в четыре Эйфелевы башни.

image

С ростом количества гаджетов, развитием пропускной возможности сотовых и проводных сетей и появлением всё новых информационных технологий, объём экономики данных растёт по экспоненте. А вместе с ней — и возможности, которые работа с большими данными открывает. Работа с биг датой меняет на глазах абсолютно каждую сферу человеческой активности — от развлечений до здравоохранения, от безопасности до продуктов питания.

Сейчас, когда значительная часть человечества в той или иной форме на карантине, самоизоляции, а то и в ситуации экономической неопределённости, самое время взглянуть на то, какую роль большие данные уже играют в нашей жизни, а главное — какую роль они будут играть в ближайшем будущем.

Контент и развлечения


Большие данные определяют не только какой фильм или сериал вам предложить посмотреть следующим, но и какие фильмы для вас снимать. Голливуд уже вплотную приблизился к применению биг даты при написании сценариев и кастинге актёров, но пока находится только в начале пути.

image

«Только представьте, что будет, когда Голливуд по-настоящему начнёт пользоваться большими данными», — говорит Ричард Мараши, руководитель аналитики в IBM. Традиционная кино-индустрия, по словам Мараши, пользуется четверной моделью, деля аудиторию по полу и возрасту — моложе 25 и старше 25. Но это уже меняется. Большие данные позволяют делить аудиторию на небывало точные сегменты — вроде домохозяек из регионов, которым нравятся фильмы по комиксам.

И совершенно необязательно ограничиваться только сегментированием и анализом аудитории. Big Data позволяет работать таким образом и с самим контентом. К примеру, Netflix анализирует и сортирует свою огромную библиотеку контента по более, чем 70 тысячам характеристик.

Совмещение этих подходов — детализированного анализа как аудитории, так и контента, который она потребляет, открывает небывалые возможности по созданию нового контента. Это данные, которые производители фильмов, сериалов и игр по всему миру могут использовать при создании новых миров, написании новых сценариев и кастинге актёров.

Консультанты по сценариям, на голливудском сленге известные как Script Doctors, используют не только литературное образование, но и аналитику данных как от кассовых успехов, так и кассовых провалов, взвешивая инвестиционные риски отправляемых им студиями новых сценариев.

Вслед за кино и телеиндустрией большие данные меняют и мир музыки. Облачные сервисы, от эппловского iTunes до YouTube Music оперируют огромными массивами данных о пользовательских предпочтениях и привычках.

Знаете ли вы, например, что, по данным сервиса SoundCloud, средний возраст, когда люди перестают интересоваться новой музыкой — 33 года?

Впрочем, помимо занятных фактов для самокопания, большие данные открывают новые возможности и для бизнеса, позволяя быстрее находить новые дарования и давать им пропуск в мир больших звёзд.

Большие данные меняют все направления креативной индустрии. Последнее нашумевшее событие в мире подкастов — анонсированный «переезд» подкаста Джо Рогана, Joe Rogan Experience, на платформу Spotify, оценивается в сумму не менее $100 миллионов. При этом сам контент шоу Рогана — как весь архив, так и все новые выпуски, будут полностью бесплатны для пользователей платформы и приложения Spotify.

По мнению многих аналитиков, цель дорогостоящей «покупки» как раз-таки доступ к данным многомиллионой аудитории слушателей шоу: их вкусам, интересам, предпочтениям и привычкам.

Спорт — ещё одно направление в мире развлечений, находящееся на пороге информационной революции. Футбольные команды в Великобритании «оказались замечены» в использовании умных датчиков для замера положения их игроков на поле и их пульса. Но это только начало: многие баскетбольные и бейсбольные команды анализируют данные видеозаписей и датчиков как своих игроков, так и команд-соперников, превращая поле битвы мышц и духа ещё и в поле боя данных.

image
Moneyball — это только начало

Данными сыт будешь: биг дата в сельском хозяйстве


Сенсоры и датчики, видеонаблюдение и носимые устройства становятся реальностью не только человеческой жизни, но и сельского хозяйства. The Climate Corporation, подразделение агрогиганта Monsanto ведёт работу с агрохолдингами, фермерскими хозяйствами и разработчиками софта для ретейла, объединяя их в единую мощную сеть Climate FieldView, основанную на больших данных. Climate FieldView даёт фермерам детализированную визуализацию процессов сельскохозяйственного производства, объединённую с данными о потребностями рынка продовольствия, которые позволяют им принимать эффективные информированные решения.

Фермерам доступны данные о погоде, состоянии почвы, влажности, созревании плодов, ходе роста и условиях для скота. Эта информация позволяет максимизировать и оптимизировать производство продукции под потребности рынка в реальном времени.

В Великую депрессию 1930-х годов фермерским хозяйствам зачастую приходилось уничтожать собранный хлеб и выливать надоенное молоко. С помощью технологий больших данных XXI веке подобных проблем можно будет избежать и нужды в таких драматичных мерах уже не останется.

Благодаря большим данным, интернету вещей и облачным технологиям более качественные продукты становятся доступны всё большему числу людей.

Торговля и реклама


Онлайн-шоппинг можно считать уже традиционным и предсказуемым способом применения больших данных. Компания Amazon была одним из пионеров использования больших данных в интернет-продажах, сравнивая покупки сделанные их пользователями, сравнивая их с тем, что покупали другие и пытаясь предсказать, что их клиенту может понадобиться или захочется приобрести следом. Сейчас эти технологии применяются практически в любом крупном интернет-магазине.

Онлайн-реклама — другое важное применение больших данных. Возможно, большие данные смогут «убить» рекламу в её привычном понимании. Ведь что люди обычно называют рекламой? Навязчивое информирование о чём-то ненужном. Но при этом у всех людей есть потребности и проблемы, на поиски решения для которых мы тратим огромное количество времени и сил. Реклама, отвечающая точно существующим потребностям пользователя — это уже не реклама, а полезный совет.

Но для того, чтобы дойти до такого уровня полезности (утратив по пути неприятную «рекламность») маркетологам нужно знать своих клиентов лучше, чем они знают сами себя. Бизнесы ищут своих покупателей и пытаются в буквальном смысле угадать их желания, основываясь на посещаемых ими сайтах, истории их покупок и поиска.

Результат этого будет немного парадоксальным: став, благодаря большим данным, интуитивной, реклама перестанет восприниматься как нечто негативное — просто окружающий мир станет восприниматься чуть-чуть добрее к людям, всегда готовый прийти на помощь и предложить именно то, что нужно или понадобится человеку здесь и сейчас или в обозримом будущем.

Геймификация — ещё один важный тренд современного маркетинга. Геймификация включает в повседневные, неигровые действия элементы игрового поведения, позволяя вовлекать людей в, казалось бы, не самые интересные процессы, побуждая их участвовать в них глубже и добиваться большего. Один из самых старых примеров геймификации — программы накопления лётных миль, призванные накапливать и удерживать постоянных клиентов авиакомпаний.

Чтобы делать программы лояльности эффективнее, компаниям нужно больше данных о потребностях и намерениях своих клиентов и их поведении. Зато, как результат, компании учатся предлагать своим клиентам не только то, что им нужно, но и в наиболее дружелюбной и увлекательной форме.

Безопасность



image
Приходилось ли вам когда-либо при попытке оплатить покупку онлайн картой получать звонок от службы безопасности вашего банка?

Разумеется, это положительный сигнал — ведь это означает, что службы безопасности действительно работают. Однако безопасность, какой бы желанной она ни была, имеет свою цену.

Как показал анализ поведения 20 миллионов держателей карт, в случае двух подобных инцидентов в течение полугода, когда транзакция, совершаемая пользователем, принималась за подозрительную, расходы с «подозрительной» карты в следующие шесть месяцев снижались, в среднем, на 15%, а каждый пятый держатель и вовсе переставал ей пользоваться.

Для бизнесов важно не только бороться со фродом, но и сделать эту борьбу как можно менее заметной для пользователей. Анализ больших данных с помощью машинного обучения позволяет создавать модели «добропорядочного» поведения пользователей, рассказывает Курт Лонг, основатель компании защиты данных FairWarning.

Чем больше данных — тем эффективнее сети ловят хищную рыбёшку, позволяя обычным пользователям наслаждаться безопасной навигацией в океане финансовых транзакций. Благодаря работе с биг датой, современные банки ловят не только мошеннические транзакции, но даже кражи личности до того, как они произойдут.

Впрочем, потребности людей в безопасности онлайном не ограничиваются. Работа с большими данными делает в прямом смысле улицы городов и дома безопаснее. Жители мегаполисов от Лондона до Москвы уже привыкли, что виртуальные полицейские через камеры приглядывают за происходящим буквально буквально на каждом углу.

Разумеется, это порождает много проблем нового времени, включая опасения о защите персональных данных и всевозможных злоупотреблениях. Но нельзя отрицать и того, что просто так напасть на мирного гражданина и скрыться в темноте теперь стало намного сложнее.

Будущее безопасности с использованием больших данных — предсказательный правопорядок. Не так, как в фильме «Особое мнение», конечно — куда масштабнее. И эффективнее.

image
«Прекрайм — это работает»

«Большой брат» помогает определить наиболее криминогенные районы, время и место повышенной криминальной угрозы — и предпринять все необходимые меры: от банального «полицейского на углу» до инвестиций в социалку и образование неблагополучных регионов.

Здоровье и медицина


В разгар пандемии коронавируса и вызванного экономического кризиса по всему миру эта тема особенно актуальна.

Биг дата уже обеспечила существенные прорывы в здравоохранении: сбор, обмен и изучение накопленных учёными и практикующими врачами данных двигает вперёд исследования, позволяет совершенствовать медицинскую разработку, диагностику, лечение и уход за пациентами. По всему миру, включая Россию, на смену толстым бумажным медицинским картам приходят цифровые облачные. Но сбор и обработка данных уже обратившихся за медицинской помощью — не самое главное изменение, которое работа с большими данными привносит в заботу о здоровье людей.

Лучшее лечение — это профилактика. И здесь работа с большими данными ведётся на двух больших фронтах: индивидуальном и государственном.

На индивидуальном уровне аккумуляция как данных исследователей, так и статистических данных носимых устройств позволяет отслеживать риски заболеваний и рекомендовать необходимые чекапы и физическую активность.

На уровне государства вклад и значение больших данных в здравоохранении ещё больше, позволяя отслеживать риск и угрозы для целых популяций, планируя развитие медицинской инфраструктуры и даже социальной и экономической политик.

Однако в разгар пандемии важность больших данных выросла на порядок.

Победить эпидемию, не дожидаясь, пока переболеет большая часть человечества, можно двумя путями: разработав вакцину или лекарство против коронавируса — или взяв под контроль его распространение.

В обоих случаях огромную роль играет работа с большими объёмами данных.

Разработка вакцины, потенциальный спрос на которую — миллиарды людей — очень масштабная задача, включающая в себя многие раунды клинических испытаний, начиная с небольших групп добровольцев до многих тысяч людей на финальных этапах испытаний. В ситуации пандемии это требует координации усилий лабораторий по всей планете, подразумевая обмен и обработку огромного количества данных.

Ещё важнее роль биг даты в контроле распространения коронавируса. Как показывает уже накопленный опыт, многие случаи вспышек связаны с супер-ивентами, когда массовое заражение началось в определённом месте или во время некого большого события. К примеру, последняя заметная вспышка заболеваний в Южной Корее была вызвана всего одним человеком, который, являясь бессимптомным носителем, за одни выходные тусовок в клубном квартале Сеула заразил сотни человек.

Поэтому многие страны мира, от Германии до Индии уже выпускают приложения, которые позволяют в том или ином виде отслеживать перемещение и социальные контакты пользователей, чтобы в случае обнаружения заболевания у одного из них вовремя предупредить о необходимости самоизоляции других людей.

Фактически, работа с большими данными позволяет сделать карантин умным, минимизируя последствия пандемии как для здоровья людей, так и для экономик.

Сложность, масштабность и длительность разработки вакцины, её вывода на рынок и вакцинирования миллиардов людей по всему миру означает, что угроза коронавируса не минует быстро. По прогнозам учёных, до массового вакцинирования ещё не меньше года. Но посадить экономику всего мира на самоизоляцию на год с лишним не получится. Умный карантин с контролем распространения вируса через работу с большими данными — главное, что поможет человечеству пережить время, оставшееся до появления эффективного средства борьбы уже с самим коронавирусом.

Физическое воплощение больших данных


Большие данные — это, в первую очередь, математика, но работа с ними не обязательно должна ограничиваться только абстрактным мышлением. Другие способы восприятия тоже могут помочь. Большие данные уже тесно связаны с другими мощными новинками: облачными технологиями, интернетом вещей, робототехникой, набирающими силу AR и VR-технологиями.

И визуализация больших данных — отдельное интересное направление работы с ними. На помощь здесь приходит технология 3D-печати. Вот, например, как выглядит визуализация клавиш по частоте использования:

image

Это, конечно, пока, в прямом смысле, игрушки. Но, как и у многих других технологий этого обзора, у них большое будущее.

А как вы думаете, какие применения у больших данных ещё впереди?

Хочешь научиться работать с большими данными и расширить знания в аналитике? Записывайся на наш онлайн-курс «Аналитик Big Data». Узнать подробности!