В предыдущих сериях: Big Data — это не просто много данных. Big Data — процесс с положительной обратной связью. «Кнопка Обамы» как воплощение rtBD&A. Философия развития Big Data. BD — еще и Bolt Data. Аналитики BD. В этой серии поговорим о влиянии BD на такую нетехническую индустрию, как журналистика.

Очень схематично — программисты сродни журналистам: обе индустрии используют прошлые навыки (применяют знания предыдущих поколений, разработчиков методик и языков), обе профессии нацелены на модернизацию текущего и происходящего (улучшить жизнь конкретным людям), передовики обоих направлений стремятся подняться на следующий уровень, нацеленный на будущее — стать архитекторами и писателями, влияющими на огромные коллективы последователей и народы.

Обе профессии сильно изменились за последние десятилетия: совместно «похоронены» стенографистки, машинистки, исчезают корректоры, в прошлое уходит промежуточная ипостась «оператор ПЭВМ», а Visual Basic и интернет многократно расширили «входную дверь» в обе профессии. Создание программ и публикация собственного мнения стало доступно «и стар и млад».

И обе профессии ходят под дамокловым мечом шаблонизации: скорость поступления новых задач и информационных потоков из всех уголков, сделавшегося очень маленьким, земного шарика, автоматически привели к росту тиражируемых клише. Все больше программ «составляются» из модулей-библиотек, все больше журналистких коротких материалов-новостей может быть собрано автоматически из типовых обвязок вокруг «голых фактов». Эксперименты по автоматизации программирования и написания статей искусственным интеллектом вошли уже в предпромышленную фазу.

Но никакого пессимизма быть не должно: человечество не разбрасывается классными специалистами — произойдет привычный переток из усыхающих индустрий в набирающие силу. Лет 15 назад, когда уже сформировалась I-ая интернет-волна в журналистике, на встрече в кабинете Ясена Засурского, декана Факультета Журналистики МГУ, на вопрос "Ну здесь-то точно журналистов много есть?!!" Ясен Николаевич грустно покачал головой. В большом кабинете стояли несколько столов, на которых горами возвышались эвересты книг, журналов, газет, альманахов, пропитанных мыслями и временем. А мы целый час азартно обсуждали с доктором филологии куда вывернет стезя будущих выпускников журфака. Честно говоря, жизнь все равно оказалась богаче наших измышлений: блоги и Фейсбук, YouTube и агрегаторы новостей, своеобразный в неповторимости Твиттер, сообщества вокруг путешествующих фотографов и группы единомышленников-комментаторов вокруг всевозможных тематических ресурсов — все это многообразие даже в самых розовых снах не могло привидеться на рубеже веков. Симптоматично, что внук Ясена Никилаевича, «интернетчик» Иван Засурский, возглавляет кафедру Новых медиа на факультете журналистики.

Продолжим дозу позитива и посмотрим, какие тенденции могут усилить позиции передовых журналистов в их стремлении влиять на всё бОльшие группы людей, и чем индустрия Big Data может помочь в этом ре/эволюционном взрыве:

1. Выявление новых трендов
Характерный пример — «Челябинский метеорит». Т.е. речь идет о совершенно новой сущности, которая ранее не существовала, или объект, чей информационный фон был длительное время минимальный.

2. Изменение существующих трендов
Например, выборы во Франции: есть три политические силы и три персоны (Олланд, Саркози, Мари Ле Пен), есть разделение общества на уже сделавших для себя выбор и тех, кто колеблется. Цель «игроков» — получить как можно больший процент голосов неопределившихся избирателей. Следует постоянно анализировать тенденции и реакцию на акции и предвыборные обещания.

3. Рейтинги интересов (медиа-персоны, тематические события)
В любой сфере деятельности общества есть узнаваемые обществом лидеры: это и личности (футболисты, политики, ученые, музыканты), и объекты (Соса-Cola, Москва, Сбербанк, «Зенит»). Сам факт попадания в тематический рейтинг или изменение позиций в рейтингах — сигнал об изменениях в общественном инфополе.

В предыдущих сериях уже говорилось про необходимость различать подходы:
А) персонализированные «много-данных-по-объекту»,
Б) информационное поле данных в индустрии и вокруг объектов.

До недавнего времени для журналистов и общества, которое получало основной поток данных практически только из СМИ, фактически не было альтернативы варианту «А» (тема «Досье»). Новичкам (людям, брендам) необходимо было активно взаимодействовать с прессой, чтобы попасть в круг объектов упоминаний СМИ.

С развитием социальных медиа направление вектора существенно изменилось:
«датчики» (люди, компании, структуры, роботы) много и постоянно генерят данные в информационное поле;
СМИ подстраиваются под новую реальность — из-за конкуренции за скорость выхода новости в редакциях создаются группы мониторинга для раннего выявления инфоповодов;
Роль СМИ изменяется — из-за резко выросшего общего потока материалов в мире происходит тематическое акцентирование и поляризация мнений конкретных СМИ;
Роль СМИ снижается — люди все больше используют и другие информационные потоки, ужесточается конкуренция за время людей, которого так и осталось 24 часа в сутках.

Вот интересные данные, полученные от Brand Analytics по русскоязычному инфополю за неделю апреля:
Дата — Новостей — Комментариев к новостям
02.04.2015 .....147 607… 68 957
03.04.2015 .....126 685 ..103 503
04.04.2015… 69 924… 85 015
05.04.2015… 58 961… 78 819
06.04.2015… 121 247… 92 784
07.04.2015… 148 011… 104 245
08.04.2015… 189 650… 92 011

Т.е. за неделю опубликовано 862 тысячи новостей, к которым сделано 625 тысяч комментариев.

Для тех, кому удобней мыслить в формате данных за месяц — данные за март: новостей — 3,7 млн, комментариев к ним — 2,7 млн. Всего получается 6,4 млн «околоСМИшных» материалов. Совсем немного (0.5%) от потока в 1 МИЛЛИАРД русскоязычных сообщений в соцсетях (плюс немного блогов, форумов, сайтах отзывов и т.д.), генерируемых людьми-«датчиками» по всему миру.

Поэтому неудивительно, что неожиданно возникшему феномену — тот же «Челябинский метеорит» — понадобилось всего несколько минут для появления в соцсетях (Твиттер, YouTube, ВКонтакте) и целых 2-3 часа для появления первой информации в СМИ.

Таким образом, современным СМИ (неважно, в каком формате они сейчас действуют) становятся крайне важным оперативное получение информации от «датчиков» (сайтов производителей, людей на месте событий, роботизированных систем), тематическая фильтрация для снижения «всеядности» и более целевой направленности для читателей, а также оперативное рейтингование, что позволяет «быть в тонусе» и вовремя корректировать свое представление о мире на то, как мир воспринимается обычными людьми.

В качестве реального кейса давайте рассмотрим три рейтинга, регулярно подготавливаемые крупнейшими российскими СМИ на базе анализа неструктурированной информации больших объемов из соцмедиа:

1. Профильный, тематический: ежемесячный рейтинг цитируемости российских СМИ на Lenta.ru
lenta.ru/articles/2015/04/07/bamarch

2. Непрофильный, тематический, ситуационный: во время ЧМ по футболу в Бразилии сайт RT (Russia Today) публиковал ежедневный рейтинг самых популярных материалов «человечества» по футбольной теме
br-analytics.ru/blog/sovmestnyj-proekt-brand-analytics-i-russia-today-ezhednevny

3. Профильный, общий: ежемесячный рейтинг медиа-персон на сайте РИА«Новости»:
ria.ru/infografika/20150402/1055894152.html

Насчет последнего рейтинга — медиа-персон — конечно же куда больший интерес представляет ежедневный рейтинг, отражающий изменения в восприятии общества. Вот таблицы Топ-50 за вчерашний день (26 апреля): отдельно рейтинг СМИ и рейтинг соцмедиа. Найдите множество отличий :-)

Знак "+" рядом с персоной означает, что данная медиа-персона вошла в сегодняшний рейтинг Топ-50 за сутки и отсутствовала в Топ-50 за вчера. Данный рейтинг позволяет сразу оценить, насколько вы в курсе вчерашних событий дня — понимаете ли вы что именно послужило появлению Назарбаева в списке (подсказка: вчера в Казахстане проходили выборы Президента).

Рейтинг СМИ :

№ Кол-во Физ. лицо
1 4528 Владимир Путин
2 1435 Петр Порошенко
3 1070 Барак Обама
4 959 Нурсултан Назарбаев
5 692 Владимир Кличко
6 590 Рамзан Кадыров
7 438 Арсений Яценюк
8 390 Иосиф Сталин
9 387 Дмитрий Медведев
10 375 Дмитрий Рогозин
11 348 Дмитрий Песков
12 337 Адольф Гитлер
13 310 Ангела Меркель
14 296 Борис Немцов
15 295 Виталий Кличко
16 257 Владимир Ленин
17 252 Франсуа Олланд
18 243 Виктор Янукович
19 240 Борис Ельцин
20 209 Александр Лукашенко
21 188 Ринат Ахметов
22 188 Иосиф Кобзон
23 177 Сергей Шойгу
24 152 Федерика Могерини +
25 151 Пан Ги Мун
26 145 Сергей Лавров
27 137 Владимир Соловьев +
28 131 Степан Бандера
29 123 Юлия Тимошенко
30 119 Михаил Саакашвили
31 118 Михаил Ходорковский +
32 115 Герман Греф +
33 111 Александр Захарченко
34 103 Жозе Моуринью
35 98 Роберт Дауни +
36 96 Ким Кардашьян +
37 90 Алексей Навальный
38 86 Михаил Горбачев +
39 82 Фабио Капелло
40 77 Надежда Савченко
41 75 Александр Пушкин
42 73 Джон Керри
43 72 Олег Ляшко
44 68 Лионель Месси
45 68 Наполеон Бонапарт +
46 65 Игорь Коломойский
47 65 Никита Михалков +
48 65 Джен Псаки +
49 64 Аркадий Ротенберг +
50 59 Криштиану Роналду +

Рейтинг Cоцмедиа :

№ Кол-во Физ. лицо
1 144539 Владимир Путин
2 35769 Петр Порошенко
3 31902 Барак Обама
4 25706 Рамзан Кадыров
5 23137 Иосиф Сталин
6 18729 Виталий Кличко
7 14936 Адольф Гитлер
8 14328 Арсений Яценюк
9 13440 Владимир Кличко +
10 13027 Александр Пушкин
11 12799 Владимир Ленин
12 12267 Нурсултан Назарбаев +
13 11995 Гарри Поттер
14 11579 Борис Немцов
15 9377 Криштиану Роналду
16 9326 Эрих Мария Ремарк
17 8816 Лев Толстой
18 8469 Тимати
19 8405 Лионель Месси
20 7974 Альберт Эйнштейн
21 7799 Уильям Шекспир
22 7606 Омар Хайям
23 7429 Сергей Есенин
24 7156 Виктор Янукович
25 6843 Сергей Шойгу
26 6452 Дмитрий Рогозин
27 6402 Высоцкий Владимир
28 6189 Дмитрий Медведев
29 5974 Бернард Шоу +
30 5838 Вера Брежнева
31 5661 Владимир Соловьев +
32 5642 Алексей Навальный
33 5622 Юлия Тимошенко
34 5608 Дмитрий Песков
35 5526 Владимир Жириновский
36 5513 Фабио Капелло
37 5426 Земфира +
38 5391 Джонни Депп
39 5198 Наполеон Бонапарт
40 5006 Анатолий Шарий
41 4943 Степан Бандера
42 4934 Андрей Леницкий +
43 4929 Борис Ельцин +
44 4922 Фёдор Достоевский
45 4899 Сергей Лавров
46 4583 Иосиф Бродский +
47 4572 Фаина Раневская +
48 4467 Ницше
49 4467 Полина Гагарина +
50 4446 Стивен Кинг +

Для формирования ежедневного рейтинга обрабатывается поток 30-40 млн русскоязычных сообщений с учетом «необъектной лингвистики социальных медиа», что позволяет выявлять новые сущности, а не только процеживать данные с предустановленным списком персон.

Подведем итоги и продолжим беседу с Ясеном Николаевичем на тему «Как силами небольшого количества журналистов радовать большее количество читателей?» Как технократический подход предложим «модульную журналистику»:
Информационное море, генерируемое «датчиками» (люди, компании, структуры, роботы) — для русскоязычного сегмента это 30-50 млн сообщений в сутки от 12-15 млн «датчиков»;
Аналитическая система, выявляющая новые тренды («Челябинский метеорит», «Землетрясение в Непале»);
Аналитическая система, отслеживающая изменения существующих трендов;
Аналитическая система, выделяющая именованные сущности (объекты) и ранжирующая медиа-объекты;
Рейтинговая система для мониторинга тематически-связанных объектов.

Подобный набор модулей позволит генерировать от 10 до 90% материалов на вашем контент-ресурсе, позволяя оперативно реагировать на ожидания в информационной поддержке читателей. В той или иной мере большинство изданий уже давно двигаются в данном направлении (например, подборка 5-и новостей на популярном TJournal) — все дело в используемом инструментарии и «доверии» к нам, читателям, в плане понимания наших интересов.

Конечно, умный читатель сразу увидит опасность шаблонизации и «убивания» изданий — если каждое издание (пусть даже в рамках своей тематики, все равно таких много) будет публиковать материалы по принципу «модульной журналистики», то зачем тогда так много однотипных изданий! На этот вопрос у нас сейчас нет ответа, но мы уверены, что творческие люди обязательно найдут творческий выход на следующий уровень :-)

UPD: Рейтинги популярности по комменатриям новостных Сайтов, блогов ЖЖ, Твиттера, ЮТьюба, ВК доступны в открытом доступе на странице pl.ilook.ru

P.S. Для тех блогеров, журналистов, редакций, которым необходимо или интересно быть в курсе событий, можете отправить запрос на адрес pr@br-anaytics.ru с просьбой включить ваш адрес в ежедневную рассылку рейтинга Медиа-персон за прошедший день. Наши коллеги из Brand Analytics готовы бесплатно предоставлять информацию с рейтингами ТОП-50 медиа-персон до конца мая.

Комментарии (0)