Когда человечество приближается к очередной ступеньке роста, сразу появляются люди, предвещающие очередной Апокалипсис и «Все пропало!». Индустрия социальных медиа, составные части которой — аналитика, лингвистика и неструктурированные BigData — также уже несколько раз упиралась в стены, но снова и снова разбивала кокон ограниченного восприятия и перелетала бабочкой к новым высотам.
Из наглядных проблем-решений можно вспомнить:
— «Сбор таких мощных потоков невозможен» — появились новые команды с новыми походами и реализовали Topsy, gnip, SDS;
— «Аналитика неструктурированных объемных разноязычных данных на лету невозможна» — Autonomy, Radian6, Brand Analytics отпровергли невозможность;
— «Лингвистика никогда не справится с такими скоростями» — на смену старым медленным алгоритмам пришли AlchemyApi, EurekaEngine…
Высота очередной новой стены поднялась на новый, уже нетехнологический (здесь, фактически, объем человечества «закончился» раньше), а на социумный уровень - «Данных станет мало и все пропадет!» — этому посылу как раз и посвящена статья.
У нас есть (свой) ответ на очередную пугалку, но перед его публикацией возможно кто-то из коллег выскажет свое мнение? — welcome!
==================
Подходит ли к концу эпоха аналитики социальных медиа?
Одним из величайших обещаний эпохи соцмедиа было то, что они станут своеобразным саморегулирующимся рупором, позволяющим связаться со всем миром. Что, внезапно, все люди в коммуникационном плане станут подобны самым влиятельным и богатым людям планеты, наконец-то повергнув неравенство и свергая деспотов лишь парой постов в интернете.
Но последователей такого виденья процесса становится всё меньше. На смену этой идее приходит другое видение социальных медиа, и личные (и всё более короткие) беседы преобладают на нынешней стадии социальной революции. С победоносным шествием соцмедиа по планете, они всё более отдаляются от идеи вседостигающего рупора и становятся всё ближе к идее личного клуба по интересам, где участники собираются в миллионах закрытых комнатах. Вместо слов во всеуслышание, люди шепчутся между собой. Эти личные беседы, которые передаются лишь только друзьям и подписчикам, недоступны через API и прочие внешние каналы, пригодные для агрегирования данных, что означает, что социальные медиа становятся всё более и более закрытыми от внешнего доступа и уже в недалёком будущем эпоха аналитики социальных медиа (в том виде, в котором она есть сейчас) может подойти к концу.
Почти каждая платформа анализа социальных медиа включает в себя данные по Twitter, и это не случайно. С самого момента своего создания, Twitter преподносил себя как своеобразный “водопровод” социального интернета, представляя то, что, по своей сути, являлось облачной публикационной платформой, предназначенной для доставки миллионов сообщений между множеством получателей по всему интернету. Сама платформа строилась с нуля вокруг идеи «всеуслышанья», где все публикации были по умолчанию публичными, и каждый твит, вне зависимости от того, кто его опубликовал, мог был найден через строку поиска по системе прямо с главной страницы, и для этого даже не нужно регистрироваться. Создатели Twitter даже запустили специальную систему раздачи потоков Firehose, хорошо работающую со средствами автоматического сбора информации, тем самым максимизировали доступность платформы для аналитических систем обработки данных. И именно совмещение основного принципа всеобщей доступности и машинно-дружественного Firehose и сделали Twitter основной платформой для множества систем сбора публичных данных.
Полной противоположностью Twitter предстаёт Facebook который вырос в своеобразный “огороженный сад”, закрытый сегмент интернета под полной юрисдикцией и контролем единой компании. Взамен открытой страницы просмотра и поиска Twitter, Facebook на своей главной странице предоставляет лишь экран регистрации, которую необходимо пройти, чтобы стать очередным участником этого сообщества с чёткими правилами насчёт анонимности и сокрытия личности. Чтобы получить доступ к большей части публикуемой информации, пользователю придётся создать аккаунт и согласиться с правилами использования этой закрытой версии интернета.
Большинство контента — личное, позволяющее при публикации открыть доступ к нему лишь друзьям или подписчикам. Когда твит по умолчанию доступен всему миру, публикация в Facebook доступна лишь друзьям. И даже если когда-нибудь Facebook предложит нам свою версию Firehose, который, по аналигии с Twitter, даст доступ ко всем публичным публикациям, то ввиду природы этой платформы, большая часть информации в него включена не будет, так как она публикуется лишь в личных переписках и не будет доступна для средств сбора публичных данных.
Это, правда, отнюдь не значит, что личные данные с Facebook ничем и никем не собираются – они на самом деле используются везде, начиная от рекламы и новостей, заканчивая активной манипуляцией эмоциями пользователей. Разница лишь в том, что только администрация Facebook может, основываясь на этих данных, проводить исследования общественного масштаба, вроде “как происходит онлайн-общение между женщинами” или “как взаимодействуют родители и дети на просторах интернета”. Если говорить коротко, то если Twitter акцентируется на открытости и доступности всей информации для всех, то Facebook целенаправленно ставит во главу угла приватность информации, хоть при этом личная информация всё равно используется, но только самим Facebook.
И хоть вопрос о том, насколько социальные медиа отражают реальное состояние дел и есть ли у них критические недочёты, очевидно лишь то что “всеобщие” социальные медиа претерпевают глобальный застой. В отношении информативных публикаций и количества пользователей, публикующих контент, а также географического разнообразия, платформы вроде Twitter почти полностью остановились, в то время, как платформы, концентрирующиеся на приватности, вроде Facebook, испытывают постоянное развитие и достигают гораздо более значимых результатов.
В то время, как Twitter и его встраиваемые виджеты дают возможность кому угодно найти любой из полумиллиарда постов, публикующихся на платформе ежедневно, Facebook и прочие сервисы требуют регистрации для получения доступа к их контенту. В этом плане, социальные медиа становятся всё более и более похожи на личный закрытый от чужаков сад, где большая часть данных – приватна и недоступна для средств аналитики социальных медиа.
Объединяя вышесказанное, можно сделать выводы, что будущее для компаний по аналитике социальных меди безрадостное. Хоть сами социальные медиа и испытывают непрерывный рост и дают возможность «подать голос» даже представителям самых отдалённых государств, их разговоры принимаёт вид шёпота за закрытыми дверями, а не громкими криками в рупор. Так как выкрики становятся шёпотом, то и иссякает информация, с которой могут работать средства аналитики соцмедиа. В мире, где социальные медиа представляют собой личные переговоры между друзей, сторонним средствам аналитики делать почти нечего. Подобно самой революции Big Data, хоть данных вокруг нас становится всё больше и больше, но в каком то смысле, мы стали видеть даже меньшую часть мира, чем видели до этого.
======================================
Вот такой вот пессимизм, жизнь неудалась, а затраченные миллиарды денег — выброшены на ветер…
Из наглядных проблем-решений можно вспомнить:
— «Сбор таких мощных потоков невозможен» — появились новые команды с новыми походами и реализовали Topsy, gnip, SDS;
— «Аналитика неструктурированных объемных разноязычных данных на лету невозможна» — Autonomy, Radian6, Brand Analytics отпровергли невозможность;
— «Лингвистика никогда не справится с такими скоростями» — на смену старым медленным алгоритмам пришли AlchemyApi, EurekaEngine…
Высота очередной новой стены поднялась на новый, уже нетехнологический (здесь, фактически, объем человечества «закончился» раньше), а на социумный уровень - «Данных станет мало и все пропадет!» — этому посылу как раз и посвящена статья.
У нас есть (свой) ответ на очередную пугалку, но перед его публикацией возможно кто-то из коллег выскажет свое мнение? — welcome!
==================
Подходит ли к концу эпоха аналитики социальных медиа?
Одним из величайших обещаний эпохи соцмедиа было то, что они станут своеобразным саморегулирующимся рупором, позволяющим связаться со всем миром. Что, внезапно, все люди в коммуникационном плане станут подобны самым влиятельным и богатым людям планеты, наконец-то повергнув неравенство и свергая деспотов лишь парой постов в интернете.
Но последователей такого виденья процесса становится всё меньше. На смену этой идее приходит другое видение социальных медиа, и личные (и всё более короткие) беседы преобладают на нынешней стадии социальной революции. С победоносным шествием соцмедиа по планете, они всё более отдаляются от идеи вседостигающего рупора и становятся всё ближе к идее личного клуба по интересам, где участники собираются в миллионах закрытых комнатах. Вместо слов во всеуслышание, люди шепчутся между собой. Эти личные беседы, которые передаются лишь только друзьям и подписчикам, недоступны через API и прочие внешние каналы, пригодные для агрегирования данных, что означает, что социальные медиа становятся всё более и более закрытыми от внешнего доступа и уже в недалёком будущем эпоха аналитики социальных медиа (в том виде, в котором она есть сейчас) может подойти к концу.
Почти каждая платформа анализа социальных медиа включает в себя данные по Twitter, и это не случайно. С самого момента своего создания, Twitter преподносил себя как своеобразный “водопровод” социального интернета, представляя то, что, по своей сути, являлось облачной публикационной платформой, предназначенной для доставки миллионов сообщений между множеством получателей по всему интернету. Сама платформа строилась с нуля вокруг идеи «всеуслышанья», где все публикации были по умолчанию публичными, и каждый твит, вне зависимости от того, кто его опубликовал, мог был найден через строку поиска по системе прямо с главной страницы, и для этого даже не нужно регистрироваться. Создатели Twitter даже запустили специальную систему раздачи потоков Firehose, хорошо работающую со средствами автоматического сбора информации, тем самым максимизировали доступность платформы для аналитических систем обработки данных. И именно совмещение основного принципа всеобщей доступности и машинно-дружественного Firehose и сделали Twitter основной платформой для множества систем сбора публичных данных.
Полной противоположностью Twitter предстаёт Facebook который вырос в своеобразный “огороженный сад”, закрытый сегмент интернета под полной юрисдикцией и контролем единой компании. Взамен открытой страницы просмотра и поиска Twitter, Facebook на своей главной странице предоставляет лишь экран регистрации, которую необходимо пройти, чтобы стать очередным участником этого сообщества с чёткими правилами насчёт анонимности и сокрытия личности. Чтобы получить доступ к большей части публикуемой информации, пользователю придётся создать аккаунт и согласиться с правилами использования этой закрытой версии интернета.
Большинство контента — личное, позволяющее при публикации открыть доступ к нему лишь друзьям или подписчикам. Когда твит по умолчанию доступен всему миру, публикация в Facebook доступна лишь друзьям. И даже если когда-нибудь Facebook предложит нам свою версию Firehose, который, по аналигии с Twitter, даст доступ ко всем публичным публикациям, то ввиду природы этой платформы, большая часть информации в него включена не будет, так как она публикуется лишь в личных переписках и не будет доступна для средств сбора публичных данных.
Это, правда, отнюдь не значит, что личные данные с Facebook ничем и никем не собираются – они на самом деле используются везде, начиная от рекламы и новостей, заканчивая активной манипуляцией эмоциями пользователей. Разница лишь в том, что только администрация Facebook может, основываясь на этих данных, проводить исследования общественного масштаба, вроде “как происходит онлайн-общение между женщинами” или “как взаимодействуют родители и дети на просторах интернета”. Если говорить коротко, то если Twitter акцентируется на открытости и доступности всей информации для всех, то Facebook целенаправленно ставит во главу угла приватность информации, хоть при этом личная информация всё равно используется, но только самим Facebook.
И хоть вопрос о том, насколько социальные медиа отражают реальное состояние дел и есть ли у них критические недочёты, очевидно лишь то что “всеобщие” социальные медиа претерпевают глобальный застой. В отношении информативных публикаций и количества пользователей, публикующих контент, а также географического разнообразия, платформы вроде Twitter почти полностью остановились, в то время, как платформы, концентрирующиеся на приватности, вроде Facebook, испытывают постоянное развитие и достигают гораздо более значимых результатов.
В то время, как Twitter и его встраиваемые виджеты дают возможность кому угодно найти любой из полумиллиарда постов, публикующихся на платформе ежедневно, Facebook и прочие сервисы требуют регистрации для получения доступа к их контенту. В этом плане, социальные медиа становятся всё более и более похожи на личный закрытый от чужаков сад, где большая часть данных – приватна и недоступна для средств аналитики социальных медиа.
Объединяя вышесказанное, можно сделать выводы, что будущее для компаний по аналитике социальных меди безрадостное. Хоть сами социальные медиа и испытывают непрерывный рост и дают возможность «подать голос» даже представителям самых отдалённых государств, их разговоры принимаёт вид шёпота за закрытыми дверями, а не громкими криками в рупор. Так как выкрики становятся шёпотом, то и иссякает информация, с которой могут работать средства аналитики соцмедиа. В мире, где социальные медиа представляют собой личные переговоры между друзей, сторонним средствам аналитики делать почти нечего. Подобно самой революции Big Data, хоть данных вокруг нас становится всё больше и больше, но в каком то смысле, мы стали видеть даже меньшую часть мира, чем видели до этого.
======================================
Вот такой вот пессимизм, жизнь неудалась, а затраченные миллиарды денег — выброшены на ветер…