Всем привет! Мы развиваем идеи первого поста и продолжаем визуализировать и изучать комментарии на ютубе. На этот раз мы поработаем с глобальными и локальными ютуб-сообществами. Как взаимодействуют комментаторы, которые пишут на разных языках? Собирается ли из множества локальных групп единое глобальное сообщество, или дело сложнее, чем кажется? И причем здесь Touhou Project? Давайте выясним.



Комментарии и сообщества — жанровая специфика, численность, языковой спектр


Для ответа на эти вопросы мы исследовали взаимосвязи между группами комментаторов ютуб-каналов, относящихся к сообществу Touhou Project (проект “Восток”). Как правило, эти каналы связаны с серией одноименных компьютерных игр в жанре даммаку (вертикальных стрелялок с огромным количеством пуль). По мотивам игр создается большое количество фан-арта. Из фан-арта и формируется основной контент ютуб-каналов — связанные с играми летсплеи, стримы, музыка, мультипликация и так далее.

Аудитория таких каналов относительно малочисленна, поэтому, с одной стороны, данные легко обработать и визуализировать, а, с другой, полученные выводы можно экстраполировать только на небольшие тематические ютуб-сообщества.

Для исследования были выбраны комментарии трех локальных языковых сообществ — русского, испанского и корейского (названия по преобладающим в комментариях языкам). В категории условно-международного сообщества рассматривались комментарии на английском и частично на японском языках. Так как контент Touhou Рroject изначально производился в Японии, то кана, к примеру, используется в качестве элементов описания на всех других языках.

Данные о сообществах


Все данные каналов кодировались. Каждому каналу присваивался уникальный тысячный номер, а каждому ролику — номер канала + порядковый номер ролика.

Международное сообщество представлено 25 каналами. Всего обработан 243281 комментарий. Код: 1000 — 25000.

(1000, 2000, 3000, 4000, 5000, 6000, 7000, 8000, 9000, 10000, 11000, 12000, 13000, 14000, 15000, 16000, 17000, 18000, 19000, 20000, 21000, 22000, 23000, 24000, 25000)

2) Русское сообщество представлено 9 каналами. Всего обработано 6417 комментариев. Код: 30000 — 38000
(30000, 31000, 32000, 33000, 34000, 35000, 36000, 37000, 38000)

3) Испанское сообщество представлено 8 каналами. Всего обработано 14483 комментария. Код: 40000 — 47000
(40000, 41000, 42000, 43000, 44000, 45000, 46000, 47000)

4) Корейское сообщество представлено 8 каналами. Всего обработано 12968 комментариев. Код: 50000 — 57000
(50000, 51000, 52000, 53000, 54000, 55000, 56000, 57000)

Результаты визуализации


1) Международное сообщество: Ориентированный граф на 50552 узла и 117906 ребер.



Несмотря на общую однородность поля комментариев, заметны два автономных региона с четкими контурами и один рассеянный.

Автономный серый регион на западе — комментарии к роликам канала 8000.



Изолированному региону соответствует не связанный с Touhou контент канала 8000. В основном это ролики с саундтреками к игре Final Fantasy (например, этот).

Автономный зеленый регион на северо-востоке — комментарии к роликам канала 7000.



Ролик 7024 собрал много уникальных комментаторов. Содержание ролика — прохождение игры Undertale. У этой игры есть собственное фанатское сообщество. Вероятно, уникальные комментаторы пришли оттуда.

Рассеянный бежевый регион на юге — канал 3000.



В основном изолированные регионы — это ролики о GTA и других не связанных с Touhou играх (3015, 3036, 3038, 3049, 3051, 3063 и другие).

То есть большинство изолированных регионов в международном сообществе — это не связанный с Touhou контент.

2) Русское сообщество: ориентированный граф на 3655 узла и 5180 ребер.



Наблюдается общее поле комментариев, имеющее тенденцию к разделению на две части, и выделенный (фиолетовый) регион.

Выделенный фиолетовый регион — ролик канала 38000, представляющий собой оригинальный контент — подготовленные авторами канала английские субтитры к композиции на японском языке. Комментарии к ролику на английском языке, комментаторы для этого канала преимущественно уникальные.

3) Испанское сообщество: ориентированный граф на 5866 узлов и 9843 ребер.



Наблюдаются три автономных региона. Красный регион — канал 40000. Оранжево-черный регион — канал 45000. Сине-фиолетово-зеленый регион — канал 46000.

Контент всех трех каналов представлен фан-артом. Вероятно, разделение на изолированные регионы связано со спецификой деления внутри сообщества. Например, контент канала 40000 в основном связан с косплеем, размещенные в нем ссылки также ведут на каналы о косплее.

4) Корейское сообщество: ориентированный граф на 4113 узла и 6763 ребра.



Наблюдаются два больших (фиолетово-синий и зелено-черный), а также несколько мелких автономных регионов (малиновый, оранжевый, темно-зеленый и так далее).

Фиолетово-синий регион: канал 57000. Зелено-черный регион — каналы 51000, 52000 и 53000.

В целом все регионы представлены комментариями к связанному с Touhou контентом. В отдалении от остальных иногда попадаются комментарии роликов с не относящимся к Touhou контентом, например, 52003.

Испанское и корейское сообщества похожи: основную массу комментаторов аккумулируют каналы с большим количеством контента, остальные каналы отчетливо отделены от них. Русское сообщество по сравнению с ними взаимодействует сильнее, что видно по общему региону комментариев. Это объясняется тем, что большинство представленных в выборке русских ютуб-каналов связано друг с другом через ссылки, размещенные на каналах.

5) Все сообщества — локальные языковые (2, 3, 4) и международное (1): ориентированный граф на 62340 узлов и 185412 ребра.



Есть общее скопление комментариев и отходящие от него ветки.

Темно-зеленая ветка в северо-западном направлении — русское сообщество.



Испанское сообщество (серый цвет): его основная часть сконцентрирована на юго-западе.



Отдельная ветка испанского сообщества, представленная каналом 40000, есть в северо-восточном направлении.



Черная ветка в в юго-восточном направлении — корейское сообщество.



Заметно, что корейское сообщество сильнее связано с международным, его основная часть (канал 57000) практически слилась с регионом канала 13000.



Похожая ситуация и с испанским сообществом, его юго-западная ветка (канал 46000) совмещена с международным регионом (канал 20000).



Основная же часть русского сообщества (канал 38000) находится на большом расстоянии от ближайшего международного региона.



Ранжирование каналов по степени взаимодействия


В заключение нашего обзора поговорим о такой штуке, как ранжирование каналов. Наш подход базируется на очень простом наблюдении. Если допустить корреляцию между пространственным расположением комментариев и их пересечением с множеством других комментариев, то чем ближе отдельный комментарий к центральному скоплению, тем больше это пересечение.

На основании этого можно ранжировать комментарии отдельных каналов и роликов, как локальных языковых, так и международных. Пример ранжирования каналов в зависимости от приближенности / удаленности комментариев от общего глобального центра представлены в таблице (каналы распределены вниз по убыванию взаимодействия).



Нужно уточнить, что это лишь один из наиболее простых вариантов ранжирования, когда локальные группы находятся в прямой зависимости от глобального региона. Однако визуализация локальных групп показала неоднородность распределения внешних (глобальных) и внутренних (локальных) связей комментаторов. Высокая связность некоторых каналов испанского и корейского сообществ практически делает их частью глобального региона, но с другими локальными каналами они связаны слабо. Например, испанское сообщество при относительно высокой интеграции с глобальным регионом является разделенным на два практически не связанных друг с другом региона изнутри. Русское сообщество является относительно дистанцированным от международного региона и демонстрирует сильную связанность изнутри. Эти примеры показывают ограниченность простой модели ранжирования локальных групп относительно общего глобального центра. Также это говорит о возможности создания модели, включающей локальную специфику в качестве критериев оценки. Очевидно, что эта задача требует отдельного исследования, чем мы и займемся.

Комментарии (11)


  1. mister_pibodi
    31.07.2018 18:54
    +1

    Всё ждал, что визуализация примет какую-нибудь такую форму, но тут визуализация только на «пулевой ад» из игры похожа, разочарован немного =)
    А так статья интересная
    image


    1. visualcomments Автор
      31.07.2018 23:35

      Спасибо! Поищем нужный тип укладки в Gephi, может получится что-то в этом духе. Знающие товарищи советуют обратить внимание на Yifan Hu Proportional, так как у наших графов есть явное тяготение к кластеризации. Хотя пулевой ад — тоже неплохо.


  1. panchmp
    31.07.2018 19:05

    выглядит красиво, но какой практический смысл?


    1. pnetmon
      31.07.2018 20:02

      Так основное сбор данных в соцсетях и их обработка; визуализация это не основной результат.


    1. visualcomments Автор
      31.07.2018 23:41

      Оптимизация затрат на размещаемый контент, это наверное из самого очевидного. То есть по наибольшим скоплениям комментариев можно определить, где ролик посмотрит максимальное количество народа.


      1. panchmp
        01.08.2018 21:36

        я просто далек от темы
        а обычная статистика просмотров не даст разделения по странам/языкам?


        1. visualcomments Автор
          02.08.2018 19:39

          Открытая статистика просмотров малоинформативна и говорит о канале, а не о его аудитории. Когда мы изучаем по комментаторам аудиторию одного канала, мы можем посмотреть затем, как она пересекается с аудиториями других каналов. Кроме того, комментарий говорит о большей вовлеченности, чем просмотр.


  1. qw1
    31.07.2018 20:16

    Ого, пополню закладки ссылками )))


    1. visualcomments Автор
      31.07.2018 23:45

      Там не всё подходящее оказалось, особенно у корейского сообщества. Но основной корпус «глобальных» ссылок кажется в порядке.


  1. Neikist
    31.07.2018 20:54
    +1

    Хм, немного не по теме, интересно, кто нибудь пробовал делать анализ аниме сообществ на темы типажей персонажей, жанров, сеттингов и подобного?


    1. visualcomments Автор
      01.08.2018 00:00
      +1

      Тоже будет интересно узнать. Уже в процессе изучения контента я нашел испанский канал, где попадались ролики о тохо-косплее, и практически все ссылки этого канала были на каналы о тохо-косплее. И этот канал оказался изолированным от остальных каналов в выборке. Так что можно внезапно обнаружить сообщество в сообществе, как оказалось.