image

Онлайн-энциклопедия «Википедия» содержит огромное количество информации. При этом вся она буквально пронизана сквозными ссылками, так что начав изучение нового протокола беспроводной сети, можно закончить чтением статьи об ископаемых кольчатых червях нижнего силура. Сотрудники самой «Википедии» провели анализ кликов пользователей по ссылкам и постарались ответить на вопрос, почему многих людей серфинг по онлайн-энциклопедии просто затягивает.

Авторы исследования, в первую очередь, изучали статистику переходов по ссылкам. Эти данные позволили понять, какие пользователи и как путешествуют по виртуальным просторам «Википедии». Само исследование проводилось с использованием данных поведенческих паттернов пользователей английской, русской, немецкой, испанской и японской версий энциклопедии.

Стоит признать, что многие пользователи не раз путешествовали по «Вики» самым странным образом. Можно начать с изучения сюжета понравившегося фильма и закончить статьей о форме одежды центурионов армии Древнего Рима. Но почему так происходит? Дело в том, что большинство пользователей посещают «Википедию» для того, чтобы изучить тематику, упоминание которой проскакивало в медиа-ресурсах, прочитанных или просмотренных пользователем. Ну а затем, получив интересующую информацию, пользователь отправляется путешествовать в те места «Википедии», в которые ведет его любопытство. Человек видит ссылку с интересным заголовком — и переходит.

И в этом нет ничего необычного — ведь доступная информация, которой на «Википедии» просто огромное количество, может привлечь внимание кого угодно. Так уж получилось, что структура онлайн-энциклопедии оптимально подходит для безмятежного многочасового чтения. Возможно, более удобную структуру можно придумать, но сделать это не так просто.

Стоит отметить, что большая часть трафика «Википедии» — это поисковые сервисы. Сотни миллионов пользователей ищут что-то в сети и попадают на статьи «Википедии». Это — начало пути большинства пользователей по виртуальному миру знаний. И многие пользователи действительно начинают это путешествие.

В 2015 году энциклопедия впервые показала поведенческие паттерны своих читателей, проанализировав более 7 млн запросов. Объяснение полученных данных можно найти здесь.

Стоит отметить, что с момента попадания в широкий доступ информация о поведении пользователей «Википедии» стала базой для большого количества научных исследований. Так, например, ученые изучили, как «Википедия» влияет на предпочтения пользователей в 2015 году. Также было изучено тематическое распределение интересов пользователей в ходе одного сеанса, плюс получены данные о том, что еще можно улучшить, чтобы у читателя вообще не было проблем с любимым занятием — изучением новых материалов.

Статистическое исследование, проведенное «Вики», базируется на анализе 26 миллионов ссылок, распределенных в примерно 4,4 млн статей с общим числом в 6,7 млрд кликов. Представители энциклопедии построили граф, который показывает, как примерно распределяются интересы пользователей после прочтения статей определенной тематики.



Что касается исследования 2017 года, то его результаты примерно таковы:

  • 60% ссылок (а это 15,6 млн) являются внутренними и насчитывают 1,2 миллиарда кликов (18%);
  • 37% линков посещают пользователи, приходящие извне, например, со страницы поисковой выдачи Google;
  • 3% ссылок (773к) сложно классифицировать, поскольку они не ведут пользователя туда, куда обещают (строго говоря, эти ссылки ведут якобы на внутренние ресурсы, но при попытке посетить сайт пользователь видит ошибку").

В некоторых случаях домены одной тематики остаются малопосещаемыми, поскольку ссылок, ведущих в первые элементы этих доменов, не так много, и пользователей приходит тоже мало. С этим пока ничего нельзя поделать, но разработчики «Вики» уже давно стараются понять, как можно решить эту проблему.
В целом, «Википедия» продолжает развиваться, так что вскоре на чтение ее статей у среднестатистического пользователя сети будет уходить еще больше времени.

Комментарии (13)


  1. OldFisher
    20.01.2018 15:49
    +1

    Для тех, кто зайдёт в статью за этой картинкой:

    xkcd
    image


  1. Alter2
    20.01.2018 15:52
    +1

    Меня на блуждание по ссылкам неделями затянул Лурк в своё время, а из последнего — Encyclopatia. С Википедией к сожалению так не получается, слишком формально написано большинство статей.


    1. Exchan-ge
      20.01.2018 19:43

      на блуждание по ссылкам неделями затянул Лурк


      На Лурке это было сделано специально.


  1. Exchan-ge
    20.01.2018 19:25

    почему многих людей серфинг по онлайн-энциклопедии просто затягивает.


    Ответ простой — подсознание человека хочет уйти от неприятной ему работы, что и приводит к бесцельному блужданию по просторам веба. Причем это характерно не только для Вики.

    Если есть интересная (или срочная) работа — никакого затягивания не происходит, а интересные ссылки, наоборот, вызывают раздражение и быстро пополняют количество закладок или записей в OneNote )

    Кстати, в русскоязычной части Вики в последнее время появилось много статей, мало того, что частично дублирующих друг друга — но еще и не имеющих никаких связей с аналогичными статьями на других языках (английском). Поскольку точное написание слова (термина) на английском языке обычно неизвестно — имеем ту же картину, как и на иллюстрации к этой статье


    1. Kicker
      21.01.2018 20:42

      Не соглашусь, я к примеру просто открываю ссылки в новой вкладке и возвращаюсь к ним когда появляется свободное время. Интерес к новому, не изученному, а не праздный интерес, вот что мотивирует меня, да и многих других.


      1. Exchan-ge
        21.01.2018 21:09

        Интерес к новому, не изученному, а не праздный интерес


        О да, именно так это и выглядит, со стороны сознания :)


  1. romxx
    20.01.2018 20:25

    > В некоторых случаях домены одной тематики остаются малопосещаемыми, поскольку ссылок, ведущих в первые элементы этих доменов, не так много, и пользователей приходит тоже мало.

    Ну да, всякие «Списки малых рек России» и прочее bloat-творчество викиботов, например.


    1. natan555
      20.01.2018 20:40

      А что не так с малыми реками? Помню там была интересная таблица притоков, которую с интересом изучал когда искал «резерват водораздела верховых болот рек Жукова и Поноша»


      1. romxx
        20.01.2018 23:31

        Я предполагаю, что в списки «Реки Камчатского края», числом 472 статьи, вида:
        «Подувальный — ручей на полуострове Камчатка в России.
        Длина реки — около 23 км. Впадает в реку Малая Кимитина справа на расстоянии 83 км от устья.
        По данным государственного водного реестра России относится к Анадыро-Колымскому бассейновому округу.
        Код водного объекта 19070000112220000013694»

        (это все, вся статья)
        ходят исключительно боты, да, собственно, ими и для них они и созданы. Ну и для увеличения показателя «число статей в национальной Википедии».


        1. idiv
          20.01.2018 23:59

          Ботоводство в принципе противоречит одной из идей, что Википедия не должна быть про все на свете. Если посмотреть на топ по количеству статей, то там первая тройка — английская, себуанская и шведская. Вторая — проект просто напросто ботами заполненный, там треть статей — один бот создал.


  1. Alcpp
    20.01.2018 23:44

    3% ссылок (773к) сложно классифицировать, поскольку они не ведут пользователя туда, куда обещают (строго говоря, эти ссылки ведут якобы на внутренние ресурсы, но при попытке посетить сайт пользователь видит ошибку").


    Какая-то часть пользователей не понимает что такое красные ссылки.


  1. SerJook
    21.01.2018 10:53

    А чем Википедия принципиально отличается от остального веба? Во всем вебе происходит ровно то же самое.


    1. kaichou
      22.01.2018 15:22

      Это правда. Как двадцать лет назад зашёл — до сих пор оторваться не могу.