Каждый автор переживает за жизнь своей публикации, после опубликования смотрит статистику, ждет и беспокоится за комментарии, желает, чтобы публикация набрала хотя бы среднее число просмотров. У Хабра эти инструменты кумулятивные и поэтому достаточно сложно представить, как публикация автора начинает свою жизнь на фоне других публикаций.

Как известно, основная масса публикаций набирает просмотры в первые три дня. Чтобы представить, как живет публикация, я отследил статистику и представил механизм мониторинга и сравнения. Данный механизм будет применен к этой публикации и все смогут посмотреть, как это работает.

Первым этапом была собрана статистика о динамике публикаций за три первых дня жизни поста. Для этого анализировал потоки читателей, по публикациям за 28 сентября в период их жизни с 28 сентября по 1 октября 2019 г. путем фиксирования количества просмотров через различные промежутки времени в этот период. Первая диаграмма представлена на рисунке ниже, она получена в результате согласования динамики просмотров по времени.

Как можно посчитать из диаграммы, среднее число просмотров публикации через 72 часа при степенной функции аппроксимации составит ориентировочно 8380 просмотров.


Рис. 1. Распределение просмотров по времени, для всех публикаций.

Так как явно видны «звезды», то представим эти данные без них для стандартной публикации. Отсечение проведем по тем публикациям, которые набрали больше средней величины просмотров за 3 дня – 10225 шт., рисунок 2.


Рис. 2. Распределение просмотров по времени, для средних публикаций, без «звезд».

Как можно посчитать из диаграммы, среднее число просмотров публикации средней востребованности через 72 часа степенной функцией аппроксимации прогнозируется, ориентировочно 5670 просмотров.

Цифры занятные, но есть инструмент с большей практической ценностью. Это средняя доля на каждом временном промежутке. Определим их, и представим на рисунке 3.


Рис. 3. Фактическое распределение по времени доли просмотров от общего количества просмотров за трое суток и теоретические линии аппроксимации, тонкая полином Excel и жирная собственное решение.

Проводить отдельный анализ по кластерам «звезды» и обычные публикации особого смысла не вижу, так как в данном решении все считалось в стандартизированной системе координат, по долям.

Таким образом, можно построить таблицу значений с долями от времени и, соответственно прогнозировать общий объем просмотров за трое суток.

Построим указанную таблицу и спрогнозируем поток по этой публикации



Так как опубликую пост около 0 часов 3 октября, то каждый может сравнить поток с прогнозируемой величиной. Если он меньше, значит мне не повезло, если больше, значит читателям интересно.

Постараюсь представлять по мере наблюдения реальный поток на графике ниже.


Рис. 4. Фактический поток читателей этой публикации в сопоставлении с теоретическим прогнозом.

В заключение могу сказать, что каждый автор может брать для себя ориентиром расчетную таблицу, которая представлена выше. А поделив реальный поток своей публикации в определенный момент на значение в колонке доля для этого момента, может спрогнозировать количество читателей на конец 3-их суток. И в течении этого периода у авторов имеется возможность тем или иным образом повлиять на читаемость его материала, допустим, активнее и подробнее отвечать в комментариях. Также можно сопоставлять свою публикацию с другими, понимать, как внешние публикации влияют на приоритеты читателей. Единственный совет, прошу понимать, что эти цифры получены на анализе потока читателей публикаций всего одного дня, 28 сентября 2019 г.

Комментарии (30)


  1. aik
    03.10.2019 03:24

    Количество просмотров — как-то последнее, на что смотришь. Душу больше греют комментарии. Ну и плюсики в оценке. :)


    1. WhiteBlackGoose
      03.10.2019 07:57

      А мне — просмотры. Мои очерки никто не комментирует, так что приходиться смотреть на просмотры. Плюсики тоже не греют, зайду на пикабу — а там 12к у кого-нибудь, а тут так, в общем, почти случайный, нестабильный рейтинг публикации.


      1. aik
        03.10.2019 08:11

        Просмотры — они односторонние. Ничего не говорят о том, сколько народу именно прочитало. Если, конечно, они тут не работают как «дочитывание» в яндекс.зене.

        А вот комментарии и плюсики (да и минусики) — обратная связь.


      1. Dimtry44
        03.10.2019 16:53

        Мои очерки никто не комментирует
        Можно в конце статьи явно попросить критический комментарии, плюс правильно составленный и формленный опрос делает чудеса. Большинству нетрудно сделать пять-шесть кликов, но влом писать буковки.

        Так что если вы продумаете опрос так чтобы он был достаточно адекватный и не сильно большой, то люди дадут фидбэк гораздо охотнее чем в комментариях.

        Я думаю что было бы хорошо если ТМ (Boomburum ) имело некий шаблон рекомендованного опроса для подобного. Чтобы пользователь не продирался через фантазии разных людей когда его просят пройти подобное, а выбрал из знакомых пунктов и опций.


        1. Boomburum
          03.10.2019 18:26

          Не очень понял про «рекомендованный опрос для подобного» — можете подробнее рассказать?

          В остальном согласен — потыкать в голосовании проще, чем написать комментарий. Комментариев всегда меньше, чем респондентов, поэтому я всегда стараюсь поставить опрос там, где нужно собрать мнения (недавний пример — с минусованием).


          1. Dimtry44
            03.10.2019 19:03
            +1

            рекомендованный опрос для подобного
            Некий опрос общего вида. Несколько секций с множественным выбором типа (просто для примера)

            «Что понравилось в статье»
            — Тема статьи
            — Качество материала
            — Детальность
            — Иллюстрации
            — Подача материала
            — Другое (написать своё)

            «Что не понравилось»
            — Недостоверная информация
            — Слишком поверхностно
            — Слишком кратко
            — Много воды
            — Автор не разбирается в предмете
            — Плохой слог
            — Плохое оформление
            — Не соответсвует тематике ресурса
            — Другое (написать своё)

            т.е. любой автор взял по выбору из нескольких похожих секции со страницы ТМ для помощи автору (или даже предлогать автоматом при написании статьи) и вставил к себе, чтобы не придумывать своё, потому что большинство сделает хуже чем то что было обдумано и обкатано несколько раз. Плюс если захотел сначала свои собствтенные секции вставил по тематике статьи, а потом общие. Ну и через некоторое посетители привыкнут и им будет легче отвечать, без необходимости каждый раз расшифровывать что новый автор придумал в этот раз.


            1. Slavik_Kenny
              03.10.2019 19:11

              Такой опросник можно автоматически прикручивать ко всем статьям в песочнице — вот авторы и получат фидбек о том, почему никто статью опубликовывать не хочет ценой инвайта :)


              1. Dimtry44
                03.10.2019 20:54

                На самом деле подобный опрос решает две проблемы для всех статей и одну для ТМ

                1. Большевики (большиство без кармы) получают возможность оставить так страстно ими желаемую оценку, опросы не завясят от кармы

                2. Авторы получают так ими желаемый более детальный отчёт по их работе

                3. ТМ привлекает зарегистрированных пользователей, так как только они имею право послать опрос

                Я бы еще одну секцию добавил

                «Советы автору»
                — Напиши продолжение
                — Напиши более детальный разбор
                — Сделай TLDR
                — Поправь оформление
                — Сделай цикл по теме
                — Не можешь петь, не пейпиши
                — Другое (написать своё)

                Ну и добавил функциональность в опросник при выделении одного чекбокса, можно было иметь под-секцию с более детальными ответами для конкретного пункта.


        1. WhiteBlackGoose
          03.10.2019 18:45

          Я и так делаю опросы, и люди даже тыкают. Но комментарии нужны чтоб статья больше просмотров собрала, а не для фидбека). А критические мне не очень интересны, учитывая насколько широка аудитория хабра я и так вижу эти критические отзывы:
          1) Слишком просто, тут серьезные люди сидят
          2) яннп
          И поэтому я уже не прошу критику, ну ее). Пишу для себя и для той пары подписчиков.


    1. udvnl
      03.10.2019 10:07
      +2

      Мне больше греет добавление в избранное. Значит не зря написал пост, если его потом планируют перечитывать.


      1. WhiteBlackGoose
        03.10.2019 10:55

        Во, и это тоже


        1. Sistemaalex Автор
          03.10.2019 12:22

          По связям качественных признаков со статистикой, надежных данных пока не получилось найти. В одном аналогичном материале на Хабре было заявлено, что имеется существенная связь с закладками. Но я когда статистику прогонял, то увидел больше признаков связи потока читателей с плюсиками/минусами.
          Пока так обстоят с результатами


      1. VolCh
        03.10.2019 20:28
        +1

        Вот интересно Хабр отслеживает как часто переходят по закладкам. Boomburum.есть такая статистика?


        1. Boomburum
          03.10.2019 20:51

          Насколько я знаю, не трекаем, но хорошая идея, пригодится для одной планируемой фичи.


  1. Slavik_Kenny
    03.10.2019 03:29

    в период их жизни с 28 сентября по 1 октября 2019 г.

    т.е. за выходные…
    Многие читают хабр по будням (на работе), сделайте то-же самое для вторник-четверг, очень интересно будет посмотреть на разницу в графиках.


    1. Sistemaalex Автор
      03.10.2019 11:44

      Без сомнения интересно будет увидеть влияние следующих факторов:
      1) день недели;
      2) время суток;
      3) интенсивность потока предыдущих публикаций;
      4) группировка по хабам;
      5) тема публикации;
      и многое другое.
      С этого мотива и начал, чтобы понять, когда лучше публиковать материал. Но там, пока, данные невнятные. А в данном аспекте модель сформировалась четко и я ее и опубликовал.


  1. striver
    03.10.2019 09:26

    Ранее были посты о том, когда статьи читают на Хабре, в целом просмотры и ответы. На выходных — полное затишье. То есть, для такой выборки нужно учитывать не только время, но и день недели.


  1. nckma
    03.10.2019 09:41

    Мой опыт такой: лучше всего стартовать статью во вторник/среду.
    Если в первый день статья не набирает много голосов, то второй и третий день будут почти без результата. Это происходит потому, что пока статья находится в «лучшие за сутки» ее смотрят. Потом она перемещается в «лучшие за неделю» или вообще выбывает из «рекомендованных», тогда все…
    Еще я бы на вашем месте рассмотрел другие площадки для публикации, например, журнал Хакер. Там вы даже что-то сможете заработать на статьях. На хабре это гораздо труднее.


    1. Sistemaalex Автор
      03.10.2019 11:59

      Где-то со вторником-средой согласен.
      То, что первый день дает основной поток, тут математика однозначно подтверждает из таблицы следует, что 70%.
      А другие площадки, пока не понимаю, чем они различаются друг от друга. На мой взгляд, разница между ними не несет существенных изменений, для меня. Но возможно какие-то аспекты проходят мимо моего внимания.


      1. nckma
        03.10.2019 13:08

        Есть площадки, которые платят авторам деньги за статьи. Просто нужно договариваться с редакцией, обговаривать темы статей, тщательней прорабатывать материал.
        У хабра так же есть ППА — программа поощрения авторов, но по ней очень сложно что-то получить, слишком высокие требования.


        1. Sistemaalex Автор
          03.10.2019 13:27
          +2

          Понял. Спасибо. Пока мне легче заработать в своей отрасли. То есть затраты времени на статью существенные и на своем поле я за эти усилия получу гораздо больше. Пока пусть это будет хобби.


  1. kababok
    03.10.2019 10:42

    В Германии, например, сегодня выходной. И многие взяли отгул/отпуск и на завтра и укатили из городов.


    То есть — многим может быть лень сидеть в интернете.


    Что может таки немного повлиять на количество просмотров… :)


    А статья интересная, спасибо!


    1. Sistemaalex Автор
      03.10.2019 12:14

      Качественные, внешние факторы влияют на динамику просмотров. Сами по себе данные потока, не внятно отвечают на вопросы почему так происходит, только больше-меньше и относительные показатели. Поэтому и удивил третий рисунок, эта модель для анализа показывает, пока предварительно, что она работает как струна. На рисунке это показал. Для каждой публикации свой график, а вместе конфигурируется как оркестр. Такой аспект мне еще не попадался.


      1. user_man
        03.10.2019 13:26

        >> данные потока, не внятно отвечают на вопросы почему так происходит

        Общая схема такая — читают ежедневно, но в основном постоянные читатели. После первого дня основная масса постоянных удаляется, ибо прочитали. Второй день дочитывают те, кто был в отгуле в первый день. Третий и далее — случайные читатели, посещающие сайт нерегулярно.

        Но есть явное влияние комментариев. Если тема набрала много комментариев или высокий рейтинг — её замечают (в том числе сайт поднимает её в списке, возможно это главный фактор). Поэтому получается «струна», то есть основная масса прочитала, а потом смотрит на комментарии, если комментарии интересные — снова комментируют, чем реализуют положительную обратную связь, струна из прогиба выходит на новый подъём.


        1. Sistemaalex Автор
          03.10.2019 14:20

          На мой взгляд, то что вы описали это эффект резонанса. А он возникает и применим на струне (струны могут быть разные от гитарной до моста). Поэтому и удивился, когда увидел модель струны на потоке. Как один из примеров, который попадался, это анимационная модель возникновения пробок на автомагистралях (кажется немецкие ученые такую модель выставили в сеть). Тогда, если поток можно представить в модели струны, то могут появится инструменты создающие пробку, так и увеличивающие поток.
          В вашем примере — это как ответить на комментарий, так чтобы он усиливал резонансную амплитуду.
          А если это можно смоделировать, то можно и запрограммировать. А реализацию можно поручить роботам. Допустим отдельный робот, который вставляет комментарии, с виду вроде бы не существенные, но на самом деле усиливающие резонанс. Отследить такого робота сегодня практически невозможно. Он сделал пять комментов по четыре слова на 500, как его увидишь?


      1. Boomburum
        03.10.2019 15:27

        Кажется, тайна разгадана :) Осталось понять — мозговой слизень или нет )



        Спасибо за статью, интересная!


        1. Sistemaalex Автор
          03.10.2019 18:10

          Ну надеюсь не злокачественный :)


  1. Source
    03.10.2019 16:29
    +1

    Единственный совет, прошу понимать, что эти цифры получены на анализе потока читателей публикаций всего одного дня, 28 сентября 2019 г.

    Какой смысл собирать "статистику" за 1 день? Уж, если задаваться целью какие-то выводы делать, то хотя бы за 3 месяца надо смотреть.


    1. Sistemaalex Автор
      03.10.2019 19:30

      то хотя бы за 3 месяца надо смотреть

      Три месяца это ориентировочно 3500-4000 публикаций. Это очень избыточный анализ получится. Основные статпоказатели, где-то за пределами 200 степеней свободы перестают видеть разницу.
      Какой смысл собирать «статистику» за 1 день

      Не за один день, а на непрерывном временном интервале размером 24 часа, в течении которых было опубликовано 21 публикация, 20 в дату 28 сентября и одна за несколько минут до 24:00 27 сентября, но по сути она свою востребованность реализовала в период с 28.09 по 01.10 2019 и поэтому ее включение допустимо. В результате исследования было проведено 33 фиксации состояния показателя «Количество просмотров публикации» для обследуемых объектов. По полученным данным было исследовано поведение пользователей.

      Ну а в общем: «Сколь угодно смещенная оценка точнее отсутствия оценки вообще»
      На этом принципе построено доказательство множества теорем, которые звучат следующим образом:
      «Для произвольного ? > 0 существует натуральное число N0, что |Sn| ? ? для всех n > N0»
      Сколько задач, в численных методах, начинают решаться с выбора первого приближения?
      И зачем тогда, в анализе функций, люди начинают исследование их с определения точек: экстремума, перегиба, особых, разрывов?


    1. qbertych
      03.10.2019 19:41
      +1

      Да тут ни статистикой, ни обработкой не пахнет. На три графика три зависимости, причем все без малейших попыток аргументации.


      Про нормировку можно даже не вспоминать, про попытку посмотреть на Фурье — и подавно.