На наш взгляд, создание «идеального поста» — это не только процесс выбора темы и написание текста. Немалая доля успеха заложена в оформлении и тех обстоятельствах, при которых статья опубликована. Длина заголовка, количество текста до ката и привлекающая картинка — все эти факторы имеют свой вес. Хотели бы Вы получить на 30% больше просмотров, просто поменяв оформления поста и время размещения?

Мы в Cloud4Y хотели бы. Поэтому мы провели глубокий анализ публикаций на Хабрахабре за последние полгода и сегодня хотим поделиться новыми полезными находками.

Как распределены публикации по количеству просмотров на Хабрахабре?


Нормальное распределение чаще всего рассматривается как подходящая модель для описания процесса, на который действует большое число независимых случайных причин. В этом случае плотность распределения случайной величины имеет симметричную, колоколообразную форму. Однако, в некоторых случаях наблюдения показывают, что случайная величина имеет заметно скошенное распределение, например, в случае распределения публикаций по количеству просмотров, так как их количество не может быть отрицательным. Мы пришли к выводу, что логнормальное распределение является наиболее подходящим для описания распределения постов на Хабре.



В чем же состоит различие в процессах, приводящих к нормальному или логнормальному распределениям? Как мы сказали ранее, оба распределения имеют место, когда на описываемый объект воздействует множество случайных и независимых факторов. Если воздействия каждого из факторов складываются, имеется аддитивный характер их взаимодействия, то имеет место нормальное распределение.

Если воздействия каждого из факторов не складываются, а перемножаются, имеется мультипликативный характер взаимодействия, что часто соответствует Логнормальному распределению. Факторы также независимы как и в случае нормального распределения, но эффект от их воздействия накапливается в объекте в зависимости от предыдущего их количества.

Рассмотрим процесс набора просмотров у публикации. Понимание процесса позволит построить адекватную статистическую модель. Популярность поста складывается из множества факторов, о которых мы поговорим позже. Публикуемая статья попадает в раздел «ВСЁ ПОДРЯД». С часа публикации у поста есть сутки, чтобы продвинуться на первые позиции в разделе «ЛУЧШИЕ — За сутки», неделя, чтобы набирать просмотры в разделе «ЛУЧШИЕ — За неделю», и так далее.

Однако, в этих, как и в любом другом разделе «ЛУЧШИЕ», статьи сортируются по убыванию рейтинга. Голосовать за статьи можно только в первые 72 часа с момента публикации. Поэтому самый важный показатель, влияющий на позиции статьи в ТОПах, будет известен уже спустя трое суток и более не изменится. В результате этой сортировки получается мультипликативное взаимодействие, когда каждый последующий голос воздействует на публикацию пропорционально её текущему состоянию. Один голос будет приводить к разным последствиям (просмотрам) в случае самого первого голоса или добавочного к уже существующему рейтингу. Если бы не было накопительного эффекта от уже набранного рейтинга и количества просмотров, статьи были бы распределены нормально. В нашем случае более адекватной моделью является модель мультипликативного взаимодействия и логнормальное распределение. Оно учитывает не только случайное воздействие факторов, но и накопленное состояние поста.

Зная модель распределения, мы можем приводить в анализе не только средние значения, но и границы доверительного интервала, делая акцент на вариабельности показателей. Это дает возможность читателю не концентрировать внимание только на среднем и рассмотреть также вероятностную природу получения различных показателей популярности постов.

Фактор #0 — длина заголовка


Короткий и завлекающий заголовок — одна из основных причин, по которой пользователь начнет читать анонс статьи.

Возможно, есть всего секунда, чтобы получить дополнительный кредит внимания пользователя, который пробегает глазами заголовки статей. Короткий заголовок укладывается в этот норматив.

Возможно, читателю будет слишком мало 15 символов «идеального» короткого заголовка и он начнет читать анонс. И вот пользователь, завлеченный интересным текстом до ката уже открыл полный текст статьи.

Так или иначе, при увеличении длины заголовка среднее число просмотров статьи падает.



Фактор #1 — длина текста до ката и наличие картинки


Не нужно объяснять, что анонсы статей на Хабре находятся в общем списке. Пользователи отделяют текст анонса от основного тела статьи с помощью тега

<cut />

Мы посчитали длину текста до ката в 6500 постах. Разделили публикации на группы по количеству символов текста и наличию картинки, либо видео с YouTube до ката. Вот, что получилось:



Оказалось, что при прочих равных, не вставляя картинку или видео до ката, теряется около 17,5% просмотров. Этот показатель падает при росте длины текста анонса. Наибольшую популярность получают статьи с длиной текста от 1350 до 1500 до ката. Слишком короткий текст до ката, особенно без вставки картинки или видео, снижает популярность статьи, по причине незаметности для читателей, листающих ленту публикаций.

В конце графика среднего числа просмотров статей без картинки до ката и длиной текста более 1500 символов мы видим снижение популярности таких статей. По всей видимости, причиной этому является то, что пользователь успевает оценить статью и в части случаев принять решение не продолжать чтение.

Также стоит отметить, что из выборки были удалены все статьи со списками до ката (тег ul). Если в анонсе есть списки, длину ката нужно рассчитывать по количеству строк, а не по количеству символов.

Фактор #2 — длина текста публикации




Наибольший рейтинг собирают длинные статьи


На графике видно как средний рейтинг статей ползёт вверх, продвигаясь вдоль растущей шкалы длины текста публикации. Для анализа мы собирали текст статей в ячейки Excel, в результате чего у нас появилось ограничение в 32767 символов для статьи. Среднее количество символов в статьях на Хабре — 10500, а статей больше 32767 символов всего 232 из 6525 (3,6%). По снижению рейтинга в конце графика мы можем лишь предположить, что максимальный рейтинг набирают статьи от 30к до 32к знаков.

Оказывает ли частота появление картинок в тексте влияние на её популярность?


Нет, мы не обнаружили такой зависимости. Мы разделили публикации на группы по количеству символов. В каждой из этих групп мы рассмотрели среднее число просмотров у публикаций с разным количеством символов на 1 картинку. Явного убывающего тренда при снижении частоты появления картинок в тексте нет. Возможно, результаты стоит пересчитать для выявления зависимости популярности статьи от частоты появления в тексте вставок кода.


Частота картинок в тексте не определяет популярность статьи.

Фактор #3 — конкуренция


В нашей предыдущей статье «Анализ публикаций на Хабрахабре за последние полгода. Статистика, полезные находки и рейтинги» мы обнаружили, что наибольшее среднее число просмотров набирают посты, опубликованные в субботу и воскресенье. Причина этого в том, что в эти дни публикуется наименьшее число статей за всю неделю. Результатом относительно низкой конкуренции является то, что каждая статья набирает большее число просмотров.

53,9% постов за анализируемый период написано в личных блогах, 46,1% размещены в блогах компаний. Большая часть компаний делает свои публикации в рабочие дни. Выбор у читателя в будние дни больше и на каждую статью приходится меньше внимания.



Рецепт «идеальной» публикации =


  • Короткий заголовок от 11 до 15 символов
  • Анонс до ката длинной от 1350 до 1500 символов
  • Картинка до ката
  • Текст статьи от 30к до 32к символов
  • Публикация в ночь с пятницы на субботу

Все эти рекомендации помогут вашей статье стать популярнее по сравнению с этой же статьей, но опубликованной в другое время и иначе оформленной.

В конечном счете у любой статьи будет 72 часа, в течение которых пройдет голосование, которое определит будущее вашего поста. При приготовлении поста «по рецепту» некоторые обстоятельства будут идти вам на пользу, а не против вас. Хабрахабр даёт возможность именно пользователям определять судьбу каждой публикации. Поэтому интересные статьи набирали и будут набирать наибольшее число просмотров.

P.S.


Задавайте вопросы в комментариях, по возможности постараемся рассчитать и опубликовать интересующую вас статистику по этой теме. По ссылке в нашей группе vk, можно скачать файл Excel c данным о публикациях, которые мы собрали для этого анализа.
Поделиться с друзьями
-->

Комментарии (41)


  1. Analitik_Telecom
    04.05.2017 08:17
    -1

    Упс, да?) Нормальные компании дрочат не на просмотры и рейтинги, а на реальный эффект. Ну получит какой-то облачный сервис или ЦОД в субботу просмотры, а к понедельнику про его сайт забудут. Некоммерческие пользователи — да, им выходные выгоднее.


    1. Cloud4Y
      04.05.2017 08:21

      Вы считаете, что реальный эффект не пропорционален рейтингу? Зачем по вашему мнению вся эта система на Хабре?


      1. Analitik_Telecom
        04.05.2017 08:52
        +2

        Я уверен в этом. Я никогда не говорю о том, в чем не уверен. Статья с +17 в выхи не дает и 50 переходов, статья с + 10 в четверг дала 470 переходов. И просмотры, увы, не всегда пропорциональны эффекту. Вы много факторов не учли в исследовании.


        1. Cloud4Y
          04.05.2017 08:57

          Это ведь были абсолютно разные статьи? Мы говорит о том. что одна статья может в разных обстоятельствах и при разном оформлении набирать разное количество просмотров и разный рейтинг.

          Вы сразу поставили себя на место «нормальных компаний» и считаете свой опыт лучшей практикой. При этом ваш минус, возможно, обусловлен тем, что мы конкурируем на рынке.


          1. Analitik_Telecom
            04.05.2017 09:22

            Я не компания. И точно вам не конкурент. Я с радостью плюсанул ваш предыдущий пост, он был шикарен. Вы решили повторить успех и сыграть на той же теме, но нет…


            1. Cloud4Y
              04.05.2017 09:29

              Спасибо за отзыв о нашей работе.
              Чтобы нам стать лучше, подскажите какие минусы у этого поста? Кроме повторения темы.


              1. Analitik_Telecom
                04.05.2017 13:48
                +1

                Вот давайте прямо по вашим советом и с позиций публикации в корп. блоге (потому что хорошая частная статья заходит всегда, хоть утром 1 января).

                Короткий заголовок от 11 до 15 символов — заголовок должен быть не короткий, а понятный и в то же время не очевидный.

                Анонс до ката длинной от 1350 до 1500 символов — соглашусь, всё так.

                Картинка до ката — она вообще рассчитана в том числе на виральность в соц сетях. Но как минимум она должна быть, это факт.

                Текст статьи от 30к до 32к символов — очень странное число символов. Такие посты могут быть уже слишком «водными». Вообще я бы рекомендовал вам сделать исследование в разрезе потоков — потому что при ваших подсчётах в выборку попали посты с программным кодом, который пожирает немерянное количество символов. В том же потоке «Управление» 30 к знаков — гарантия бочки воды в статье.

                Публикация в ночь с пятницы на субботу — для коммерческих задач просто no comment, статья пролетит практически впустую, за очень редким исключением (например, когда стоит ссылка на закачку игры или цель продать что-то для физ.лиц ).


                1. Cloud4Y
                  04.05.2017 14:00
                  -1

                  Получается, что Вы во многом согласны. Да, вы правы, нужно учитывать цели публикации, не всегда количество просмотров будет главным показателем. Но корреляция просмотров с любым KPI в большинстве случаев будет положительна.


                1. Myosotis
                  04.05.2017 18:23
                  -1

                  Надоели эти картинки до ката. Бывает, такие публикуют, что неловко ленту хабра листать на рабочем месте. Особенно раздражают картинки на пол-экрана.


        1. Nikobraz
          04.05.2017 10:21
          +1

          Я в выходные давно вообще не захожу, статей почти нет. А с понедельника с утра начинают выкладывать самую вкуснятину.


          1. nckma
            05.05.2017 10:53
            +1

            Мне кажется, что я уже видел подобную статью на хабре, но там утверждалось, что лучший день для публикации — это среда.


      1. Pakos
        04.05.2017 09:07
        -1

        Эффектность и эффективность, эффектное легче продать (в том числе хабру компаниям).


        1. Cloud4Y
          04.05.2017 09:11

          Об этом мы и пишем. Можно завернуть что-то эффективное и продавать в эффектной обертке?


    1. Cloud4Y
      04.05.2017 08:31

      Ну получит какой-то облачный сервис или ЦОД в субботу просмотры, а к понедельнику про его сайт забудут.


      Эффект в деятельности компаний разве не будет результатом цепочки касаний? Когда от касания к касанию, клиент переходит из состояния «холодного» в более «тёплое»?


      1. Analitik_Telecom
        04.05.2017 08:54

        С Хабром касания, как вы называете, а по-научному — взаимодействия, работают иначе. Но зачем же мне раскрывать секрет успеха. Скажу так — истиная польза от поста наступает позже.


        1. Cloud4Y
          04.05.2017 09:05
          +2

          Секрет успеха в труде, целенаправленных действиях по достижению цели. Тут мы не разделяем мнение инфобизнесменов, которые их продают.
          Сказать «вот звезды, они ваши, берите» легко, тяжелее проделать путь к звездам. Поэтому мы публикуем свои находки и делимся ими. Умелое их использование — вот, где ценность…


  1. klylex
    04.05.2017 10:12

    Интересно. Спасибо за исследование.


  1. klylex
    04.05.2017 10:17
    +16

    Только почему вы не опубликовали эту статью в ночь с пятницы на субботу? =)


    1. Cloud4Y
      04.05.2017 10:32
      -2

      Командная работа коллектива Компании затруднена в случае публикации в выходные дни и вечернее/ночное время.


      1. AndrewN
        04.05.2017 14:47
        +3

        И символов всего 8к…


  1. Loki3000
    04.05.2017 14:24
    +1

    Мне кажется что в подобных исследованиях постоянно путают причину и следствие: не пост набрал столько, потому что опубликован тогда-то, а пост опубликован тогда-то, потому что написан непосредственно перед этим. В этом случае выглядит логично: специалист пишет пост в пятницу после работы и ночью его публикует, а на неделе у него для этого времени нет. А те, у кого оно есть, возможно, не так заняты работой, потому что не являются такими хорошими специалистами и их посты не так интересны:)
    Короче, алгеброй гармонию измерить можно, вот только эта метрика мало что дает:)


    1. TheShock
      04.05.2017 15:55

      Пост пишется несколько дней и его публикация откладывается. Например, иногда я писал статьи в выходные, а публиковал в среду.


      1. Loki3000
        04.05.2017 16:48

        Это, в данном случае, не имеет значения. Я просто хотел показать что корреляция между датой публикации и рейтингом/просмотрами может быть вызвана множеством исключенных из рассмотрения факторов. Почти уверен, что если провести анализ, то выяснится корреляция рейтинга публикаций с каким-нибудь совершенно произвольным фактором, типа фазы луны, курса доллара или температурой воздуха в Петропавловске-Камчатском:)


        1. ragequit
          04.05.2017 16:54
          +1

          Шутки шутками, но погода в мегаполисах влияет на количество просмотров :)


          1. Loki3000
            04.05.2017 17:05

            Так и дни недели влияют, просто не сами по себе:)


          1. Analitik_Telecom
            04.05.2017 17:36
            +1

            Это как раз не шутка, а очевидная очевидность, — в те же пасмурные выходные или вечера Хабр читать куда приятнее, чем кататься на вело-авто-мото или гулять в других формах.


  1. ragequit
    04.05.2017 16:11
    -2

    Идеальный пост — тот, который развлекает читателя (+ дает пространство для комментирования). 99% постов, нацеленных на прямую конвертацию просмотров в переходы этим требованиям не удовлетворяют. То есть, 99% постов в корпоративных блогах не могут быть успешными по определению. Исключения есть, но сама возможность публиковать в корп. блогах профессионально-развлекательный, а не продающий контент, вызывает спазмы не только у пиарухов и прочих «знающих толк» в продвижении людей, но и у администрации, так как это нарушает догмат о профильном наполнении корпоративного блога. Короче, замкнутый круг, из которого вырвался только Milfgard и обратно его уже не загнать.


    1. Subrisk
      04.05.2017 17:44
      +2

      Нужно больше ненависти к пиару, мало постарались. Пиарухи, пиарасты, пиарня, пиоры и ещё много лестных слов. Вы же белый и пушистый, такой в стороне стоите и ни-ни в плане пиар-публикаций.

      Продающий контент тоже можно талантливо писать, если знать, кому продаёшь и не оглядываться на плюсики и место в рейтинге компаний. И тогда и продажи, и лиды, и всё — полный ок. Только понтов нет, но они не всем и нужны.

      Что касается Milfgard, то могу сказать, что раньше он восхищал, удивлял, писал полезные вещи, которые можно было применять в смежных сферах. А потом… Знаете студенческую поговорку: «Первые два курса ты работаешь на зачётку, а потом она работает на тебя?». Так вот, это и произошло — многие посты Мосигры теперь выглядят высосанными из пальца и абсолютно оторванными от Хабра. Но любители пока плюсуют и восхищаются. Однако качество как подачи, так и содержания реально упало. Теперь его публикаций не ждёшь, не хочешь, не выхватываешь из ленты. Скучно.


      1. ragequit
        04.05.2017 17:56

        Извините, а почему я должен восхищаться попытками PR-отделов различных компаний на хабре натянуть сову на глобус? Я понимаю, что люди себе на жизнь зарабатывают, но творчески к этому процессу подходят единицы либо из нежелания узнавать что-то новое, либо из-за неспособности противостоять собственному руководству. Проблема большинства корп. блогов проистекает из непонимания структуры сообщества: каким бы «задротским» оно не казалось со стороны, постоянные пользователи идут сюда почитать что-то интересное. А потом уже начинает работать конверсия из поисковых систем, когда народ приходит целенаправленно из поисковой выдачи, но чтобы продвинуться в поиске гугла и яндекса у статьи должны быть хорошие показатели просмотра (и, соответственно, рейтинга). Так что можно оставить свой сарказм о моих мифических «понтах» при себе.


        1. Subrisk
          04.05.2017 18:12

          Извините, а почему вы должны огульно охаивать сразу всех, обеляя себя и ещё одного хаброписателя? А вы не полагаете, что просто интересной статьей можно вызвать бурю эмоций и ни одной конверсии? Всё просто: обалденный пост -> все бегут посмотреть на сайт, что за чуваки такое написали -> но никто не имеет покупательских характеристик. А вот качественный наброс или пост со здоровой критикой может вообще отпугнуть потенциальных ЛПРов, которые как раз сами ничем не отличаются от тех самых руководителей, не понимающих аудиторию.
          В последнее время, кстати, мне корп.часть Хабра и ГТ кажется сбалансированной и по целям, и по реализации. Во всяком случае, факапов стало гораздо меньше, а достойных публикаций больше.


          1. ragequit
            04.05.2017 18:29

            Простите, где я обелял себя или Милфа? Я исключительно поделился информацией о том, как работает большинство корпов, которые заходят на хабр как на модную-стильную-молодежную площадку с инструментами и методами, применимыми где угодно, только не здесь. Повторяю, корень большинства проблем корпов и, следовательно, причина появления подобных статей — попытки натянуть сову конверсии и ощутимых краткосрочных метрик на глобус сообщества хабра. Нежелание развивать блог в долгосрочной перспективе, желая «рвануть» вот прямо сегодня, в день публикации. А Милфгарда и Мосигру я привел в пример как раз из-за долгосрочного развития и работы на упомянутую «зачетку» (тут вы правы на 200%), но это не значит, что мне вообще когда-либо нравился этот блог или сам автор.

            обалденный пост -> все бегут посмотреть на сайт, что за чуваки такое написали -> но никто не имеет покупательских характеристик

            Есть такая вещь, как правильная работа с заголовком и самим текстом, которая потом обеспечит топ-5 выдачи гугла по ряду ключевых запросов. Ежедневно в хорошую статью с высокими рейтингами из поиска может приходить от 5 до 500 человек. Далее, я думаю, расписывать механизм конверсии и ее причины нужды нет.

            P.S. А охаивать, как вы выразились, я имею причины потому, что хоть и работал больше года назад с корпоративными клиентами, но всегда старался избегать джинсы, трех ссылок в тексте на заказчика (да и вообще ссылок на заказчика), пытаясь делать интересный контент. Если не получалось — просто не работал с такими блогами, все просто. При этом эффективность перечисленных мной методов в плане долгосрочного, то есть наиболее гармоничного развития блога, более чем спорна.


          1. avost
            05.05.2017 00:20
            -2

            А вы не полагаете, что просто интересной статьей можно вызвать бурю эмоций и ни одной конверсии?

            Вы так говорите, как будто в этом есть что-то плохое. Для всех, кроме пиарщика. Но это проблемы исключительно пиарщика. Почему они должны волновать читателей? Да и писателей. Которые пишут для читателя, а не для бабла.


            1. TheShock
              05.05.2017 04:16

              На самом деле в итоге наши проблемы — нет конверсии, нет в итоге больше статтей


            1. Subrisk
              05.05.2017 08:33
              +2

              Это проблемы всех. Нет конверсии, нет дохода. Из которого платится зарплата вам, программистам, писателям (слово-то какое). Или вы своим снобизмом и заботой о читателях питаетесь? Я вас сейчас поражу, но многие пишут для бабла: корпы — пиарнуться, простые пользователи — показать себя выгодным боком и влезть в проект, найти новую работу, получить приглашение на конференцию и т.д.


              1. avost
                07.05.2017 01:34
                -2

                Я вас сейчас поражу, но статьи для бабла и ради бабла не интересны никому, кроме вашей туссовочки пеарщиков. Да и вам они "интереснв" только с точки зрения межвидовой борьбы.


  1. comerc
    04.05.2017 17:58
    +2

    Простите меня, это исследование называется средняя температура по больнице.


    Хотите много просмотров? Приемы известные. Или набрасывайте говно на вентилятор. Или играйте на чувствах. Или побольше крови. Шоу-бизнес.


    Какая польза для целевой аудитории от публикации — вот очевидно правильное мерило, на мой взгляд. Пускай очки нарабатываются медленно, но их качество несравнимо выше. Ценности вольных каменщиков.


    1. Cloud4Y
      04.05.2017 18:21

      Средней температурой по больнице это исследование назвать нельзя.

      Во-первых, тут много «средних температур», которые сравниваются между собой. Сравнив 30 средних температур в 30 больницах уже можно сделать кое-какие выводы.
      Во-вторых, в начале мы рассказываем о логнормальном распределении, чтобы читатель мог по его форме представить с какой вероятностью в рамках доверительных интервалов могут быть получены конкретные значения. Если по больнице показывается еще и распределение температур, это уже не просто средняя температура.
      В-третьих, «нарабатывать очки за полезные публикации» можно чуть быстрее или чуть медленнее, в зависимости от оформления статей и обстоятельств.


  1. Antelle
    04.05.2017 20:00
    -1

    Длина заголовка, длина текста… Буллшит это всё.
    Вот тут хорошо написано о том, как надо писать на хабр: https://habrahabr.ru/company/mosigra/blog/310670/


    1. Cloud4Y
      04.05.2017 20:44

      Написано очень хорошо. Человек, написавший 1500 постов, даёт прекрасные и полезные советы. Но чтобы воспользоваться ими, нужно чувствовать аудиторию, чувствовать меры понятности, новизны, юмора, которые допустимы.
      В итоге, чтобы поймать этот баланс, потребуется свой собственный опыт и немалый талант.
      Оцифрованные рекомендации на основе статистики проще в применении. В статье мы подчеркивали, что итоговый результат определяется голосованием и использование закономерностей может лишь скорректировать результат, но не изменяет его кардинально.


    1. Analitik_Telecom
      04.05.2017 21:31
      +4

      Да ладно вам, эта статья, вами приведенная, истеричная софистика. Эти рецепты не подойдут куче авторов. Человек уже давно стал самопиариться, а не писать по делу, увы…


  1. Pochemuk
    05.05.2017 12:40
    +2

    Согласен с Analitik_Telecom в плане того, что не в длине заголовка счастье…

    Заголовок, список хабов и анонс статьи (то, что до ката) — это основные средства привлечь внимание целевой аудитории.
    И если автор статьи относится к этим средствам вдумчиво и серьезно, то он сумеет так распределить между ними нужную информацию, что каждая из этих частей будет достаточно лаконична, но информативна. А такой подход уже сам по себе будет привлекать читателя, а не только количество букв в них.

    Что касается фрагментов кода в длинных статьях, то тут ситуация противоречивая:
    С одной стороны, если автор делится кодом, значит он считает, что тема настолько интересна, что код может пригодиться кому-то еще. И зачастую, это именно так и обстоит. Т.е. это не длина вызывает интерес, а оправданный расчет на заинтересованность заставляет внедрять в статью код.
    С другой стороны, аккуратные авторы длинный код прячут в спойлеры. И более показательно было бы провести оценку интереса в зависимости от длины текста без спрятанных фрагментов.
    Мне кажется, что этот показатель был бы более адекватным текущей ситуации.