Вы ведь заходите на Хабр больше одного раза в день? Не чтобы прочитать что-то полезное, а просто пролистать главную в поисках "чего бы добавить в список на прочитать позже"? Когда-то замечали, что посты, опубликованные посреди ночи, собирают меньше просмотров и рейтинга, чем дневные? А что скажете о публикациях, вышедших посреди выходных?
Когда я опубликовал предыдущий пост-анализ о зависимости показателей публикации от её длины, Exosphere в комментариях сказала, что "есть некоторая связь времени выхода и показателей публикации (но также корелляция слабая)". Вы ведь понимаете, что я не мог пройти мимо?
Итак, важно ли публиковаться на Хабре с 09:00 до 18:00? Или может только во вторники? А что скажете о дне после зарплаты? Период отпусков? Ну, вы поняли. Сегодня попробуем узнать временной рецепт лучшей публикации на свете.
Вступление и набор данных
Поскольку нам точно не известно, в каких временных рамках могут быть некие интересные (или не очень) зависимости показателей публикаций, проанализируем всё, что только можно. Попробуем рассмотреть, что же происходит в течение года (есть ли сезонные зависимости), в течение месяца (есть ли социальные / бытовые зависимости — я ведь не шутил про день зарплаты), в течение недели (есть ли зависимость от степени усталости читателей / авторов) и в течение дня (есть ли зависимость от количества выпитого кофе).
Для анализа реакции читателей на публикацию, рассмотрим количество просмотров, плюсы / минусы, комментарии и добавление в закладки. Возможно, минусы больше расставляют рано утром, а плюсы — поздно вечером (или наоборот). А чтобы выявить авторские зависимости — размер публикации. Ведь может автор пишет меньше днём, а больше посреди ночи. Но это не точно.
В статье проанализированы 4 804 публикации из хабов Программирование, Информационная безопасность, Open source, Разработка веб-сайтов и Java за 2019 год. Именно эти посты были рассмотрены в предыдущем Хабра-анализе.
Что происходит...
в течение года?
Поскольку количество просмотров публикации можно набирать бесконечно, очевидно, что публикации конца года собрали немного меньше, чем вначале года. Если учесть этот факт, то никакой зависимости от даты публикации выделить не получится. Так, на графике (Рис. 1) нет никаких особенностей ни на Рождество, ни на 14 февраля, ни на один другой праздник. Не заметно и сезона отпусков, сессий или 1 сентября.
Рис. 1. Как выглядят просмотры публикаций, опубликованных в 2019 году, в зависимости от даты публикации
А вот голосование за рейтинг публикации на данный момент действует 30 дней. Потому единственное ожидаемое отклонение — публикации второй половины декабря, так как для них 30 дней всё ещё не прошли. Тем не менее, большее количество оценок посты собирают за первый день и первую неделю, а за остальной месяц — лишь немного. Как видно (Рис. 2), пользователи не были особо разнообразны в выставлении как плюсов, так и минусов. Стоит отметить, поскольку используется логарифмический масштаб отображения количества голосов, графики не включают в себя все публикации, собравшие 0 плюсов / минусов.
Рис. 2. Количество плюсов (слева) и минусов (справа), собранных публикациями 2019 года
Как бы это не было удивительно, хотя комментировать и добавлять публикации в закладки можно сколько угодно, публикации обычно обсуждаются и "сохраняются на потом" не так долго. После — про них забывают и всё. Потому никаких интересных зависимостей в масштабе года здесь тоже нет (Рис. 3).
Рис. 3. Количество комментариев (слева) и закладок (справа), собранных публикациями 2019 года
Что же можно сказать про авторов всех этих публикаций? Не удивительно, но вот теперь можно обнаружить сезонную зависимость — количество коротких публикаций в сезон отпусков (конец июля — начало сентября) сократилось (Рис. 4). А вот средние и длинные посты на месте. Потому стоит заметить, мы обнаружили скорее сезон отпусков редакторов, чем всех пользователей.
Рис. 4. Длина публикаций 2019 года
Итак, основной итог — никаких действительно интересных (да и не особо интересных) зависимостей на протяжении года обнаружить не удалось. Перейдём дальше.
в течение месяца?
Количество просмотров (Рис. 5) публикаций не зависит от дня месяца примерно никак. Честно говоря, строив этот график я ожидал увидеть некий всплеск или падение в какой-то из дней (что-то вроде день зарплаты — на Хабр не заходим, а празднуем), но ничего подобного не обнаружил.
Рис. 5. Просмотры, собранные публикациями, в зависимости от дня месяца
А вот отданные за публикацию голоса показывают забавную зависимость. Пользователям Хабра явно не жалко поставить минус (а также два, три и так далее) в любой день месяца. А вот плюсов в основном ставят не меньше 10, хотя исключения и бывают. В основном общее количество плюсов составляет от 10 до 35. Однако и здесь никаких явных зависимостей от дня месяца не наблюдается.
Рис. 6. Количество плюсов (слева) и минусов (справа) в зависимости от дня месяца
Статистика месяца не позволила выявить и зависимость количества комментариев или добавления в закладки (Рис. 7) от дня. Заметили, 24-го числа любого месяца практически нет публикаций с всего 1 комментарием.
Рис. 7. Количество комментариев (слева) и закладок (справа) в зависимости от дня публикации
А что можно сказать про авторов? Кажется, им абсолютно не важно, в какой день месяца писать свои произведения (Рис. 8) и какой длины эти произведения будут.
Рис. 8. Длина публикаций в зависимости от дня месяца
На самом деле, я не ожидал увидеть никаких зависимостей от дня в месяце, но ведь стоило проверить?
в течение недели?
А вот тут можно увидеть ожидаемую зависимость. Посты, опубликованные на выходных, реже собирают небольшое количество просмотров (Рис. 9). Однако стоит быть внимательными, поскольку публикаций в субботу и воскресенье просто меньше, стоит это учитывать.
А вот будние дни примерно одинаковы с точки зрения просмотров, хотя в пятницу минимальное количество просмотров выше, чем в понедельник.
Рис. 9. Просмотры, собранные публикациями, в зависимости от дня недели (начиная с 00:00 понедельника, UTC)
Похоже, что публикации викенда реже собирают всего пару плюсов, а чаще — пару десятков (Рис. 10), в отличии от будних, когда всего 4-5 голосов за публикацию вполне нормальное явление. Количество минусов на выходных также сокращается.
Рис. 10. Количество плюсов (слева) и минусов (справа) в зависимости от дня недели (начиная с 00:00 понедельника, UTC)
При этом, суботние и воскресные публикации комментируют и добавляют в закладки примерно также часто, как и любые другие (Рис. 11).
Рис. 11. Количество комментариев (слева) и закладок (справа) в зависимости от дня недели (начиная с 00:00 понедельника, UTC)
Что же сказать про авторов публикаций и длину постов? Они ничем не отличаются день ото дня. Что понедельник, что среда, что суббота одинаковы с точки зрения анализа длины публикации.
Рис. 12. Длина публикаций в зависимости от дня недели (начиная с 00:00 понедельника, UTC)
Анализ зависимости показателей публикации от дня недели подвёл к одному из самых интересных выводов. Шанс получить не 5, а 15 плюсов, а также 1 минус вместо 5 на выходных выше, чем в будние дни. При этом, желательно публиковаться не раньше утра воскресенья, тогда у вас всё ещё есть шанс попасть в ТОП суток в понедельник утром. Последнее поможет набрать больше просмотров и больше голосов.
в течение дня?
Вы ведь понимали, что никто не публикуется посреди ночи? Интересный факт состоит в том, что ночь для хабра — вполне себе стандартная ночь в UTC — примерно с 22:00 до 6:00. А вот по MSK это соответствует 01:00 — 09:00.
Нельзя однозначно выявить зависимость количества просмотров публикации от времени её появления на Хабре (Рис. 13). Однако на таком графике отчётливо проявляются серии публикаций в 2:00, 7:00, 9:00 и 9:30 UTC, про которые amartology спрашивал в прошлый раз. В основном, эти серии — публикации редакторов и корпоративных авторов, у которых есть функция "планирования времени и даты публикации".
Рис. 13. Просмотры, собранные публикациями, в зависимости от времени суток (UTC)
А теперь рассмотрим эти 4 серии публикаций. Все их отчётливо видно в зависимостях количества плюсов от времени публикации, однако не минусов (Рис. 14). В общем, стоит заметить, что подобные серии увеличивают плотность публикаций в определённое время, они не выделяются из всего набора данных о показателях постов.
Тем не менее, для всех публикаций в период 0:00 — 4:00 UTC наблюдается отсутствие большого количества минусов.
Рис. 14. Количество плюсов (слева) и минусов (справа) в зависимости от времени суток (UTC)
А вот по количеству закладок и добавлений в избранное (Рис. 15) существенного отличия ночных постов от дневных не заметно. Как и на графиках просмотров и плюсов, здесь заметны "редакторские серии".
Рис. 15. Количество комментариев (слева) и закладок (справа) в зависимости от времени суток (UTC)
А что же по поводу длин текстов? Как оказалось (Рис. 16), у авторов нет предпочтительного времени сочинения очень длинных или очень коротких постов. В целом, публикации подлиннее и покороче равномерно распределены в течение дня.
Рис. 16. Длина публикаций в зависимости от времени суток (UTC)
Вместо заключения
Итак, когда же стоит публиковаться на Хабре, чтобы набрать максимальное количество просмотров / рейтинга / комментариев и так далее?
Если рассматривать время суток, то в этом нет практически никакой разницы. Конечно, если вы опубликуетесь посреди ночи, то ваш пост дольше будет первым в списке всех публикаций. С другой стороны, утром и днём появляется множество других публикаций, которые подвинут вашу ниже. С другой стороны, пока вы на первой позиции, шанс набрать побольше плюсов будет ваши и тогда можно претендовать на хорошую позицию в ТОП суток, что принесёт дополнительные просмотры.
С точки зрения дней недели, меньшая конкуренция наблюдается на выходных и особенно в субботу. Но если вы всё ещё хотите воспользоваться возможностью попасть в ТОП дня и получить дополнительные просмотры, то стоит нацеливаться на воскресенье после полудня. Тогда вы можете заполучить в читатели ещё и тех, кто просматривает ТОП суток в понедельник до полудня (когда публикации понедельника ещё не успели собрать значительный рейтинг).
Если же рассматривать целый месяц или год, то особых зависимостей показателей от времени или даты нет.
А вообще, знаете, публикуйте свои посты в любой момент. Если они будут интересны и / или полезны Хабра-сообществу, их прочитают, поставят плюс, добавят в закладки и прокомментируют.
А на сегодня всё, спасибо за внимание!
P.S. Если вы нашли опечатки или ошибки в тексте, пожалуйста, сообщите мне. Это можно сделать выделив часть текста и нажав "Ctrl / ? + Enter", если у вас есть Ctrl / ?, либо через личные сообщения. Если же оба варианта недоступны, напишите об ошибках в комментариях. Спасибо!
P.P.S. Возможно, вам будут интересны также другие мои исследования Хабра или вы хотите предложить свою тему для следующей публикации, а может даже новый цикл публикаций.
Всю информацию можно найти в специальном репозитории Хабра-детектива. Там же можно узнать, какие предложения уже были озвучены, а что уже находится в работе.
Кроме того, вы можете упомянуть меня (написав VaskivskyiYe) в комментариях к публикации, которая кажется вам интересной для исследования или анализа.
maryyapot
спасибо за анализ! прислушаюсь.