Вчера я публиковал статью на тему того, когда лучше публиковаться на хабре. С тех пор мой паук собрал статистику за весь 2015 год, и картинка немного изменилась. Так же я построил несколько графиков, и в целом картина прояснилась. Осторожно, трафик!

Сначала посмотрим статистику отдельно по каждому дню:

Обозначения на графиках такие:
  1. Quantity — количество опубликованных в это время статей
  2. Comments — среднее количество оставленных комментариев
  3. Views — среднее количество набранных просмотров
  4. Rate — средний набранный рейтинг


Понедельник выглядит так:



Вторник:



Среда:



Четверг:



Пятница:



Суббота:



Воскресенье:



Ну и наконец самое вкусное — сборная солянка за всю неделю:



Придётся признать — полученная статистика несколько противоречит мнению, которое я высказал в первой статье. Действительно, как упоминали некоторые комментаторы, лучше всего публиковаться в субботу и воскресенье в 5 часов утра, когда конкуренция с вашей статьёй минимальна.

Или нет?

А давайте посмотрим выборки по получившимся пикам:
Для начала — 6 утра субботы.

SELECT * FROM posts WHERE WEEKDAY(created)+1=6 AND HOUR(created)=6

Результат:
id created rate comments views
255509 2015-04-11 06:28:00 50 104 74000
250557 2015-02-14 06:21:00 6 19 23000
238363 2014-09-27 06:14:00 63 29 56000
233533 2014-08-16 06:08:00 49 95 52000
228751 2014-07-05 06:58:00 82 70 38000
223149 2014-05-17 06:32:00 134 89 70000


Затем — в воскресенье в 6 утра.
SELECT * FROM posts WHERE WEEKDAY(created)+1=7 AND HOUR(created)=6

id created rate comments views
276249 2016-01-31 06:05:00 73 21 52000
269005 2015-10-18 06:03:00 34 25 19000
256617 2015-04-26 06:14:00 56 116 74000
253711 2015-03-22 06:56:00 30 25 39000
246785 2015-01-04 06:42:00 122 113 169000
238379 2014-09-28 06:28:00 20 33 28000
232009 2014-08-03 06:00:00 24 20 51000


Вот так. Довольно очевидно, что единичные посты делают нашу статистику. И, хотя я не могу не признать, что некоторое влияние время публикации всё же оказывает — оно не стоит того, чтобы даже задумываться об этом.

А смотреть графики — очень опасно. Графики дают ложные иллюзии понимания и некорректные предпосылки. Поэтому жизненно важно всего понимать, какие данные и по какой причине лежат под вашими графиками. Иначе всё, что вы построите и сделаете, будет иметь под собой примерно
такую основу.

Комментарии (5)


  1. FForth
    21.03.2016 16:00

    Интересна статистика, если это возможно по корреляциии близких обсуждаемых тем на коротких интервалах времени.
    Поясню. Будет ли пользователь писать каментарии в похожую тему, если что то аналогичное уже обсуждалось на днях
    и исчерпало его лимит «психо-физиологических» способностей :)


    1. jehy
      21.03.2016 16:23

      Делать лень, но могу сказать прикидку. По моим ощущениям — если тема достаточно широкая и актуальная, то её могут довольно много обсуждать. Плюс ещё ротация аудитории — далеко не все успевают прочитать прям всё, что выходит на хабре, и люди с новым энтузиазмом набрасываются на вновь поднятую старую тему. Благодаря этому, появляется большое количество именно разных одинаковых статей. Взять хотя бы тему wordpress+nginx, или ESP8266 на geektimes — казалось бы, что ещё можно обсуждать? А нет.


  1. FForth
    21.03.2016 16:22

    • в разрезе просматриваемых интересов пользователей


  1. LibertyPaul
    21.03.2016 18:32

    Суббота — кульминация Harlem shake


    1. jehy
      21.03.2016 18:33

      Да, выглядит забавно, но причиной является просто малое количество публикаций.