Вчера я публиковал статью на тему того, когда лучше публиковаться на хабре. С тех пор мой паук собрал статистику за весь 2015 год, и картинка немного изменилась. Так же я построил несколько графиков, и в целом картина прояснилась. Осторожно, трафик!
Сначала посмотрим статистику отдельно по каждому дню:
Обозначения на графиках такие:
Понедельник выглядит так:
Вторник:
Среда:
Четверг:
Пятница:
Суббота:
Воскресенье:
Ну и наконец самое вкусное — сборная солянка за всю неделю:
Придётся признать — полученная статистика несколько противоречит мнению, которое я высказал в первой статье. Действительно, как упоминали некоторые комментаторы, лучше всего публиковаться в субботу и воскресенье в 5 часов утра, когда конкуренция с вашей статьёй минимальна.
Или нет?
А давайте посмотрим выборки по получившимся пикам:
Для начала — 6 утра субботы.
Результат:
Затем — в воскресенье в 6 утра.
Вот так. Довольно очевидно, что единичные посты делают нашу статистику. И, хотя я не могу не признать, что некоторое влияние время публикации всё же оказывает — оно не стоит того, чтобы даже задумываться об этом.
А смотреть графики — очень опасно. Графики дают ложные иллюзии понимания и некорректные предпосылки. Поэтому жизненно важно всего понимать, какие данные и по какой причине лежат под вашими графиками. Иначе всё, что вы построите и сделаете, будет иметь под собой примерно
Сначала посмотрим статистику отдельно по каждому дню:
Обозначения на графиках такие:
- Quantity — количество опубликованных в это время статей
- Comments — среднее количество оставленных комментариев
- Views — среднее количество набранных просмотров
- Rate — средний набранный рейтинг
Понедельник выглядит так:
Вторник:
Среда:
Четверг:
Пятница:
Суббота:
Воскресенье:
Ну и наконец самое вкусное — сборная солянка за всю неделю:
Придётся признать — полученная статистика несколько противоречит мнению, которое я высказал в первой статье. Действительно, как упоминали некоторые комментаторы, лучше всего публиковаться в субботу и воскресенье в 5 часов утра, когда конкуренция с вашей статьёй минимальна.
Или нет?
А давайте посмотрим выборки по получившимся пикам:
Для начала — 6 утра субботы.
SELECT * FROM posts WHERE WEEKDAY(created)+1=6 AND HOUR(created)=6
Результат:
id | created | rate | comments | views |
255509 | 2015-04-11 06:28:00 | 50 | 104 | 74000 |
250557 | 2015-02-14 06:21:00 | 6 | 19 | 23000 |
238363 | 2014-09-27 06:14:00 | 63 | 29 | 56000 |
233533 | 2014-08-16 06:08:00 | 49 | 95 | 52000 |
228751 | 2014-07-05 06:58:00 | 82 | 70 | 38000 |
223149 | 2014-05-17 06:32:00 | 134 | 89 | 70000 |
Затем — в воскресенье в 6 утра.
SELECT * FROM posts WHERE WEEKDAY(created)+1=7 AND HOUR(created)=6
id | created | rate | comments | views |
276249 | 2016-01-31 06:05:00 | 73 | 21 | 52000 |
269005 | 2015-10-18 06:03:00 | 34 | 25 | 19000 |
256617 | 2015-04-26 06:14:00 | 56 | 116 | 74000 |
253711 | 2015-03-22 06:56:00 | 30 | 25 | 39000 |
246785 | 2015-01-04 06:42:00 | 122 | 113 | 169000 |
238379 | 2014-09-28 06:28:00 | 20 | 33 | 28000 |
232009 | 2014-08-03 06:00:00 | 24 | 20 | 51000 |
Вот так. Довольно очевидно, что единичные посты делают нашу статистику. И, хотя я не могу не признать, что некоторое влияние время публикации всё же оказывает — оно не стоит того, чтобы даже задумываться об этом.
А смотреть графики — очень опасно. Графики дают ложные иллюзии понимания и некорректные предпосылки. Поэтому жизненно важно всего понимать, какие данные и по какой причине лежат под вашими графиками. Иначе всё, что вы построите и сделаете, будет иметь под собой примерно
такую основу.
FForth
Интересна статистика, если это возможно по корреляциии близких обсуждаемых тем на коротких интервалах времени.
Поясню. Будет ли пользователь писать каментарии в похожую тему, если что то аналогичное уже обсуждалось на днях
и исчерпало его лимит «психо-физиологических» способностей :)
jehy
Делать лень, но могу сказать прикидку. По моим ощущениям — если тема достаточно широкая и актуальная, то её могут довольно много обсуждать. Плюс ещё ротация аудитории — далеко не все успевают прочитать прям всё, что выходит на хабре, и люди с новым энтузиазмом набрасываются на вновь поднятую старую тему. Благодаря этому, появляется большое количество именно разных одинаковых статей. Взять хотя бы тему wordpress+nginx, или ESP8266 на geektimes — казалось бы, что ещё можно обсуждать? А нет.