Астрологи объявили месяц статистики, и пожалуй я присоединюсь на сегодня к авторам статистических статей.

Наверняка вы задумывались — когда лучше публиковать статью? В выходные, чтобы её внимательно читали? В пятницу, чтобы у всех было хорошее настроение? В понедельник, когда после выходных все выползают читать хабр? А может быть, лучше выбрать время обеденного перерыва? Сразу оговорюсь, что данный вопрос имеет значение не только для хабра — примерно то же самое можно сказать про почти любые публикации, если нету какой-то совсем суровой конкретики. У меня есть своя гипотеза, о ней я расскажу в конце статьи.

Конечно, этот вопрос уже задавали. И отвечали. И рисовали статистику. Много статистики! Так зачем ещё одна статья на эту тему? А вот зачем. Почти нигде не учитывается, что следует принимать во внимание одновременно и время публикации и день недели. С очевидностью, утро понедельника имеет кардинальные отличия от утра воскресенья. Так же никто не учитывал праздники. А так же многие брали в качестве даты публикации поста дату первого комментария, чтобы не возиться с преобразованием. А если статья опубликована в какое-то нестандартное время, когда люди спят, то комментарии там могут появиться очень нескоро…

Я честно старался найти кем-то уже приготовленную статистику, но увы — часть была непригодна, часть ссылок стухла, остальные были непригодны из-за сбора заведомо некорректной информации. Так что вперёд — писать свой велосипед. Код приводить не буду (очевидно же), кому интересно — может посмотреть на github, там же можно скачать сгенерированную базу (сейчас примерно за полгода, потом будет больше).

Скачали, распарсили, залили в базу. Молодцы. Смотрим. Сейчас откроется истина — когда же нужно публиковаться, чтобы было много просмотров, комментариев, рос рейтинг и бегали пони по лужайке. Для начала посмотрим, когда же можно получить больше всего рейтинга.

SELECT 
  CEIL(AVG(rate)) AS avg_rate,
  COUNT(id) AS quantity,
  CEIL(AVG(comments)) AS avg_comments,
  CEIL(AVG(views)) AS avg_views,
  WEEKDAY(created)+1 AS DAY,
  HOUR(created) AS HOUR 
FROM
  posts 
WHERE DATE_FORMAT(created, '%m-%d') NOT IN 
  (SELECT 
    `date` 
  FROM
    holidays) 
  AND rate > 0 
  AND comments > 0 
GROUP BY WEEKDAY(created),
  HOUR(created) 
ORDER BY AVG(rate) DESC

Пояснение: исключаем из выборки праздничные дни и посты, у которых рейтинг и количество комментариев не больше нуля.

*барабанная дробь*

Табличка результатов
avg_rate quantity avg_comments avg_views day hour
149 2 295 58000 2 1
91 1 21 52000 7 6
86 3 83 42334 3 4
81 4 96 49500 2 6
75 3 135 26334 5 5
68 19 15 14316 1 0
67 3 80 30334 7 9
65 5 61 24000 6 22
64 5 78 33600 4 2
63 13 56 19693 6 16
55 3 30 24334 6 9
55 4 25 23000 1 7
51 12 80 15000 3 1
49 6 58 26500 5 3
47 16 40 15407 1 19
44 9 35 23223 3 23
43 10 61 16900 2 7
43 7 20 8660 7 3
42 7 27 23000 5 1
42 10 32 23700 6 14
41 2 10 24500 6 4
41 12 37 18584 1 1
41 15 11 17934 7 22
40 6 62 24667 2 22
40 3 70 16000 7 7
39 13 41 23154 5 0
38 5 21 17000 6 3
38 16 53 18813 7 16
38 6 41 18167 5 2
37 6 39 18500 7 2
37 10 26 22800 3 0
36 16 32 15750 7 15
36 3 26 21000 6 5
35 5 29 12200 3 3
35 9 34 13112 7 14
35 12 17 19834 7 17
34 8 17 15675 6 18
34 28 24 22000 4 17
33 59 28 17323 3 11
33 6 28 18334 6 19
33 8 35 18542 6 13
32 14 18 18715 7 23
32 5 74 15600 7 12
32 19 17 17737 4 19
32 37 24 16649 3 18
32 7 24 21429 3 7
31 1 4 13000 3 6
31 17 28 16530 4 22
31 4 19 15500 6 10
31 17 27 20236 2 20
31 12 12 8622 1 23
31 13 21 16077 1 8
30 5 26 19400 5 22
30 8 30 19125 6 0
30 48 21 14917 3 14
30 23 23 15566 2 18
30 41 18 16854 3 15
29 3 18 8667 7 11
29 11 67 15910 1 20
29 2 11 6000 6 23
29 15 33 16667 4 20
29 8 21 16500 7 21
29 8 22 24750 4 3
29 5 43 21000 5 4
29 60 16 12500 1 13
29 11 28 17273 3 2
29 12 26 12500 3 21
29 48 23 11855 1 9
28 23 26 13044 3 19
28 34 27 14824 4 10
28 12 25 14584 4 7
28 47 28 15979 2 15
28 45 27 18489 5 13
28 26 23 13462 4 9
28 8 14 18250 6 21
28 62 27 14203 3 12
27 6 14 13834 1 2
27 3 25 15000 7 10
27 58 20 13242 2 11
27 39 29 14231 2 16
27 2 44 7500 4 5
27 47 21 13362 4 16
27 39 18 15565 5 15
27 61 21 15558 1 12
27 51 22 12311 4 13
27 11 37 15546 5 20
27 6 84 9167 4 8
27 19 20 12632 5 17
26 11 25 15637 5 8
26 22 24 13773 4 18
26 37 23 11621 1 17
26 26 19 12731 2 19
26 45 20 15200 2 10
26 7 23 18143 5 7
26 48 20 13521 5 10
26 8 13 7625 6 15
26 8 12 10000 1 3
26 60 22 13550 3 13
26 2 25 14000 6 2
26 54 25 11630 1 15
26 23 21 13740 5 19
26 11 26 15273 7 13
26 11 18 12819 5 21
26 48 17 10792 1 16
25 7 13 14429 6 11
25 7 20 18143 5 23
25 58 15 14121 5 11
25 32 17 11407 3 17
25 64 21 11500 4 11
25 5 62 13000 2 0
25 3 20 12000 6 8
25 49 21 14959 5 16
25 59 18 11085 4 15
25 54 18 11667 1 10
25 25 32 12773 1 18
24 8 15 13750 1 22
24 25 34 14480 5 18
24 3 17 14334 7 0
24 51 21 12687 3 10
24 74 24 13227 1 11
24 44 16 10877 1 14
23 2 6 7000 6 7
23 47 12 12469 4 14
23 5 18 10800 2 3
23 34 17 10098 5 14
23 10 31 14300 6 12
23 2 22 6000 2 5
23 3 30 10667 5 6
23 51 17 11059 5 12
23 30 20 11267 2 17
22 38 11 10079 2 9
22 11 19 14455 7 19
22 47 25 11915 3 16
22 4 16 10500 4 23
22 13 14 9231 2 21
22 10 26 12400 1 21
22 82 18 12342 2 12
22 5 24 13400 6 1
21 64 17 13250 4 12
21 6 14 11334 2 4
21 9 16 7445 3 8
21 4 17 11500 1 5
21 16 12 10625 2 8
20 1 13 2000 7 4
20 2 8 7500 3 5
20 67 18 10598 2 13
20 13 13 9924 7 18
20 7 19 10858 2 2
20 45 13 10600 2 14
20 12 23 10167 4 0
19 7 14 13143 6 17
19 3 9 7000 6 20
19 10 14 9200 4 21
19 24 16 9959 5 9
18 4 5 10500 4 6
18 15 20 8267 3 20
18 3 6 6667 7 1
17 4 4 6000 4 1
17 2 23 10000 4 4
17 29 13 6823 3 9
16 12 10 8000 2 23
15 6 8 8500 3 22
13 10 8 7100 7 20
13 5 26 5200 1 4
6 1 4 2000 1 6


Срочное известие! Лучшие результаты по рейтингу даёт публикация во вторник в час ночи! И ни в коем случае не публикуйтесь в понедельник в 4 или 6 утра — ваш пост будет обречён!

Класс. Теперь давайте посмотрим, когда лучше публиковаться, чтобы получить больше комментариев. Табличку всовывать не буду, очень много HTML кода — просто скажу, что час ночи вторника опять лидирует, а хуже всего — четверг час ночи и среда шесть утра.
По просмотрам — лучше во вторник в час ночи, хуже в понедельник в 6 утра.

Что же это за время такое волшебное — вторник час ночи? Может быть, те кто «в теме» только в это время и публикуются? Давайте проверим:

SELECT * FROM posts WHERE WEEKDAY(created)+1=2 AND HOUR(created)=1

Ответ уже для многих очевиден:

Подумайте перед открытие спойлера
id created rate comments views
273403 2016-01-19 01:59:00 26 28 34000
269577 2015-10-27 01:19:00 272 561 82000


Отсюда сделаем логичные выводы по тому, когда лучше всего публиковать статью. Простите, ещё один спойлер — для тех, кто невнимательный и сразу решил открыть выводы. Рекомендую ещё раз подумать над вопросом перед тем, как раскрывать спойлер.

Тайны вселенной, без СМС и регистрации
Если ещё немного подумать и поковырять различные варианты выборки — становится понятно, что любой «полезный выход» никак не зависит от времени публикации статьи. В любой день и час статья может получить количество рейтинга, просмотров и комментариев, зависящее исключительно от её качества. Моя собственная гипотеза подтвердилась.

Лучше всего публиковать статью — тогда, когда у вас готова хорошая, интересная и красивая статья. С любовью, ваш Капитан.

P.S. Автор отлично осознаёт огромное количество погрех в этом исследовании, и оно претендует скорее на шутку, чем на статистику. Но в шутке есть намёк. Недаром на Тостере на полном серьёзе задавали вопрос и отвечали про лучшее время публикации. Коллеги, пишите качественные тексты и не волнуйтесь более ни о чём.

P.S.2. Судя по мгновенно прилетевшим минусам, открывшие действительно считали, что сейчас им расскажут лучшее время публикации статьи. Что ещё раз показывает, что вопрос и данный ответ — очень актуальны.

На самом деле, ещё есть вопрос того, как зависит рейтинг статьи от её охвата аудитории — но это довольно очевидная тема, да и не относится к тому, что мы хотели выяснить именно в этом топике.

Всем спасибо, всем хороших статей! Встречаемся здесь же, в то самое оптимальное время, которые мы с вами выявили.

UPD. Продолжение и частичное опровержение этой статьи — во второй части.

Комментарии (14)


  1. gearbox
    18.03.2016 16:32
    +9

    Так же как и в предыдущих исследованиях — вы ищете ответ на вопрос — когда же ПУБЛИКУЮТСЯ хорошие статьи. Потому что вы смотрите на реакцию одних и тех же людей(условно) на разные статьи.
    Для того что бы ответить на вопрос когда лучше ПУБЛИКОВАТЬ статью (то есть когда аудитория более благосклонна) — надо взять контрольную группу, каждый день давать им читать статьи, собирать статистику а в полночь стирать память. На следующий день давать читать эти же статьи этим же людям и сравнивать реакцию. И так много раз. Тогда мы узнаем разницу в реакции одних и тех же людей на одну и туже информацию, и зависеть эта разница будет (условно) только от дня недели.
    Да, я крайне серьезен /смайл/


    1. jehy
      18.03.2016 16:34
      +14

      Полностью согласен, такое исследование гораздо более серьёзно. Буду ждать с нетерпением.


  1. kraidiky
    18.03.2016 17:47

    Простите, это одному мне кажется, что можно рассмотреть отдельно только статьи авторов, у которых статей сильно больше одной и тупо отнормировать их на среднее для данного автора, и тогда всё получится? Или на пути такой незатейливой операции лежат непреодолимые преграды?


    1. jehy
      18.03.2016 17:53

      Дерзайте — для этого надо только добавить к выгрузке автора. Но нужно условие — авторы должны писать каждый раз примерно идентичные статьи. Так что по-моему первый комментарий от gearbox ближе к жизни.


      1. kraidiky
        18.03.2016 18:19

        Если статьи публикуемые в час ночи (То есть дописываемые вечером после работы) у одного и того же автора лучше это говорит только о том, что лучше публиковать статьи в час ночи. Простой приписки, к выводу будет достаточно.


  1. OsipovRoman
    18.03.2016 18:00
    +1

    1. jehy
      18.03.2016 18:11

      Крутая статья, не видел. Правда, в ней много математики и мало логических выводов. Например, у меня есть подозрение, что замеченный всплеск в графике" среднего рейтинга поста в зависимости от дня недели и времени одновременно" вполне может быть обусловлен наличием нескольких качественных авторов, которые выкладывают именно в это время хорошие статьи — нужно смотреть выборку именно по этому времени.


  1. Shoohurt
    18.03.2016 18:08
    +2

    Все немного проще: оптимальное время для публикации статьи — это время, когда на сайте присутствует наибольшее количество пользователей. При прочих равных больший охват даст хорошей (ключевое слово) статье больше шансов на массовый успех.


    1. Aingis
      19.03.2016 08:52

      Это ещё вопрос — коррелирует ли наибольшее количество пользователей по тематике статьи с общей статистикой посещаемости. Может быть, статьи по сисадминству лучше выкладывать ночью? Целевая аудитория лучше оценит, и публикация получит хороший старт, что критически важно в условиях дефицита плюсов.


  1. mkot
    18.03.2016 18:30
    +4

    Не хватает графиков в статье.


    1. jehy
      21.03.2016 14:34

      Добавил графиков в продолжении статьи.


  1. spmbt
    18.03.2016 19:51
    +1

    Результаты исследования показывают, что под понедельник публикуют лузеры, которые наивно думают, что злые офисные читатели будут рады их сочинениям, каждое из которых напоминает им прошедшие выходные.

    Зато в понедельник вечером начинают писать самые маститые недовольные, громящие лузерские статьи и выражающие тем самым мнение офисной толпы. Заканчивают примерно к часу. Естественно, чуть успокоившаяся толпа перестаёт бушевать и радостно поддерживает выразителей их интересов, и никогда уже на неделе не бывает столь едина в своём порыве.


  1. Pashkevich
    18.03.2016 22:00
    +7

    Сейчас откроется истина — когда же нужно публиковаться, чтобы было много просмотров, комментариев, рос рейтинг

    А я вам отвечу — нужно было публиковаться до разделения на ГТ и ММ.


    1. jehy
      18.03.2016 22:01
      +7

      Марти, мы ещё можем всё исправить!