Привет Хабр.

В первой части была рассмотрена некоторая статистика и опубликован рейтинг статей этого сайта. Во второй части будут рассмотрены другие статистические закономерности этого года, которые мне показались интересными, а также будет опубликован рейтинг авторов за этот, 2019 год.



Первая часть рассчитана на читателей сайта, эта будет более интересна авторам, но и остальные надеюсь, найдут что-нибудь полезное — статьи авторов, попавших в рейтинг, определенно имеет смысл прочитать.

Продолжение под катом.

Как уже говорилось в первой части, рейтинг не является официальным, так что если я что-то пропустил — пишите, исправлю.

Общая информация


Еще раз напомню, что за этот, 2019 год, на сайт было выложено примерно 19тыс статей. График распределения количества статей по дням года я уже приводил, но для полноты выложу еще раз:



Для читателей и писателей Хабра наверно общеизвестно, что каждая статья может принадлежать к нескольким хабам (например «Программирование» и «Python»), и чем более популярные хабы будут выбраны, тем больше людей смогут прочитать статью. Несложно отсортировать хабы по суммарному количеству просмотров за этот год:



Для меня до сих пор загадка, почему на первом месте по просмотрам «Информационная безопасность» — вроде тема достаточно сложная и специфическая. Но видимо, основную массу просмотров набирают популярные статьи про мошенников или банки, а вовсе не что-то специализированное типа генерации сертификатов или особенностей открытых и закрытых ключей. Но что есть то есть. По остальным хабам думаю, все из названий и так очевидно.

По хабам можно насобирать много разной интересной статистики, например сравнить популярность языков программирования на Хабре в течении этого года:



А вот так было 10 лет назад, в далеком 2009 году:



Забавно, но Python тогда уже был, но хаб «Net» опережал его по популярности, много публикаций было по PHP, да и C++ был еще вполне в тренде.

И раз уж речь зашла о хабах, нельзя не вспомнить одно из нововведений Хабра этого года — отказ от geektimes и перевод всех хабов GT в не-профильные. Теперь уже можно подвести окончательные итоги того, сказалось ли это на числе публикаций.



Можно с уверенностью сказать, что число публикаций раздела Geektimes точно не сократилось, а в целом, с осени даже стало расти.

А вот последнее, и совсем свежее нововведение Хабра — невозможность ставить оценки статьи, не читая её. С одной стороны, это выглядит логичным, с другой, увы, это сократило и так невысокое среднее число баллов за статью:



В общем, если +30 баллов «порога» было набрать и так непросто, то теперь еще сложнее. Я и сам бывало, ставил плюсы за статьи той тематики которая мне интересна, не читая, просто чтобы мотивировать авторов больше писать на эту тему, теперь такой возможности нет.

Раз уж речь зашла об оценках, еще несколько статистических закономерностей. Все 18тыс статей, опубликованные за год, можно сгруппировать по дням недели:



Нетрудно видеть, что в будние дни публикуется в 2-3 раза больше материалов. Это неудивительно, если посмотреть на самый первый график статьи — там четко видна недельная периодичность. Но более интересно то, что статьи, публикуемые в выходные, в среднем набирают больше просмотров:



И последний момент, который мне не очень понятен — распределение соотношения «плюсов» и «минусов» по дням недели:



Нетрудно видеть, что в выходные дни статьи минусуются статистически больше — соотношение плюсов и минусов примерно 1:6 против 1:7.5 в рабочие дни. С чем это связано, я не знаю, а возможно, что это просто случайное совпадение — например, несколько «горячих» статей, набравших много плюсов и минусов, могло быть опубликовано в выходные, и это внесло вклад в средние значения.

Кстати, какие рейтинги набирали статьи Хабра в этом году? Ответ на гистограмме (по горизонтали рейтинг, по вертикали количество):



Основной пик рейтинга приходится на значение +12, ну а средний диапазон лежит в пределах +5..+30. Для сравнения, картинка за 2018г под спойлером.
Рейтинги за 2018


Тут мы видим еще одно нововведение 2019 года: на сайте стали допускаться отрицательные рейтинги, раньше такие статьи видимо просто удалялись. Я сначала подумал, что у меня где-то ошибка, но действительно, вот пример статьи с рейтингом -47.

Не буду больше мучать читателей графиками, а перейду к рейтингу авторов. Всех, кто попал в рейтинг, поздравляю, опять же повторюсь, если я кого-то пропустил — пишите в личные сообщения, исправлю.

Примечание: во всех рейтингах, где используются средние значения, я рассматривал тех авторов, кто написал более 12 статей в год, это эмпирическое значение, чтобы «среднее» было действительно более-менее усредненным. Это же относится к значениям кармы или числа подписчиков — все же это рейтинг за 2019 год, и те у кого в этом году было мало статей, в него не попали, даже если их карма выше.

Рейтинг 2019


Топ авторов по количеству статей

Эти люди, наверное те, кто работает для Хабра full-time, делая не менее 1 публикации в день.

marks — 683 публикации, 7601231 просмотр, 5855 добавлений в закладки
alizar — 509 публикации, 7916905 просмотров, 7541 добавление в закладки
SLY_G — 311 публикаций, 4909300 просмотров, 18069 добавлений в закладки
denis-19 — 300 публикаций, 2885265 просмотров, 2689 добавлений в закладки
ru_vds — 267 публикации, 4130700 просмотров, 31394 добавления в закладки
PatientZero — 248 публикаций, 3721300 просмотров, 24635 добавлений в закладки
AnnieBronson — 255 публикации, 1622580 просмотров, 886 добавлений в закладки
maybe_elf — 250 публикаций, 1678652 просмотра, 901 добавление в закладки
MaxRokatansky — 224 публикаций, 1264623 просмотра, 13391 добавление в закладки
m1rko — 222 публикаций, 4988000 просмотров, 27239 добавлений в закладки

Эти авторы в сумме создали за этот год 3187 публикаций, или почти 20% статей (каждую 5ю!) на Хабре. Благодаря им работает этот сайт и мы все здесь общаемся, за что можно сказать отдельное спасибо. Отдельно отмечу AnnieBronson, это наверное единственная женщина, попавшая в топ технического, по сути, сайта (правка — в личке подсказали, что maybe_elf тоже, впрочем, из ника это было неочевидно;).

Топ авторов по среднему числу голосов за статьи

fillpackart — 15 публикаций, 77520 просмотров, +160/-30
3Dvideo — 8 публикаций, 44112 просмотров, +158/-0.1 (*)
Boomburum — 19 публикаций, 16963 просмотра, +138/-10.4
Milfgard — 32 публикации, 39846 просмотров, +134.37/-4.5
gjf — 15 публикаций, 46366 просмотров, +114.0/-9.7
AlexeyNadezhin — 21 публикация, 49390 просмотров, +100/-1.9
jar_ohty — 15 публикаций, 48180 просмотров, +91.9/-1.6
steanlab — 18 публикаций, 28611 просмотров, +79.7/-2.8
lozga — 32 публикации, 27937 просмотров, +68.5/-2.0
AloneCoder — 31 публикация, 25332 просмотра, +65.9/-5.0
pronskiy — 21 публикация, 13604 просмотра, +58/-1.09

(*) Здесь, как и далее, где берутся средние значения, я рассматривал только тех авторов, кто написал более 12 статей за год. В качестве исключения добавлен автор 3Dvideo, его статьи этого заслуживают.

Топ по количеству подписчиков

Milfgard — 3033 подписчика
nmivan — 2478 подписчиков
SLY_G — 1830 подписчиков
PatientZero — 1799 подписчиков
alexzfort — 1689 подписчиков
alizar — 1483 подписчика
m1rko — 1201 подписчик
lozga — 1077 подписчиков
ru_vds — 924 подписчика
MagisterLudi — 829 подписчиков

Топ по среднему количеству комментариев на статью

fillpackart — 15 публикаций, 273 комментария
Boomburum — 19 публикаций, 257 комментариев
Tzimie — 20 публикаций, 216 комментариев
gjf — 15 публикаций, 182 комментария
Milfgard — 32 публикации, 166 комментариев
jar_ohty — 15 публикаций, 140 комментариев
mikejum — 17 публикаций, 140 комментариев
aik — 18 публикаций, 140 комментариев
lozga — 32 публикации, 137 комментариев
3Dvideo — 8 публикаций, 134 комментария
steanlab — 18 публикаций, 119 комментариев
EgorKotkin — 21 публикация, 115 комментариев

Топ по среднему числу просмотров за статью

fillpackart — 15 публикаций, 77520 просмотров
AlexeyNadezhin — 21 публикация, 49390 просмотров
jar_ohty — 15 публикаций, 48180 просмотров
gjf — 15 публикаций, 46366 просмотров
3Dvideo — 8 публикаций, 44112 просмотров
Milfgard — 32 публикации, 39846 просмотров
@moikrug — 19 публикаций, 29947 просмотров
steanlab — 18 публикаций, 28611 просмотров
lozga — 32 публикации, 27937 просмотров
AloneCoder — 31 публикация, 25332 просмотра
Tzimie — 20 публикаций, 25215 просмотро
aik — 18 публикаций, 21194 просмотра
f15 — 26 публикаций, 21657 просмотров

Топ по карме

Milfgard — карма 1505.0, 31 публикация
m1rko — карма 1098.0, 220 публикаций
PatientZero — карма 1033.0, 248 публикаций
Boomburum — карма 924.0, 18 публикаций
alizar — карма 850.0, 502 публикации
lozga — карма 767.0, 31 публикация
SLY_G — карма 484.0, 306 публикаций
Andrey2008 — карма 476.0, 33 публикации
AlexeyNadezhin — карма 475.0, 21 публикация
gjf — карма 461.0, 15 публикаций

И последний, топ по среднему числу добавлений в закладки на статью

Syurmakov — 19 публикаций, 236 добавлений в закладки
fillpackart — 15 публикаций, 207 добавлений в закладки
3Dvideo — 8 публикаций, 190 добавлений в закладки
steanlab — 18 публикаций, 182 добавления в закладки
AloneCoder — 31 публикация, 178 добавлений в закладки
rishat_edison — 31 публикация, 162 добавления в закладки
gjf — 15 публикаций, 155 добавлений в закладки
Milfgard — 32 публикации, 142 добавления в закладки
fokus-lop — 39 публикаций, 126 добавлений в закладки
hisbvdis — 16 публикаций, 123 добавления в закладки
m1rko — 222 публикации, 122 добавления в закладки
Saygin — 14 публикаций, 120 добавлений в закладки
germn — 37 публикаций, 119 добавлений в закладки
jar_ohty — 15 публикаций, 117 добавлений в закладки

Отдельно, вне основного рейтинга, я решил выделить Топ по самым необычным темам. Сюда я занес тех, кто опубликовал более-менее нетипичные для Хабра статьи с весьма высоким рейтингом.

В него попадают:
amartology — 4 публикации, 42550 просмотров на статью — статьи по разработке микросхем
Bedal — 2 публикации, 60349 просмотров на статью — статьи по авиации
eugeneb0 — 6 публикаций, 47416 просмотров на статью — цикл статей «Цивилизация Пружин»
steanlab — 18 публикаций, 28611 просмотров на статью — статьи по химии
3Dvideo — 8 публикаций, 44112 просмотров на статью — статьи про видео и кино

На этом все, поздравляю всех, попавших в рейтинг, ну и остальных конечно, тоже.

Если в каком-то из рейтингов авторов > 10, значит данные были обновлены, а я обещал никого из списка не удалять.

Поскольку выпуск предновогодний, никаких «антирейтингов» не будет, всем только положительные эмоции.

Заключение


Заключения не будет.

Всем читателям приятного чтения, надеюсь, здесь приведено достаточно ссылок на интересных авторов, ну а всем авторам желаю новых творческих успехов в следующем году.

Комментарии (40)


  1. MarinaToshina
    15.12.2019 18:09

    У топ авторов наверное какая-то материальная мотивация имеется?
    Там же в основном переводы и новости. Просто так тратить на это время изо дня в день вряд ли кто захочет.
    Вот бы работать — это интересно.


    1. VaskivskyiYe
      15.12.2019 18:57
      +3

      У редакторов / авторов Хабра — зарплата. У обычных пользователей есть только поощрение — ППА. Ну и, возможно, донаты от других пользователей


      1. cosmostarK
        15.12.2019 21:51
        +1

        Много же еще других пользователей сообщества, которые рассказывают о своей работе и им это приносит самоудовлетворение.


        1. VaskivskyiYe
          15.12.2019 22:03

          Естественно. Иначе бы никто ничего не писал вообще. Публикация должна приносить удовольствие самому автору, иначе это достаточно заметно. Но я отвечал на вопрос про "материальную мотивацию"


      1. inetstar
        15.12.2019 22:03
        +3

        Последние мои статьи просмотрело 175 000 человек (по данным Хабра). Ни копейки доната не получено.


        1. VaskivskyiYe
          15.12.2019 22:07

          На самом деле, было бы очень интересно, если бы авторы, статьи которых набирают высокие рейтинги, поделились информацией о донатах. Но это достаточно непросто. Может, когда-нибудь, я попробую исследовать этот вопрос


          1. fillpackart
            15.12.2019 22:46
            +2

            Ну, я может не самый релевантный автор, но у меня рублей 40 за всё время надонатилось

            Другой вопрос, что я не для денег пишу, и ППА не пользуюсь


          1. Fil
            15.12.2019 22:57
            +2

            Я заработал 8 рублей :)


          1. amartology
            16.12.2019 01:14
            +2

            Написал три статьи, средний рейтинг 191 (уверенно выше всех людей в списке), среднее число просмотров 56к (второй был бы в списке), доната не получил никакого.


          1. valemak
            16.12.2019 01:45
            +1

            За мои шахматные статьи про мат слоном и конём получил 2 раза донат.
            За «Метод TWIX» — 100 рублей.
            За «Треугольники Делетана» что-то вроде 17 рублей (точно не помню).
            Оба раза высылали на Яндекс-Деньги.

            Хоть суммы и небольшие, спасибо приславшим, было приятно.


          1. psinetron
            16.12.2019 10:24
            +1

            OMG, оказывается можно к статьям донат прикручивать.


          1. Boomburum
            16.12.2019 14:12

            Ну вот, пара авторов уже отметились. Как и ожидалось, функция не самая востребованная — постоянно ей не пользуются даже те, кто кричал «дайте нам возможность донатить», ну и она «непрогнозируемая» для автора (в отличие от той же ППА). Но в целом я надеюсь, что авторы не только для денег пишут (что подтверждают сообщения в том числе в этой ветке).


            1. DmitrySpb79 Автор
              16.12.2019 14:35

              Но в целом я надеюсь, что авторы не только для денег пишут (что подтверждают сообщения в том числе в этой ветке)

              И да и нет.

              Можно написать что-то интересное и не очень трудозатратное забесплатно чтобы поделиться с читателями, с другой стороны, есть довольно много тем где 20% вдохновения и 80% рутины, и писать/оформлять все это забесплатно желания никакого нет.


            1. amartology
              16.12.2019 15:31

              Не для денег конечно. Если писать столько, чтобы ППА могла стать «для денег», проще и удобнее как-то устроиться в Хабр копирайтером)

              Но ППА — это нормальная дополнительная мотивация все же садиться и доделывать лежащие в черновиках заготовки.


              1. haqreu
                18.12.2019 15:20
                +1

                Не очень нормальная, учитывая то, что права на текст переходят ТМ. Лично я не готов отдавать права за такие деньги.


                1. amartology
                  19.12.2019 11:43

                  Это каждый решает для себя. Меня, например, такая ситуация вполне устраивает, я получаю больше выгоды от доступа к широкой аудитории, чем теряю от того, что ТМ получает права на текст. А если я решу, например, книгу написать по материалам статей, то во-первых, все равно надо будет все рерайтить, а во-вторых, есть подозрение, что с ТМ на этот счет можно будет как-то договориться.


                  1. haqreu
                    19.12.2019 12:59

                    Безусловно, каждый решает сам. Я статьи пишу крайне регулярно, и почти весь код и текст публикую под WTFPL. Не вижу ни малейшего резона отдавать права ТМ вместо отдачи в public domain. Поэтому ППА для меня вообще не мотивация.


            1. haqreu
              19.12.2019 00:26

              Отлично там всё прогнозируется :)

              Не получил ни копейки в пожертвованиях. При этом у меня каждая вторая статья имеет 50+ рейтинг, и ППА при этом даёт тот же ноль, потому что (в моём случае) совершенно несерьёзно ей пользваться.


        1. Skerrigan
          16.12.2019 05:33
          +2

          Эта статья напомнила о желании задонатить за цикл «цивилизации пружин», однако там кнопки не нашел… Есть идеи «почему так» и «что с этим делать»?


          1. DmitrySpb79 Автор
            16.12.2019 07:10
            +1

            Тут просто, кнопка доната является добровольной для каждого автора.


    1. ximik13
      16.12.2019 14:41

      Там же в основном переводы и новости.

      Для меня основная проблема, что большей частью эти переводы и новости суть мусорные. И такой контент по личным ощущениям последнее время занимает как минимум 70-80% Хабра. Особенно доставила последняя истерия с NGNIX, когда 3 из 4 новых статей тут были про эту ситуацию и по сути не несли какой либо полезной информации.


  1. Vlad800
    15.12.2019 20:23
    +2

    … если +30 баллов «порога» было набрать и так непросто, то теперь еще сложнее. Я и сам бывало, ставил плюсы за статьи той тематики которая мне интересна, не читая, просто чтобы мотивировать авторов больше писать статей на эту тему...
    Чтобы еще больше ставить им плюсов не читая, чтобы они еще больше…


    1. DmitrySpb79 Автор
      15.12.2019 22:01
      +5

      Пример простой: я вижу в ленте статью, например «Руководство по использованию pandas для анализа больших наборов данных», знаю что эта тема актуальная и полезная, ставлю плюс чтобы поддержать автора. Не вижу в этом ничего плохого. Статью я при этом могу и не читать, т.к. эту тему знаю сам :)


      1. Vlad800
        16.12.2019 02:55
        +3

        Да, кейс понятен и он даже жизненный, но противоречит другому кейсу — ставить оценку статье только за качество материала. Ну или тогда две оценки придется ставить: одна «до» — за статью по важной теме, другая «после» — за качество материала. Тогда в первом случае разрешить только "+". Почему бы и нет. Как я где-то уже писал, что для аудитории Хабра чем заковыристее — тем лучше.

        Или, что еще лучше, оценка «до» — это плюс в карму. А оценка «после» — это "+-" за статью, или "+-" в карму.


        1. DmitrySpb79 Автор
          16.12.2019 11:33

          Я в тексте и написал, что с одной стороны логично что теперь нельзя оценить статью не читая. Я в принципе с этим и не спорю. С другой стороны, при и так невысоком среднем числе голосов за статьи (из гистограммы видно что пик на +12), еще большее снижание числа проголосовавших явно не на пользу авторам, и явно не приведет к росту числа интересных публикаций на сайте («горячие» темы и так в топах, а вот разделов типа «программирование» это особенно касается).

          Но посмотрим, тут надо статистику за больший период набрать, месяца 2-3.


          1. Vlad800
            16.12.2019 13:49
            +1

            А вот здесь бы я предложил создать два рейтинга Популярное/Читаемое — один для технических хабов, и второй для всех остальных (ну или как-то так). А то действительно, сейчас статья с намеком политоты перебивает любую про реальное программирование.


          1. Boomburum
            16.12.2019 14:14

            А что если это «логичное» нововведение поможет «переградуировать» рейтинг? Ну типа там «раньше считалось, что +30 это уже хорошо», а сейчас под «хорошо» станет +10, с последующей корректировкой той же ППА? Ну как пример. Хотя я смотрю за рейтингом постов и он прям не сильно просел )


            1. Umpiro
              18.12.2019 13:54

              А что если это «логичное» нововведение поможет «переградуировать» рейтинг? Ну типа там «раньше считалось, что +30 это уже хорошо», а сейчас под «хорошо» станет +10
              Мне кажется, такой переход повышает относительную погрешность оценки.


      1. osmanpasha
        16.12.2019 07:56
        +2

        Только качество статьи может быть настолько плохим, что лучше бы автор не писал её.


  1. Umpiro
    16.12.2019 11:04
    +1

    Графики по сравнению популярности языков программирования, честно говоря, сложновоспринимаемы. Достаточно было бы баров с данными усредненными за год.


    1. DmitrySpb79 Автор
      16.12.2019 11:26
      +1

      Бар проще, но цель была посмотреть в динамике, поэтому выбран stacked plot. Лучше надписи прямо внутри сделать, но не разобрался, можно ли это реализовать с matplotlib.


      1. Umpiro
        18.12.2019 14:02

        Ничто не мешает дополнить один график другим. Мне, лично, динамика ни о чем не говорит и не интересна. А читать среднее по уже приведенному графику, как я уже сказал, неудобно.


        1. DmitrySpb79 Автор
          18.12.2019 14:06

          Да, вариантов много разных.

          Несколькими сообщениями ниже данные по популярности языков программирования я привел в текстовом виде: habr.com/ru/post/480034/#comment_21016444


  1. pagoncharov
    16.12.2019 12:23

    Для меня до сих пор загадка, почему на первом месте по просмотрам «Информационная безопасность»


    А для нас до сих пор, загадка, почему «личный состав» ТМ считает ИБ хромой кобылой.
    Видимо редакторы/менеджеры уже стареют, кругозор сужается. А мир динамичен и проблемы ИБ уже вышли на фронт всего IT.
    Но даже в аналитике по зарплатам «моего круга» до сих пор все ИБ специальности (пентестеры, аналитики, форенсика, аудиторы и т.д.) идут как «администраторы безопасности»


  1. domix32
    16.12.2019 12:43

    Было бы интересно увидеть топ языков habr edition.


    1. DmitrySpb79 Автор
      16.12.2019 13:01

      Топ-10 хабов по числу публикаций выглядит так:

        javascript 894
        python 722
        java 483
        net 405
        cpp 378
        csharp 331
        php 256
        reactjs 208
        html5 183
        css 166
      


  1. vyo
    16.12.2019 14:28

    Теперь с нетерпением жду антирейтинг.


  1. striver
    18.12.2019 16:44

    И раз уж речь зашла о хабах, нельзя не вспомнить одно из нововведений Хабра этого года — отказ от geektimes и перевод всех хабов GT в не-профильные. Теперь уже можно подвести окончательные итоги того, сказалось ли это на числе публикаций.

    Можно с уверенностью сказать, что число публикаций раздела Geektimes точно не сократилось, а в целом, с осени даже стало расти

    Вопрос. Это с учетом новостей или без? Потому что это похоже на то, что не упало за счет того, что были новости. Хабы космонавтика и транспорт — очень сильно просели, особенно статьи.


    1. DmitrySpb79 Автор
      18.12.2019 17:39
      +1

      Да, это вместе с новостями.


    1. DmitrySpb79 Автор
      18.12.2019 17:59
      +1

      Добавлю, космонавтика действительно просела, если новости убрать:

      1-2019 21
      2-2019 27
      3-2019 15
      4-2019 32
      5-2019 20
      6-2019 21
      7-2019 13
      8-2019 13
      9-2019 7
      10-2019 14
      11-2019 10
      12-2019 5