При подготовке материалов к рейтингу статей и авторов этого года (если кто не читал, ссылка здесь и здесь), я нашел довольно интересную закономерность, которую вроде бы статистически еще никто не рассматривал. Речь пойдет о популярности разных разделов (хабов) здесь на Хабре.
Статья будет интересна скорее «писателям», еще не определившимся, в какой хаб писать новый шедевр, «читатели» могут решать сами, читать или нет.
Подробности под катом.
Как всегда, традиционный disclaimer: все подсчеты и рейтинги являются неофициальными, и я не исключаю что нигде не ошибся.
А теперь, приступим. Сегодня мы рассмотрим подробнее разные хабры Хаба, т.е. наоборот, хабы Хабра :) В качестве «разминки» посмотрим топ хабов по числу просмотров:
Тут ничего неожиданного, и картинка более-менее соответствует «официальному» рейтингу на https://habr.com/ru/hubs/. Однако число просмотров в чистом виде сложно сравнивать, т.к. оно зависит от количества статей, которое для всех хабов различно. Гораздо более интересные результаты получаются если вывести топ хабов по среднему числу просмотров за статью:
Тут все становится куда более забавно. С заметным отрывом побеждает хаб… brainfuck, в котором впрочем, довольно мало статей, зато почти все из них получили высокие рейтинги. Популярность web_monetization понятна — деньги интересны всем, ну а примета времени — довольно высокое число просмотров у хаба it_immigration, в который за этот год было написано кстати, 86 статей, многие из них с довольно высоким рейтингом.
Раз уж речь зашла о рейтингах, можно построить статистику и по ним. Посмотрим, какое среднее количество голосов читателей набирают статьи в разных хабах:
На первом месте анонсы хабра — и это понятно. Остальное в принципе, видно из названий, все перечислять смысла нет. Можно лишь отдельно отметить довольно экзотический хаб demoscene, в котором обсуждаются странные штуки типа программирования на БК-0010, ну и уже вышеупомянутый brainfuck, который победил почти всех c практически двухкратным отрывом. И на удивление, в топ-10 попал Perl, хотя статей по нему в 2019 было довольно мало.
Раз уж речь зашла о программировании, перейду к грустной части. Многие авторы наверно замечали, что узконаправленные статьи по программированию на Хабре практически «не идут». И хотя это было на уровне ощущений, теперь это можно подтвердить статистически.
Увы, с популярностью статей по ЯП на Хабре в плане рейтингов все действительно довольно грустно:
В общем, было и так интуитивно понятно что статья про распознавание изображений в OpenCV никогда не догонит по рейтингам статью про мошенничество в Мегафоне, ну теперь этому есть статистическое доказательство. Хотя в качестве исключения, Perl (9 статей), Rust (61 статья) и Haskell (16 статей) держатся по средним баллам весьма неплохо.
Что в этом списке вообще делает Delphi (18 статей, в 2019 году!) не очень ясно, но оказывается, в хабе по нему некоторые археологи еще что-то пишут.
Кстати, если кому интересен рейтинг самых «унылых» хабов по числу голосов, то его тоже несложно вывести:
Интересно также объединить хабы в большие группы. Первая группа — хабы «не про программирование», куда можно отнести «карьеру», «гаджеты», «здоровье» и пр, из них я взял 10 самых популярных. Вторая группа — все хабы Geektimes, которых довольно много. Три остальные группы — профильные хабы, языки программирования и администрирование.
Результат предсказуем — «топовые» хабы получают наибольшие рейтинги, хабы Гиктаймс тоже вполне положительно оцениваются читателями, все остальное, увы, имеют заметный отрыв.
Кстати, стало интересно, как выглядели голоса статей по профильным хабам 10 лет назад, в далеком, 2009м году.
Для понимания порядка величин, в хаб «Алгоритмы» тогда было написано 30 статей со средним рейтингом +67, сейчас написано 486 статей, но средний рейтинг упал до +29.
Заключение
Статья задумывалась скорее «для прикола», чтобы посмотреть какие-то забавные закономерности, но в итоге получилась отчасти грустной. Хотя честно, я не хотел, и цель была не в этом. По крайней мере, ищущие темы новых статей для Хабра могут теперь делать это с более научным подходом, и выбирать хабы более осмысленно. Вряд ли я открыл Америку, скорее всего вышенаписанное все постоянные читатели и писатели Хабра интуитивно знали и так, но проверить статистически было интересно.
Ваш кэп.
Комментарии (8)
kababok
20.12.2019 13:12Ну, IT-эмиграция даже без привязки к повестке дня выглядит логично: всё-таки переезжают далеко не новички, приходиься решать массу социальных и общественных задач, не говоря о рабочих вопросах — так что и статьи будут предсказуемо любопытные и разносторонние. :)
В языки даже не попал Tcl/Tk.
И всё-таки статистические результаты объясняются в том числе и забавными особенностями коллективного сознательно-бессознательного — и его то ли иррациональностью (на IT-ресурсе, да :), то ли вошедшими в моду лицемерием + двойными стандартами, то ли ещё чем-то.
Сравните объём, содержание и показатели следующих статей. ;)
https://habr.com/ru/company/vk/blog/480188/
https://habr.com/ru/post/480730/
kuza2000
20.12.2019 13:12Просто профильные хабы читают специалисты, а по браинфаку мы все специалисты)))
VaskivskyiYe
Попробуйте отсеять из статистики всё, что вышло из песочницы. Потом отдельно выкинуть все переводы. А после — ещё публикации в блогах компаний. Следующим шагом будут комбинации этих 3.
Что-то мне подсказывает, что тогда средний рейтинг тех же "Алгоритмов" должен быть повыше, как и многих других. Хотя, я могу и ошибаться (:
DmitrySpb79 Автор
Новости понятно, а переводы зачем выкидывать? Там попадаются довольно интересные.
VaskivskyiYe
На несколько хороших переводов, вроде трудов PatientZero, приходится несколько десятков всякой ерунды. Но это может просто мне казаться
A114n
Теперь, когда мы знаем, что за переводы на Хабре студентам айти специальностей ставят зачёт — их просто обязательно нужно выкидывать.