Хабраутилита для сбора хабрастатистики в хабраблогах / forpes.ru

Главная
Хабраутилита для сбора хабрастатистики в хабраблогах

Хабраутилита для сбора хабрастатистики в хабраблогах +35

25.12.2018 07:49

Newbilius 3 2200 Источник

Новый год — время подводить итоги. И если вы ведёте блог на хабре, или вам интересно посмотреть статистику по чьему-нибудь чужому блогу — то вам может пригодиться моя опенсорсная утилитка.

Какую статистику выдаёт?

CSV-файл с базовой информацией о всех статьях:

название
рейтинг статьи
число добавлений в закладки
число просмотров
число комментариев
автор
ссылка на статью

(более крупная версия скриншота доступна по клику)

CSV-файл c информацией, какой автор в блоге несёт ответственность за какое число просмотров/комментариев/плюсов/добавлений в закладки.

CSV-файл с аналогичной информацией, но сгруппированной по хабам.

CSV-файл с аналогичной информацией, но сгруппированной по тегам. Для скачивания тегов приходится грузить не только список статей, но и каждую статью в отдельности, так что если вам оно не надо — то флаг -skipTags нехило ускорить процесс скачивания данных.

Ну и в качестве бонуса — JSON-файл с этой же информацией.

Где взять?

Исходники лежат на GitHub, написана утилита на Java 10, и. Уже собранный JAR, инструкция по использованию и примеры – там же, в разделе релизов.

Как работает и как использовать?

Поскольку Хабрахабр API — миф*, то утилитка просто и уныло разбирает HTML через jsoup. Натравливать утилитку можно как на личные, так и на корпоративные блоги — ей всё едино.

Для корпоративных блогов — передаём программе ссылку на сам блог, например https://habr.com/company/JetBrains/

Для личных блогов нужно указывать страничку с постами, например: https://habr.com/users/milfgard/posts/

Более подробная справка встроена в приложение, плюс есть readme файл в репозитории.

* может и нет, но я такой информации найти не смог

Я нашёл баг / хочу ещё фичу

Не вопрос — баги или пожелания оставляйте в гитхабовские issues, предложения и доработки — туда же в виде pull-request’ов. Ну или прямо здесь в комментариях!

Комментарии (3)

qwert_ukg
25.12.2018 11:07
#19546026
A u habra razve net open api?
1. Newbilius Автор
  25.12.2018 11:26
  #19546086
  Я не нашёл. Если есть — поделитесь ссылкой, учту и с удовольствием использую.
  1. Boomburum
    25.12.2018 12:27
    #19546376
    Общедоступного нет, но сам API есть — даём доступ в некоторых случаях :) Сейчас напишу вам.

Хабраутилита для сбора хабрастатистики в хабраблогах +35

Какую статистику выдаёт?

Где взять?

Как работает и как использовать?

Я нашёл баг / хочу ещё фичу

Комментарии (3)

qwert_ukg

Newbilius Автор

Boomburum