Всем привет! Прочитав заголовок, вы наверняка подумали, что речь пойдёт о какой‑то сводной статистике по публикациям за тот или иной период, разные срезы и так далее — чтобы удовлетворить любопытство и сделать какие‑нибудь выводы. Но нет: сегодня речь пойдёт о новой фиче для авторов — статистике публикаций — которая, мы надеемся, поможет сделать ваши статьи на Хабре ещё круче!

Немного про статистику

Как гласит Википедия, статистика — это отрасль знаний, наука, которая занимается вопросами сбора, измерения, мониторинга, анализа и сравнения массовых статистических данных. Она изучает количественную сторону массовых общественных явлений в числовой форме.

А что же у нас? У нас статистика стала своего рода гарантией обратной связи: даже если статья не получит комментариев и рейтинга, не принесёт плюсов в карму, вы всё равно кое-что узнаете о поведении аудитории.

До недавнего времени в арсенале пользователей было не так много данных: табличка с метриками публикаций, такими как просмотры, рейтинг, количество комментариев и добавлений в закладки. Корпоративные пользователи имели доступ к дополнительным данным из систем аналитики. Самая же полная статистика была (и остаётся) лишь у нас; её мы как только не использовали — в том числе и для поиска ответов на множество вопросов и корректировки планов развития Хабра.

Наши самые любознательные авторы иногда запрашивали расширенную статистику или задавали вопросы по теме читаемости статей. И однажды мы подумали, что было бы здорово сделать статистику доступной на всех: от авторов статей до корпоративных редакторов и администраторов. Теперь у вас под рукой есть все необходимые данные под рукой, чтобы делать статьи на Хабре еще круче! 

Рассказываем и показываем, чем она хороша.

Статистика по просмотрам публикаций собирается с 25 мая 2024 года — для более ранних материалов в воронках и графиках будет учтён только хвост просмотров.


Что внутри

Теперь справа от заголовка публикации, помимо «карандашика» для редактирования статьи, появилась новая иконка с «пирогом» — нажатие этой кнопки откроет страницу статистики данной публикации. 

Эта же кнопка появится в панели администрирования блога, в списке статей:

На открывшейся странице в самом начале нас ждёт временное предупреждение:

Из-за разных принципов подсчёта общее количество просмотров (с повторами) и счётчик на странице публикации может не совпадать.

Сейчас эти счётчики разные, но счётчик в статистике точнее. Скоро мы окончательно обкатаем алгоритмы, и это предупреждение пропадёт.

Сразу под ним — сводные данные по публикации: статус (на сайте или в черновиках; статистику можно посмотреть даже у черновиков), рейтинг, добавления в закладки и количество комментариев.

Лайфхак: если нажать на значение рейтинга, то откроется попап с причинами минусов

Ниже находится, как говорится, база, состоящая из 4 блоков:

Читатели

В этом блоке сразу 3 метрики:

  • Читатели — уникальные пользователи (авторизованные и не очень), которые посмотрели публикацию;

  • Просмотры — классические просмотры: сколько раз посетили эту страницу;

  • Повторы — разница между читателями и просмотрами. Повторы показывают, сколько раз пользователи возвращались к статье.

Дочтения

Здесь отображается количество читателей, которые долистали ваш материал до конца и читали вдумчиво. Скорость скролла — меньше 60 знаков в секунду — то есть если кто-то просто открыл и проскроллил, то такой посетитель не засчитается.

Статьи, которые размещены одной большой простынёй, как правило, набирают меньше дочтений, чем статьи, в которых есть разбиение на абзацы вперемешку с изображениями.

Доскроллы

Здесь считаем процент читателей, которые просмотрели статью до конца. Этот показатель всегда больше, чем дочтения, так как включает всех, кто просто дошёл до конца страницы, независимо от того, насколько внимательно читал.

Отказы

Это значение отображает процент пользователей от читателей, которые зашли на страницу с вашей статьёй и сразу вышли (например, картинка классная, а текст — не очень, пользователь не находит то, что ожидал, и уходит). Если процент высокий, задумайтесь: как доносить информацию, не обманывая ожидания читателей. Сюда относим тех, кто был на странице меньше 10 секунд. 

Ниже идут два таба: Воронки и График просмотров (третий таб, «Другие статьи» пока находится в разработке)

Воронки

Может, где-то такая фича на каких-то платформах и есть, но я пока не встречал. Воронки показывают интерес аудитории точнее, чем комментарии (которых может и не быть). Доступно две опции: Воронка дочтений и воронка доскроллов с возможностью выбрать временной интервал для анализа.

Воронка — не про оценки и рейтинг, она даёт понимание, как обычные пользователи взаимодействуют с контентом и где теряют интерес. Можно сравнивать текущие публикации с предыдущими и видеть динамику развития блога.

Выглядит как набор точек в публикации и путь пользователя по ним. Показываем в виде наглядной диаграммы — как глубоко пользователи двигались по статье и в каком месте отваливались. Поможет взглянуть на статью с другой стороны и увидеть проблемные места: где потеряли тему, началась «вода». Выводятся два показателя: один по текущей статье, второй по 50 последним публикациям автора (или блога компании).

Опционально можно выбрать для сравнения одну из других своих публикаций.

График просмотров 

В этом табе можно увидеть, сколько просмотров за определённый период получила публикация. Тут можно наблюдать за «временем жизни» публикации, небольшими всплесками просмотров (когда публикация оказывается в соцсетях или дайджестах), а также долгоиграющий «шлейф» посетителей, которые будут заходить в публикацию через поиск или ещё какими-то способами. 

График можно смотреть по точкам, причём делать это за разные периоды. 

Ещё один раздел («Другие статьи») находится в разработке и появится чуть позже. Там в табличном виде можно будет сравнивать публикации.


Как вам? Пишите в комментариях, что вам хотелось бы видеть в статистике. Наши продакты соберут все предложения из комментов.

Нашли опечатку в тексте? Выделите её и нажмите CTRL/⌘+Enter

Комментарии (34)


  1. dabel1k0v
    02.07.2024 06:34
    +4

    И однажды мы подумали, что было бы здорово сделать статистику доступной на всех 

    Дипломатично, а я 2 аккаунта убил, один из которых на 130к просмотров, чтобы вам эту мысль донести. А вот хотелось бы по ней стату посмотреть.

    Ну и остальные баги тоже было неплохо пофиксить.

    "Есть 3 типа лжи: ложь, наглая ложь и статистика"


    1. tulaevaarinaa
      02.07.2024 06:34
      +8

      А расскажите историю про удаление аккаунта подробнее: что, как, почему?

      п.с. любые баги можно (и нужно) отправлять сюда: https://habr.com/ru/feedback/


      1. dabel1k0v
        02.07.2024 06:34
        +1

        Звоните, это надолго

        п.с.: тестировщики тоже хотят кушать


  1. MarijQA
    02.07.2024 06:34
    +7

    Идея с воронкой оч крутая. Полезно будет показать автору, который не послушал рекомендаций редактора, например)))


    1. apoltavcev
      02.07.2024 06:34
      +5

      На всякий случай: команда Хабра не поддерживает абьюз и телесные наказания, особенно в сторону авторов. Статистику запилили самоанализа для, а не чтобы у авторов появились KPI по дочтениям)

      Если без шуток, то спасибо большое. Надеюсь, воронки будут полезны в работе)


  1. Flammmable
    02.07.2024 06:34
    +5

    Большое спасибо!

    Лично мне представляется ещё весьма любопытной статистика, на каком месте прочтения читатели ставят +1/-1 статье. Субъективно кажется, что дочтения и оценка не то, чтобы не коррелируют, а как бы даже не обратно коррелируют друг с другом.


    1. Akr0n
      02.07.2024 06:34
      +1

      И в каком месте переходят к комментариям, иногда только они и интересны.


      1. MarijQA
        02.07.2024 06:34

        Кстати, да, вообще интересная фишка! Иногда прям сразу от заголовка, думаю. А может, и не иногда)))


        1. VT100
          02.07.2024 06:34

          Я перехожу к комментариям немедленно - в надежде, что они таки догрузятся пока я прочту текст. Т.е. скролл вниз-короткая остановка-вверх.

          Lazy load - злостное зло для тех у кого нестабильна связь.


  1. ImagineTables
    02.07.2024 06:34
    +3

    Я тут на днях даже сфотографировал под впечатлением:


    1. Flammmable
      02.07.2024 06:34
      +2

      Два голоса по +1 каждый, два по +2 (Старожил, Автор или Звезда) и один +3 (Легенда).

      Или один +1 и четыре +2.

      Или три +1 и два +3.


      1. ImagineTables
        02.07.2024 06:34
        +1

        А как тогда получается «всего 6»? (Ну и без расшифровки весов выглядит как особая математика).


        1. Flammmable
          02.07.2024 06:34

          Шесть проголосовавших, девять очков. Есть участники, голосование которых меняет рейтинг статьи сразу на несколько пунктов.


          1. ImagineTables
            02.07.2024 06:34
            +1

            Я не про очки, а про то, как 5↑ и 0↓ дают всего 6.


            1. apoltavcev
              02.07.2024 06:34
              +1

              smells like баг, проверим


    1. MarijQA
      02.07.2024 06:34

      @ImagineTables пошла перечитывать правила начисления. +9, но голосов 6...


    1. Vsevo10d
      02.07.2024 06:34
      +2

      Этому багу уже пара месяцев точно. И бывает намного веселее, типа "рейтинг статьи +35. Всего голосов 35: 30↑ и -5↓ ". Ну то есть кто-то минусанул минус пять раз, и это перемножением ушло в плюс.


      1. sshmakov
        02.07.2024 06:34

        Поддержка ответила, что это фича. Считаются проголосовавшие, а не их количество голосов.


  1. tw0face
    02.07.2024 06:34
    +5

    Спасибо, воронка очень любопытная и полезная. Нигде такой подробной статистики не видел!


  1. Hlad
    02.07.2024 06:34
    +1

    Скорость скролла ниже 60 знаков в минуту - это прямо по слогам читать надо. И как она считается? Это интегральная скорость по всему тексту, или минимальная для набора небольших блоков? В первом случае статистику испортит паттерн "открыл статью, начал читать - пошёл за чаем и бутербродами", а во втором - проматывания рекламных вставок и прочей аналогичной фигни.

    Правильно было бы, наверное, разбить текст на блоки по 1000 символов, и считать медианное (именно медианное, не среднее) время прочтения, но это слишком уж заморочено...


    1. apoltavcev
      02.07.2024 06:34
      +2

      Момент: ниже 60 знаков в секунду. Если что, придумали не мы — это стандарт индустрии.

      Скорость считаем по всей части статьи, которую доскроллил пользователь. Учитываем только время, когда во вьюпорте находился текст. То есть если пользователь уходит на другую вкладку — мы это понимаем и трекаем правильно.

      В примере с бутербродами статистика действительно портится. Через некоторое время мы поймём, что пользователь ушёл, но не сразу. К счастью, на тысячах прочтений влияние таких случаев минимально. Бороться с этим можно, но есть риск, что начнутся перекосы в статистике по читателям, которые за бутербродом не пошли)


  1. Hlad
    02.07.2024 06:34
    +1

    Полистал по своим публикациям, возник забавный вопрос: допустим есть сферическая статья в вакууме, на 10 тысяч знаков. Допустим, коэффициент дочитавших её до конца - 43%. Будем считать, что количество прочитанных знаков в ней равно 10 000 * 0,43 = 4300 знаков.

    Вопрос: у какой статьи Хабра больше всего прочитанных знаков по такой метрике? Так чтобы и лонгрид, и дочитывали многие?


    1. apoltavcev
      02.07.2024 06:34

      Получается не совсем так, ведь есть прочитавшие не до конца. По идее их тоже нужно учитывать (за вычетом тех, кто дочитал до конца).

      Но логика понятна, на выходе должен получиться показатель в духе «среднее количество прочитанных знаков». И больше он будет у крайне увлекательного лонгрида, да.

      Примеров таких статей у меня пока нет, данные собираются с 25 мая — маловато, чтобы объективно оценить. Но потом примеры найдутся и мы наверняка включим их в золотой фонд где-нибудь в хелпе Хабра)


  1. akibkalo
    02.07.2024 06:34

    Хорошо бы статистику также разместить в трекере - Хабр (habr.com)
    Авторам, мне кажется, удобнее свои статьи видеть списком, без превьюшек, и оттуда иметь доступ к статистике.


  1. Vsevo10d
    02.07.2024 06:34
    +3

    Увидел эту функцию у себя в профиле вчера или позавчера, и пошел искать этот пост в хабе Хабр :)

    Прям статью захотелось написать, чтобы собрать подробную статистику с самого первого дня.


    1. apoltavcev
      02.07.2024 06:34

      Прям статью захотелось написать, чтобы собрать подробную статистику…

      На то и расчёт) А вообще да, некоторые фичи мы анонсируем с задержкой, чтобы была возможность проверить на проде.

      Так что внимательное использование Хабра вознаграждается. Иногда можно узнать о чём-то интересном раньше других)


  1. Krasnoarmeec
    02.07.2024 06:34
    +2

    Вы бы вставили возможность плюсовать старые статьи. А то сошлётся кто-то на старую очень хорошую статью и всё, плюсануть нельзя.


    1. sshmakov
      02.07.2024 06:34
      +2

      Или минусануть? Что наводит на мысль, что пусть уж так остаётся.


      1. Krasnoarmeec
        02.07.2024 06:34

        О неудачных статьях никто и не вспоминает. Так и пылятся себе в сырых подземельях Хабра.


    1. Flammmable
      02.07.2024 06:34

      И будет как на electronics.stackexchange, когда за ответ на вопрос "что такое резистор?" пятнадцатилетней давности ответивший фармит 100500 очков просто потому, что оказался первым. А новички за ответ любой сложности получают ноль целых фиг десятых. Эффект Матфея, как он есть.

      У меня самого хоть и долгоактуальные статьи и мне может это было бы в плюс, но нафиг-нафиг такое.


  1. XaBoK
    02.07.2024 06:34
    +2

    Без какого-то ориентира на среднее значение по длине и сложности поста - тяжело делать выводы. На сложный пост в 15 минут чтения является ли воронка с 20% дочтения проблемой подачи или особенностью аудитории? На хабрах тяжело вообще понять как и что. Может быть 5к просмотров, 100 закладок, 0 комментариев, +20 у поста и -10 к карме. Статистика чего тут может ответить авторам?


    1. apoltavcev
      02.07.2024 06:34

      Будет, но позже. Полный набор параметров мы начали собирать только 25 мая — чтобы прикинуть ориентиры, нужно накопить данные.

      Как посчитаем для себя, обязательно поделимся. И статью на Хабр запилим, и в интерфейсе статистики подсказки оставим)


  1. valery_shh
    02.07.2024 06:34
    +1

    А статистику по источникам трафика на статью сделаете?


    1. apoltavcev
      02.07.2024 06:34

      В планах есть, в обозримом будущем добавим)