Летом на Хабре появилась расширенная статистика. Дочтения — самый полезный новый показатель. Но авторы чаще следят за просмотрами, особенно когда речь заходит о коммерческих статьях.

Под катом я разбираюсь, почему дочтения всё‑таки важны. Бонус: табличка со средними дочтениями, доскроллами и отказами у хороших статей на Хабре.

Что такое дочтения

Дочтения показывают, сколько читателей статьи действительно её прочитали. Понять это мы можем по средней скорости скролла.

Все новые показатели мы считаем в процентах от уникальных читателей
Все новые показатели мы считаем в процентах от уникальных читателей

Среди зарубежных авторов дочтения популярны — во многом из‑за того, что вокруг них крутится статистика статьи в Medium.

Чтобы мы могли рассчитать дочтения, фронтенд Хабра отправляет два типа событий:

  • о глубине скролла

    • 0, 25, 50, 75 и 100% статьи

    • есть также отдельная метка в самом начале статьи, по которой мы определяем, что пользователь начал скролл

  • о времени прохождения каждого участка

Стас Ермаков

Старший фронтенд-разработчик Хабра

Если незарегистрированный читатель когда‑нибудь вернётся в статью и решит прочитать её заново — мы это поймём, если кука сохранилась.

В этом случае в статистике зачтётся одно, самое глубокое прочтение.

Почему дочтения важнее просмотров

Чтобы понять важность дочтений, нужно разобраться, зачем люди пишут статьи. Вот модель, которую собрал исследователь медиа Кристиан Фукс.

Вы познаёте мир, делитесь информацией с другими и совместными усилиями совершаете что-то, что меняет мир. Цикл замкнулся, поехали по-новой
Вы познаёте мир, делитесь информацией с другими и совместными усилиями совершаете что-то, что меняет мир. Цикл замкнулся, поехали по-новой

То есть цель статьи как акта коммуникации — подбить других людей на совместное действие. Получится или нет — зависит от успешности коммуникации.

Просмотры не показывают, была ли коммуникация успешной. Благодаря просмотрам мы знаем, что общение, возможно, состоялось. Но это не точно, ведь человек мог даже не читать.

Дочтения — совсем другое дело. Они намекают, что коммуникация была качественной. Всё ещё нет гарантий, что автора правильно поняли. Но его хотя бы прочли.

  • Много просмотров, мало дочтений — кликбейт, информационный шум

  • Мало просмотров, много дочтений — полезная узкоспециализированная статья, которая с высокой вероятностью повлияла на своих читателей

Важный момент: если на статье 10 просмотров, то смотреть на дочтения нет смысла. Дождитесь, пока наберётся хотя бы 500 уникальных читателей.

Сколько дочтений набирают хорошие статьи на Хабре

Новые показатели мы считаем с 25 мая 2024 года. Точно определить что такое «хорошая статья» пока нельзя — данных мало.

Летом Хабр читают хуже, потому что чтение по увлекательности проигрывает пляжу и шашлыку. Это нормально, бороться с шашлыком бессмысленно. С середины сентября метрики растут, но для окончательных выводов нужно ещё подождать.

В интерфейсе статистики ориентировочные значения мы пока не показываем, но чуть позже сделаем это. Вот промежуточный срез от аналитиков Хабра Юли и Лены:

Оценка

Уникальные читатели

Доскроллы

Дочтения

Отказы

Хорошо

5000

67%

43%

8%

Отлично

10600

78%

58%

4%

Термины

Уникальные читатели — юзеры, посмотревшие вашу статью. Мы умеем правильно трекать незарегов, так что если читатель без аккаунта несколько раз открывал статью с одного устройства — мы поймём, что это был один читатель.

Доскроллы — уникальные читатели, достигшие конца статьи.

Дочтения — уникальные читатели, достигшие конца статьи со средней скоростью скролла < 60 знаков в секунду. Дочтение является частным случаем доскролла.

Отказы — уникальные читатели, которые провели в статье меньше 10 секунд. Зашли и вышли, настолько им было неинтересно.

Если доскроллы/дочтения у вас выше, а отказы ниже — поздравляю, вы написали увлекательную статью.

Если показатели не дотягивают, есть смысл что‑то изменить в следующих статьях. @Exosphere как раз недавно опубликовала хорошие рекомендации.

Почему дочтениями редко пользуются

Мы в каком‑то роде первопроходцы: из крупных российских UGC‑платформ подробную статистику с дочтениями никто не показывает. И на это есть две объективные причины.

Во‑первых, собирать дочтения — это технически сложно. Платформа должна заложиться на разработку и поддержку дорогой системы. Есть ещё вариант интегрироваться с внешней системой аналитики, но не все готовы делиться данными (и правильно делают).

Во‑вторых, дочтения сложно гарантировать, из‑за чего с этой метрикой некомфортно работать, если вы продаёте контент. Дочтениями чаще пользуются для себя, а с внешними заказчиками договариваются на просмотры.

Необязательные, но интересные подробности

Разберём ситуацию: небольшая контент‑студия делает спецпроект для крупной компании. KPI в 20k просмотров — это не проблема. Если статья не соберёт их сама, можно докрутить остаток рекламой и все будут довольны.

Если студия закладывается под 20k дочтений, проект станет проблемным. Дело даже не в том, что статья может оказаться плохой — с этим ребята как‑нибудь справятся, не первый год на рынке.

Важнее то, что естественные колебания качества сделают экономику проекта непредсказуемой. Дочтения слишком сильно повлияют на то, сколько денег нужно будет вкинуть в рекламу на этапе докрутки.

Эти затраты не получается нормально предсказать, а заказчики не хотят, чтобы в цену закладывался высокий риск. В итоге компании сходятся не на самой точной метрике, а на более удобной для бизнеса.

Артём Константинов

Старший бэкенд-разработчик Хабра

Опыта в разработке подобных решений у нас не было, поэтому приходилось импровизировать. Ключевым требованием было предоставление агрегированной статистики в почти реальном времени, чтобы авторы быстро получали актуальную информацию.

Как основную базу данных для хранения и обработки данных мы используем ClickHouse. На пиковых нагрузках наша система успешно обрабатывает до 3000 событий в секунду, обеспечивая быструю и надежную аналитику.

Зачем дочтения Хабру

Как продакту мне ОЧЕНЬ нужны показатели, с помощью которых можно быстро и адекватно оценить качество статьи. Без этого вагончик дальше не поедет.

Таков путь
Таков путь

Вот реальная продуктовая задача: нужно объективно оценить статью, чтобы решить, попадёт она в блок «Читают сейчас» или нет. Раньше ориентироваться можно было только на просмотры и показатели вовлечения — рейтинг, закладки и комментарии.

Мы уже разобрались, что просмотры не работают при оценке качества. Но на Хабре даже рейтинг не всегда точно показывает, хорошая ли статья. Мы открытая платформа, где среднестатистический читатель — незарег, который отреагировать на статью не может.

С точки зрения рекомендашки дочтения — очень удобный показатель. Он хорошо отражает качество и собирается быстрее, чем тот же рейтинг. Когда на Хабре появится полноценная рекомендательная система, дочтения точно будут играть важную роль.

Что дальше

Мы спрашивали у авторов, чего им не хватает в статистике: чаще всего говорили про источники трафика и показы/клики по превью в лентах. Этим мы и займёмся в ближайшие месяцы.

Если нужно что-то ещё — напишите об этом в комментариях, буду думать.

Главное, что базовые функции работают без проблем. Основные показатели статистики уже помогают авторам в их непростом труде.


Спасибо всем, кто разрабатывал статистику! Без вас ничего бы не получилось.

  • Алина Файзрахманова (tg: @jillyjj) — подготовка спецификаций

  • Мария Бондаревская (behance) — дизайн и UX страницы статистики

  • Артём Константинов — обработка и хранение данных статистики на бэке

  • Екатерина Бочкарева и Стас Ермаков — отправка пользовательских событий и фронтенд страницы статистики

  • Николай Баутин (@alcochtivo) и Игорь Захаров (@igorzakhar) — тестирование

  • Арина Тулаева (тг‑канал) — маркетинговое сопровождение запуска

  • Ирина Лосева (@jonia) — обучение компаний работе с новой статистикой

  • Департамент инфраструктуры Хабра — стойкость под нагрузкой

  • @Boomburum и @Exosphere — полезные статьи

  • Команда аналитиков Юля и Лена — дельные советы и большое исследование по новым метрикам


Я веду небольшой тг‑канал о внутреннем устройстве медиа, где иногда рассказываю о том, что происходит под капотом Хабра.

Это полезно знать сотрудникам медиа: айтишникам, контентщикам, маркетологам.

Комментарии (7)


  1. zabanen2
    08.10.2024 10:15

    зря вы раскрыли все карты. сидели бы тихо понижали рейтинг плохих статей с накрученными рейтингами. копирайтерам/компаниям разве дочтения нужны? у них кпи скорее всего в статьях, а рейтинги статей - в просмотрах и выдаче поисковых систем, упоминаниях где-либо еще. сейчас они будут скроллить свои статьи "уникальными ботами" со скоростью "60 слов в минуту"

    складывается ощущение, что даже бедный спутник гоняют по космосу ради статей на хабре


  1. netch80
    08.10.2024 10:15
    +2

    А если сначала быстрый пробег по статье, потом медленнее, а потом совсем медленно, как считаться будет?


    1. Zempik
      08.10.2024 10:15

      Если незарегистрированный читатель когда‑нибудь вернётся в статью и решит прочитать её заново — мы это поймём, если кука сохранилась.

      В этом случае в статистике зачтётся одно, самое глубокое прочтение.

      В статье похожий случай описывали, могу предположить будет аналогичная ситуация.


  1. NataliaZheltova
    08.10.2024 10:15

    Жаль, что нельзя посмотреть «дочтения» у конкурентов, чтобы анализировать среднее по палате:)


  1. Flammmable
    08.10.2024 10:15

    1. Есть ли у вас внутренняя оценка полной численности целевой аудитории Хабра? Ну, скажем, "Хабр может претендовать на внимание 15-20 млн. человек, но пока что удалось привлечь лишь 5 млн. из данной совокупности людей".
      Есть ли у вас какие-то модели тех социальных/профессиональных групп, которые являются целевой аудиторией Хабра?

    2. Возможно ли собрать статистику, в какой момент чтения статьи пользователи выставляют ей оценку? Представляется, что это происходит буквально в течение первых 3-4 абзацев. Но так ли это на самом деле?


  1. Zempik
    08.10.2024 10:15
    +1

    Было бы здорово сделать сортировку статей по % дочтений и отдельно по количеству комментариев без учета рейтинга.


  1. Javian
    08.10.2024 10:15

    Прочитать всё интересное - надо много времени. Поэтому чтение в свободное время: Начинаю читать на работе - дочитываю дома поздно вечером. Начинаю читать рано утром дома - заканчиваю на работе. При этом дочитать могу на следующий день. А могу всё сразу - зависит от объема текста и количества фото. И иногда приходится углубиться на гугленье.