Летом на Хабре появилась расширенная статистика. Дочтения — самый полезный новый показатель. Но авторы чаще следят за просмотрами, особенно когда речь заходит о коммерческих статьях.
Под катом я разбираюсь, почему дочтения всё‑таки важны. Бонус: табличка со средними дочтениями, доскроллами и отказами у хороших статей на Хабре.
Что такое дочтения
Дочтения показывают, сколько читателей статьи действительно её прочитали. Понять это мы можем по средней скорости скролла.
Среди зарубежных авторов дочтения популярны — во многом из‑за того, что вокруг них крутится статистика статьи в Medium.
Чтобы мы могли рассчитать дочтения, фронтенд Хабра отправляет два типа событий:
-
о глубине скролла
0, 25, 50, 75 и 100% статьи
есть также отдельная метка в самом начале статьи, по которой мы определяем, что пользователь начал скролл
о времени прохождения каждого участка
Стас Ермаков
Старший фронтенд-разработчик Хабра
Если незарегистрированный читатель когда‑нибудь вернётся в статью и решит прочитать её заново — мы это поймём, если кука сохранилась.
В этом случае в статистике зачтётся одно, самое глубокое прочтение.
Почему дочтения важнее просмотров
Чтобы понять важность дочтений, нужно разобраться, зачем люди пишут статьи. Вот модель, которую собрал исследователь медиа Кристиан Фукс.
То есть цель статьи как акта коммуникации — подбить других людей на совместное действие. Получится или нет — зависит от успешности коммуникации.
Просмотры не показывают, была ли коммуникация успешной. Благодаря просмотрам мы знаем, что общение, возможно, состоялось. Но это не точно, ведь человек мог даже не читать.
Дочтения — совсем другое дело. Они намекают, что коммуникация была качественной. Всё ещё нет гарантий, что автора правильно поняли. Но его хотя бы прочли.
Много просмотров, мало дочтений — кликбейт, информационный шум
Мало просмотров, много дочтений — полезная узкоспециализированная статья, которая с высокой вероятностью повлияла на своих читателей
Важный момент: если на статье 10 просмотров, то смотреть на дочтения нет смысла. Дождитесь, пока наберётся хотя бы 500 уникальных читателей.
Сколько дочтений набирают хорошие статьи на Хабре
Новые показатели мы считаем с 25 мая 2024 года. Точно определить что такое «хорошая статья» пока нельзя — данных мало.
Летом Хабр читают хуже, потому что чтение по увлекательности проигрывает пляжу и шашлыку. Это нормально, бороться с шашлыком бессмысленно. С середины сентября метрики растут, но для окончательных выводов нужно ещё подождать.
В интерфейсе статистики ориентировочные значения мы пока не показываем, но чуть позже сделаем это. Вот промежуточный срез от аналитиков Хабра Юли и Лены:
Оценка |
Уникальные читатели |
Доскроллы |
Дочтения |
Отказы |
Хорошо |
5000 |
67% |
43% |
8% |
Отлично |
10600 |
78% |
58% |
4% |
Термины
Уникальные читатели — юзеры, посмотревшие вашу статью. Мы умеем правильно трекать незарегов, так что если читатель без аккаунта несколько раз открывал статью с одного устройства — мы поймём, что это был один читатель.
Доскроллы — уникальные читатели, достигшие конца статьи.
Дочтения — уникальные читатели, достигшие конца статьи со средней скоростью скролла < 60 знаков в секунду. Дочтение является частным случаем доскролла.
Отказы — уникальные читатели, которые провели в статье меньше 10 секунд. Зашли и вышли, настолько им было неинтересно.
Если доскроллы/дочтения у вас выше, а отказы ниже — поздравляю, вы написали увлекательную статью.
Если показатели не дотягивают, есть смысл что‑то изменить в следующих статьях. @Exosphere как раз недавно опубликовала хорошие рекомендации.
Почему дочтениями редко пользуются
Мы в каком‑то роде первопроходцы: из крупных российских UGC‑платформ подробную статистику с дочтениями никто не показывает. И на это есть две объективные причины.
Во‑первых, собирать дочтения — это технически сложно. Платформа должна заложиться на разработку и поддержку дорогой системы. Есть ещё вариант интегрироваться с внешней системой аналитики, но не все готовы делиться данными (и правильно делают).
Во‑вторых, дочтения сложно гарантировать, из‑за чего с этой метрикой некомфортно работать, если вы продаёте контент. Дочтениями чаще пользуются для себя, а с внешними заказчиками договариваются на просмотры.
Необязательные, но интересные подробности
Разберём ситуацию: небольшая контент‑студия делает спецпроект для крупной компании. KPI в 20k просмотров — это не проблема. Если статья не соберёт их сама, можно докрутить остаток рекламой и все будут довольны.
Если студия закладывается под 20k дочтений, проект станет проблемным. Дело даже не в том, что статья может оказаться плохой — с этим ребята как‑нибудь справятся, не первый год на рынке.
Важнее то, что естественные колебания качества сделают экономику проекта непредсказуемой. Дочтения слишком сильно повлияют на то, сколько денег нужно будет вкинуть в рекламу на этапе докрутки.
Эти затраты не получается нормально предсказать, а заказчики не хотят, чтобы в цену закладывался высокий риск. В итоге компании сходятся не на самой точной метрике, а на более удобной для бизнеса.
Артём Константинов
Старший бэкенд-разработчик Хабра
Опыта в разработке подобных решений у нас не было, поэтому приходилось импровизировать. Ключевым требованием было предоставление агрегированной статистики в почти реальном времени, чтобы авторы быстро получали актуальную информацию.
Как основную базу данных для хранения и обработки данных мы используем ClickHouse. На пиковых нагрузках наша система успешно обрабатывает до 3000 событий в секунду, обеспечивая быструю и надежную аналитику.
Зачем дочтения Хабру
Как продакту мне ОЧЕНЬ нужны показатели, с помощью которых можно быстро и адекватно оценить качество статьи. Без этого вагончик дальше не поедет.
Вот реальная продуктовая задача: нужно объективно оценить статью, чтобы решить, попадёт она в блок «Читают сейчас» или нет. Раньше ориентироваться можно было только на просмотры и показатели вовлечения — рейтинг, закладки и комментарии.
Мы уже разобрались, что просмотры не работают при оценке качества. Но на Хабре даже рейтинг не всегда точно показывает, хорошая ли статья. Мы открытая платформа, где среднестатистический читатель — незарег, который отреагировать на статью не может.
С точки зрения рекомендашки дочтения — очень удобный показатель. Он хорошо отражает качество и собирается быстрее, чем тот же рейтинг. Когда на Хабре появится полноценная рекомендательная система, дочтения точно будут играть важную роль.
Что дальше
Мы спрашивали у авторов, чего им не хватает в статистике: чаще всего говорили про источники трафика и показы/клики по превью в лентах. Этим мы и займёмся в ближайшие месяцы.
Если нужно что-то ещё — напишите об этом в комментариях, буду думать.
Главное, что базовые функции работают без проблем. Основные показатели статистики уже помогают авторам в их непростом труде.
Спасибо всем, кто разрабатывал статистику! Без вас ничего бы не получилось.
Алина Файзрахманова (tg: @jillyjj) — подготовка спецификаций
Мария Бондаревская (behance) — дизайн и UX страницы статистики
Артём Константинов — обработка и хранение данных статистики на бэке
Екатерина Бочкарева и Стас Ермаков — отправка пользовательских событий и фронтенд страницы статистики
Николай Баутин (@alcochtivo) и Игорь Захаров (@igorzakhar) — тестирование
Арина Тулаева (тг‑канал) — маркетинговое сопровождение запуска
Ирина Лосева (@jonia) — обучение компаний работе с новой статистикой
Департамент инфраструктуры Хабра — стойкость под нагрузкой
@Boomburum и @Exosphere — полезные статьи
Команда аналитиков Юля и Лена — дельные советы и большое исследование по новым метрикам
Я веду небольшой тг‑канал о внутреннем устройстве медиа, где иногда рассказываю о том, что происходит под капотом Хабра.
Это полезно знать сотрудникам медиа: айтишникам, контентщикам, маркетологам.
Комментарии (51)
netch80
08.10.2024 10:15+6А если сначала быстрый пробег по статье, потом медленнее, а потом совсем медленно, как считаться будет?
Zempik
08.10.2024 10:15+4Если незарегистрированный читатель когда‑нибудь вернётся в статью и решит прочитать её заново — мы это поймём, если кука сохранилась.
В этом случае в статистике зачтётся одно, самое глубокое прочтение.
В статье похожий случай описывали, могу предположить будет аналогичная ситуация.
apoltavcev Автор
08.10.2024 10:15Всё так, зачтём самый глубокий забег и его время. Если читатель несколько раз дошёл до одного места — зачтём самое длительное из прочтений.
h45h47
08.10.2024 10:15А если не дочитал, а потом, зайдя заново, быстро пролистал до момента остановки, чтобы продолжить? Тогда может дочтение в доскролл попасть.
Хотя это уже редкие кейс, на статистику наверняка не сильно влияет.
apoltavcev Автор
08.10.2024 10:15Конкретно этот случай мы обсчитаем корректно, потому что метки доскроллов и время между ними отдельно трекаются.
Но да, есть эджкейсы, при которых статистика рушится. К счастью, уже после 1000 просмотров они практически не влияют на показатели.
В будущем хотелось бы стать точнее. Тогда мы бы уже не только воронки вывели, но и тепловую карту статьи — было бы видно, в каких местах юзеры задерживаются дольше.
NataliaZheltova
08.10.2024 10:15+1Жаль, что нельзя посмотреть «дочтения» у конкурентов, чтобы анализировать среднее по палате:)
apoltavcev Автор
08.10.2024 10:15Решили поберечь нервы авторов, им и так несладко бывает) Но среднее по всему Хабру покажем обязательно, только чуть позже.
Flammmable
08.10.2024 10:15+3Есть ли у вас внутренняя оценка полной численности целевой аудитории Хабра? Ну, скажем, "Хабр может претендовать на внимание 15-20 млн. человек, но пока что удалось привлечь лишь 5 млн. из данной совокупности людей".
Есть ли у вас какие-то модели тех социальных/профессиональных групп, которые являются целевой аудиторией Хабра?Возможно ли собрать статистику, в какой момент чтения статьи пользователи выставляют ей оценку? Представляется, что это происходит буквально в течение первых 3-4 абзацев. Но так ли это на самом деле?
apoltavcev Автор
08.10.2024 10:15+1Да, рынок оценивали, но показать не могу — внутренняя информация. Если говорить про группы, то с большим отрывом лидируют бэкенд-разработчики, за ними фулстек и админы. Других специальностей сильно меньше.
Flammmable
08.10.2024 10:15+1Спасибо!
Если можно будет опубликовать хотя бы часть данного исследования, лично для меня это было бы суперинтересно. Но я понимаю, что вряд ли :)
apoltavcev Автор
08.10.2024 10:15+1Пока не могу сказать, но вопрос интересный. Сейчас мы сфокусированы на действиях, которые могут совершать незарегистрированные пользователи. До рейтинга тоже когда-нибудь доберёмся.
Zempik
08.10.2024 10:15+3Было бы здорово сделать сортировку статей по % дочтений и отдельно по количеству комментариев без учета рейтинга.
Javian
08.10.2024 10:15+2Прочитать всё интересное - надо много времени. Поэтому чтение в свободное время: Начинаю читать на работе - дочитываю дома поздно вечером. Начинаю читать рано утром дома - заканчиваю на работе. При этом дочитать могу на следующий день. А могу всё сразу - зависит от объема текста и количества фото. И иногда приходится углубиться на гугленье.
hw_store
08.10.2024 10:15+13А ещё некоторые статьи, даже плохие, вызывают бурю комментариев, и во многих случаях участие в обсуждении или хотя бы чтение комментариев является более познавательным занятием, чем чтение исходной статьи. При этом статья может быть просмотрена по диагонали.
apoltavcev Автор
08.10.2024 10:15+1Есть такое, поэтому для себя мы трекаем время в комментариях. Авторам эти данные пока не выводим, но может быть добавим их позже.
BarakAdama
08.10.2024 10:15+3Есть риск, что фокус на дочтениях может привести к смещению контента в более короткие (менее глубокие) форматы. Время — ресурс, он ограничен. Даже на качественную, но длинную статью его нужно больше, чем на короткую. Похожее смещение может возникнуть и в паре научпоп-хардкор по той же причине.
В любом случае интересно, как всё это будет развиваться. Новые идеи — это хорошо! Удачи вам.
apoltavcev Автор
08.10.2024 10:15+2Спасибо на добром слове! Да, при прямом сравнении у коротких форматов действительно есть преимущество, как и у научпопа.
Но Хабр всегда был про длинные статьи и профильный контент. Так что будем продумывать систему сдержек и противовесов, ведь специфику терять не хочется.Noizefan
08.10.2024 10:15+1введите коэффициент значимости дочтения, чем меньше статья - тем менее полезно дочтение, и пусть они множатся в объективную но условную оценку
ris58h
08.10.2024 10:15+4Но Хабр всегда был про длинные статьи и профильный контент.
И поэтому появились посты /s
Мне интересно как происходит сама продуктовая разработка Хабра. Как решается какие фичи будут, как отбирают и тэстируют гипотезы. А если ещё и с примерами и со статистикой, так вообще замечательно было бы.
Flammmable
08.10.2024 10:15+4"Но Хабр всегда был про длинные статьи и профильный контент."
И поэтому появились посты...
...и Слава Рюмин, который пишет про что угодно кроме IT, но является рекордсменом ППА. При этом отнесение его статей к профильному хабу Бизнес-модели*, очевидно, не соответствует тематике того хаба ("Предпринимательская деятельность в IT").
Мне интересно как происходит сама продуктовая разработка Хабра. Как решается какие фичи будут, как отбирают и тэстируют гипотезы. А если ещё и с примерами и со статистикой, так вообще замечательно было бы.
Удваиваю вопрос :)
В первую очередь было бы интересно, что для руководства Хабра является целевыми показателями? А затем - как от них протягивается цепочка к результативности того или иного нововведения.apoltavcev Автор
08.10.2024 10:15+2что для руководства Хабра является целевыми показателями? А затем - как от них протягивается цепочка к результативности того или иного нововведения.
Подумаю, что я могу вытащить из-под NDA. В общих чертах расскажу в любом случае, но под это отдельную статью надо написать)
Flammmable
08.10.2024 10:15+1В общих чертах расскажу в любом случае, но под это отдельную статью надо написать)
Это будет офигенно!
Boomburum
08.10.2024 10:15+2Слава Рюмин не является рекордсменом в ППА :) Некоторые статьи, которые «написаны в профильные хабы и набрали рейтинг» отклоняются нами, когда мы принимаем решение поощрять или нет ту или иную статью-кандидата. Это не очень нравится авторам, но правила нам это позволяют, да и в целом у нас нет цели платить всем за всё — стараемся отбираем только самые технические и профильные статьи.
Flammmable
08.10.2024 10:15стараемся отбираем только самые технические и профильные статьи
Большое спасибо вам лично и всей вашей редакции за то, что стараетесь сохранить Хабр тем местом, которое продекларировано в его манифесте!! Вы самые лучшие!
Пользуясь случаем хотел, однако, поинтересоваться:
Почему, исходя из комментария многоуважаемой @Exosphere, из статьи Рюмина, не соответствующей хабу Бизнес-модели*, модератор исключил данный профильный хаб?
А из этой, этой, этой и этой статьи (которые также не соответствуют описанию упомянутого профильного хаба - "Предпринимательская деятельность в IT") - не исключил?
В чем разница?Правда ли, что при достижении первого места автор может опубликовать в ленте специальный рекламный блок "Голос свыше" и Слава Рюмин его неоднократно использовал, в том числе для рекламы своих статей (нерелевантных профильным тематикам Хабра)?
apoltavcev Автор
08.10.2024 10:15Кстати, отчасти это действительно так) Наличие постов удлиняет статьи, потому что теперь все короткие тексты валятся туда.
Про интерес к продуктовой разработке Хабра понял, спасибо. Подумаю, что можно об этом написать.
sfi0zy
08.10.2024 10:15+2Наличие постов удлиняет статьи
Есть ложь, наглая ложь и статистика с подменой выборок. Нас на Хабре таким не проведешь!
Было бы на самом деле интересно посмотреть на графики по годам (скажем за 10 лет), сколько пишут в разные хабы. Особенно не очень попсовые. Такая мега подборка трендов среди всех авторов. Скажем хаб WebGL. Был период, когда там было много статей, а потом стало казаться, что их стало меньше в несколько раз. Это так кажется, или люди действительно перестали про это писать? "Тортовость" Хабра складывается же не только из формальной длины материалов, но и из специалистов узкого профиля с уникальными знаниями, которые готовы ими делиться. И есть впечатление, что там происходят смещения, какие-то специализации приходят, какие-то уходят.
apoltavcev Автор
08.10.2024 10:15+1"Тортовость" Хабра складывается же не только из формальной длины материалов, но и из специалистов узкого профиля с уникальными знаниями, которые готовы ими делиться.
Да, вы абсолютно правы! И смещения по профилю действительно есть, мы это видим.
В графиках по годам могут быть искажения из-за неправильной разметки данных. В Хабре 10-летней давности точно не так много внимания уделялось правильному проставлению хабов. Да и границы некоторых хабов размыты.
Но с хабами вроде WebGL всё более-менее понятно. Подумаю, можем ли мы какую-то инфу выкатить в открытый доступ. Спасибо за наводку!
vtal007
08.10.2024 10:15Почему это сложно сделать? по сути нужно событие. которое сработает в конце статьи и еще метрика время от старта до конца (чтобы исключать быстро-скролл), плюс посчитать кол-во знаков (чтобы прикинуть среднюю скорость чтения)
Тему с доскроллами и прочими редакторскими метриками продвигали активно ребята из mail.ru. А потом и в я-метрике появились кое-какие метрики
apoltavcev Автор
08.10.2024 10:15Концептуально действительно ничего сложного. Фронт Хабра отправляет чуть больше событий, потому что мы строим подробную воронку, но смысл тот же.
Сложность в агрегации данных и скоростях. Чтобы вывести показатели авторам, пришлось отдельно думать над тем, как ускорить сервис.Плюс нагрузки. На масштабах Хабра это настоящий хайлоад.
ne555
08.10.2024 10:15Дочтения
показывают, сколько читателей статьи действительно её прочиталиБоже. [р.п. дочитывания чего? статей].
Дальше
дочтеневать
статью не стал.apoltavcev Автор
08.10.2024 10:15Мы не первые начали собирать дочтения, поэтому взяли формулировку, которая уже используется на рынке.
Многие авторы привыкли к названиям показателей в Метрике — не вижу смысла их переучивать.
ne555
08.10.2024 10:15+1формулировку, которая уже используется на рынке
Только у Яндекса такая формулировка была? У кого-то еще "дочтения" имеются? Может быть в т.ч. и поэтому они на
hh
ищут специалиста по тех.документации?Многие авторы привыкли
Да? Опрос проводили на Хабре или это все интуитивно, потому что Яндекс?
Я вот вижу, что "многие" пользователи и тем более читатели не привыкли к такой формулировке на Хабре.
Вы можете хоть всем отделом стоять за "дочтением" и минусовать, но лучше бы пообщались с учителем русского языка, провели бы опрос среди читателей/авторов контента на Хабре, а не слизывали сомнительную формулировку у компании, которая на ладан дышит. Вам пользователи говорят, что "дочтения" — криво, портал gramota за "дочитывание", даже браузер в редакторе подчеркивает красным, что формулировка такая себе.
KGeist
08.10.2024 10:15+3"Дочтение" это по факту образование от глагола "дочесть", который существует, правда как устаревшее слово.
Прочесть - прочтение.
Дочесть - дочтение.В какой-то момент глаголы "-честь" стали заменяться глаголами "-читать". Но имеют право на жизнь!
Мне лично "дочитывание" звучит как процесс (т.к. это несовершенный вид), тогда как "дочтение" больше звучит как про результат. А в контексте термина как будто важнее результат, чем процесс.
AlexanderS
08.10.2024 10:15+1А как будет считаться, если я с мобильного без авторизации в дороге читаю статью, а на ПК потом уже подпроматываю чтобы плюсик статье поставить? Причём у меня куки и там и сям в браузерах автоматом трутся)
apoltavcev Автор
08.10.2024 10:15+1Оп-па, вот и эджкейс) Это будут два независимых прочтения, против смены устройства и чистки кук мы бессильны.
Но если авторизуетесь с мобильного — считаться будет корректно, для зарегистрированных у нас отдельная логика.
В целом, такие проблемы характерны для всех систем аналитики. «Пользователь» в них — это не совсем пользователь, а какое-то промежуточное состояние между пользователем и сеансом. Но и этого хватает, чтобы оценить качество текста.
Трекать юзеров точнее я бы и не стал, в корпорацию зла превращаться не хочется)
9982th
08.10.2024 10:15Сейчас чтобы скрыть автора нужно открыть статью и доскроллить до блока с информацией об авторе в самом конце. Это считается как обычное дочтение или идет отдельной графой?
apoltavcev Автор
08.10.2024 10:15Для этого как раз разделяют доскроллы и дочтения. В этом случае будет зачтён доскролл.
По дочтениям о качестве статьи можно судить, а вот доскроллы скорее говорят о том, что в комментариях интереснее. Или статья полезная, но водянистая.
KEugene
08.10.2024 10:15+7Тут есть несколько моментов, что искажают картину.
Как упомянули выше, чтобы забанить автора, надо доскролить статью.
Статья может быть так себе, но мотаем ради комментариев. Думаю, ситуация знакома.
-
У статьи отображается столько "минусов", что даже интересно за что ее так. Ну и комментарии. Опять мотаем до конца.
В общем, статистика может быть интересной, но она может быть искажена "ценностью" информации, что идет после статьи, а не самим материалом.
apoltavcev Автор
08.10.2024 10:15Да, замечания справедливые. Поэтому важно помимо доскроллов считать дочтения, они больше говорят о качестве текста.
V1RuS
08.10.2024 10:15+2немного не в тему, но: почему на Хабре есть "лучшее за сегодня", но нет "лучшего за вчера" (или за любую выбранную дату)?
я из-за этого иногда пропускаю интересные статьи, если открываю Хабр не каждый день.apoltavcev Автор
08.10.2024 10:15+1В потоках есть подходящий по смыслу фильтр)
Скрин
V1RuS
08.10.2024 10:15+2Нет, это как раз неподходящий. Тот же вопрос: лучшие за последнюю неделю есть, а где лучшие за предыдущую неделю? Или за месяц, но не за этот, а за декабрь 2021 например?
apoltavcev Автор
08.10.2024 10:15Заберу в бэклог и подумаем, спасибо. Планировали поработать с лентами как раз)
V1RuS
08.10.2024 10:15+2на пикабу это сделано достаточно удобно: можно выбрать любую дату или диапазон дат, и дальше статьи (посты) за эти даты уже сортируются по рейтингу.
zamboga
08.10.2024 10:15+2Воспользуюсь случаем, задам вопрос напрямую.
Хотел бы на хабре галочку в настройках "скрывать прочитанные статьи". Я нередко пользуюсь разделами "лучшее за месяц" или "лучшее за неделю", и где-то на 2-4 день рейтинг уже "протухает" — на первой странице выдачи будут или прочитанные, или нерелевантные [ для меня] статьи. И вот тут бы прям на фасад перед катом кнопочку "скрыть статью" очень пригодилась бы, чтобы подобная лента всегда была свежей.
Может закинете в бэклог идею?
banno
08.10.2024 10:15Это из за этого мобильным приложением почти не возможно пользоваться в зонах не устойчивого приема? Едешь в электричке, читаешь уже подгруженную статью и тут бац заглушка во весь экран.
zabanen2
зря вы раскрыли все карты. сидели бы тихо понижали рейтинг плохих статей с накрученными рейтингами. копирайтерам/компаниям разве дочтения нужны? у них кпи скорее всего в статьях, а рейтинги статей - в просмотрах и выдаче поисковых систем, упоминаниях где-либо еще. сейчас они будут скроллить свои статьи "уникальными ботами" со скоростью "60 слов в минуту"
складывается ощущение, что даже бедный спутник гоняют по космосу ради статей на хабре
apoltavcev Автор
Пока рекомендательной системы в лентах нет, так что крутить незачем. Но да, когда будем её разрабатывать — включим режим секретности.
Список параметров может и покажу, но подробно описывать алгоритм (и в каком месте там нейронки) точно не буду.