Всем привет! Прочитав заголовок, вы наверняка подумали, что речь пойдёт о какой‑то сводной статистике по публикациям за тот или иной период, разные срезы и так далее — чтобы удовлетворить любопытство и сделать какие‑нибудь выводы. Но нет: сегодня речь пойдёт о новой фиче для авторов — статистике публикаций — которая, мы надеемся, поможет сделать ваши статьи на Хабре ещё круче!
Немного про статистику
Как гласит Википедия, статистика — это отрасль знаний, наука, которая занимается вопросами сбора, измерения, мониторинга, анализа и сравнения массовых статистических данных. Она изучает количественную сторону массовых общественных явлений в числовой форме.
А что же у нас? У нас статистика стала своего рода гарантией обратной связи: даже если статья не получит комментариев и рейтинга, не принесёт плюсов в карму, вы всё равно кое-что узнаете о поведении аудитории.
До недавнего времени в арсенале пользователей было не так много данных: табличка с метриками публикаций, такими как просмотры, рейтинг, количество комментариев и добавлений в закладки. Корпоративные пользователи имели доступ к дополнительным данным из систем аналитики. Самая же полная статистика была (и остаётся) лишь у нас; её мы как только не использовали — в том числе и для поиска ответов на множество вопросов и корректировки планов развития Хабра.
Наши самые любознательные авторы иногда запрашивали расширенную статистику или задавали вопросы по теме читаемости статей. И однажды мы подумали, что было бы здорово сделать статистику доступной на всех: от авторов статей до корпоративных редакторов и администраторов. Теперь у вас под рукой есть все необходимые данные, чтобы делать статьи на Хабре еще круче!
Рассказываем и показываем, чем она хороша.
Статистика по просмотрам публикаций собирается с 25 мая 2024 года — для более ранних материалов в воронках и графиках будет учтён только хвост просмотров.
Что внутри
Теперь справа от заголовка публикации, помимо «карандашика» для редактирования статьи, появилась новая иконка с «пирогом» — нажатие этой кнопки откроет страницу статистики данной публикации.
Эта же кнопка появится в панели администрирования блога, в списке статей:
На открывшейся странице в самом начале нас ждёт временное предупреждение:
Из-за разных принципов подсчёта общее количество просмотров (с повторами) и счётчик на странице публикации может не совпадать.
Сейчас эти счётчики разные, но счётчик в статистике точнее. Скоро мы окончательно обкатаем алгоритмы, и это предупреждение пропадёт.
Сразу под ним — сводные данные по публикации: статус (на сайте или в черновиках; статистику можно посмотреть даже у черновиков), рейтинг, добавления в закладки и количество комментариев.
Лайфхак: если нажать на значение рейтинга, то откроется попап с причинами минусов
Ниже находится, как говорится, база, состоящая из 4 блоков:
Читатели
В этом блоке сразу 3 метрики:
Читатели — уникальные пользователи (авторизованные и не очень), которые посмотрели публикацию;
Просмотры — классические просмотры: сколько раз посетили эту страницу;
Повторы — разница между читателями и просмотрами. Повторы показывают, сколько раз пользователи возвращались к статье.
Дочтения
Здесь отображается количество читателей, которые долистали ваш материал до конца и читали вдумчиво. Скорость скролла — меньше 60 знаков в секунду — то есть если кто-то просто открыл и проскроллил, то такой посетитель не засчитается.
Статьи, которые размещены одной большой простынёй, как правило, набирают меньше дочтений, чем статьи, в которых есть разбиение на абзацы вперемешку с изображениями.
Доскроллы
Здесь считаем процент читателей, которые просмотрели статью до конца. Этот показатель всегда больше, чем дочтения, так как включает всех, кто просто дошёл до конца страницы, независимо от того, насколько внимательно читал.
Отказы
Это значение отображает процент пользователей от читателей, которые зашли на страницу с вашей статьёй и сразу вышли (например, картинка классная, а текст — не очень, пользователь не находит то, что ожидал, и уходит). Если процент высокий, задумайтесь: как доносить информацию, не обманывая ожидания читателей. Сюда относим тех, кто был на странице меньше 10 секунд.
Ниже идут два таба: Воронки и График просмотров (третий таб, «Другие статьи» пока находится в разработке)
Воронки
Может, где-то такая фича на каких-то платформах и есть, но я пока не встречал. Воронки показывают интерес аудитории точнее, чем комментарии (которых может и не быть). Доступно две опции: Воронка дочтений и воронка доскроллов с возможностью выбрать временной интервал для анализа.
Воронка — не про оценки и рейтинг, она даёт понимание, как обычные пользователи взаимодействуют с контентом и где теряют интерес. Можно сравнивать текущие публикации с предыдущими и видеть динамику развития блога.
Выглядит как набор точек в публикации и путь пользователя по ним. Показываем в виде наглядной диаграммы — как глубоко пользователи двигались по статье и в каком месте отваливались. Поможет взглянуть на статью с другой стороны и увидеть проблемные места: где потеряли тему, началась «вода». Выводятся два показателя: один по текущей статье, второй по 50 последним публикациям автора (или блога компании).
Опционально можно выбрать для сравнения одну из других своих публикаций.
График просмотров
В этом табе можно увидеть, сколько просмотров за определённый период получила публикация. Тут можно наблюдать за «временем жизни» публикации, небольшими всплесками просмотров (когда публикация оказывается в соцсетях или дайджестах), а также долгоиграющий «шлейф» посетителей, которые будут заходить в публикацию через поиск или ещё какими-то способами.
График можно смотреть по точкам, причём делать это за разные периоды.
Ещё один раздел («Другие статьи») находится в разработке и появится чуть позже. Там в табличном виде можно будет сравнивать публикации.
Как вам? Пишите в комментариях, что вам хотелось бы видеть в статистике. Наши продакты соберут все предложения из комментов.
Нашли опечатку в тексте? Выделите её и нажмите
CTRL/⌘+Enter
Комментарии (49)
MarijQA
02.07.2024 06:34+7Идея с воронкой оч крутая. Полезно будет показать автору, который не послушал рекомендаций редактора, например)))
apoltavcev
02.07.2024 06:34+7На всякий случай: команда Хабра не поддерживает абьюз и телесные наказания, особенно в сторону авторов. Статистику запилили самоанализа для, а не чтобы у авторов появились KPI по дочтениям)
Если без шуток, то спасибо большое. Надеюсь, воронки будут полезны в работе)
Flammmable
02.07.2024 06:34+6Большое спасибо!
Лично мне представляется ещё весьма любопытной статистика, на каком месте прочтения читатели ставят +1/-1 статье. Субъективно кажется, что дочтения и оценка не то, чтобы не коррелируют, а как бы даже не обратно коррелируют друг с другом.
Akr0n
02.07.2024 06:34+1И в каком месте переходят к комментариям, иногда только они и интересны.
MarijQA
02.07.2024 06:34Кстати, да, вообще интересная фишка! Иногда прям сразу от заголовка, думаю. А может, и не иногда)))
VT100
02.07.2024 06:34+4Я перехожу к комментариям немедленно - в надежде, что они таки догрузятся пока я прочту текст. Т.е. скролл вниз-короткая остановка-вверх.
Lazy load - злостное зло для тех у кого нестабильна связь.
Mike-M
02.07.2024 06:34+1на каком месте прочтения читатели ставят +1/-1 статье.
Мое мнение: чтобы оценка была объективной, выставлять её следует только после прочтения всей статьи. Бывает, что одно единственное предложение где-нибудь в конце приносит столько пользы, что заставляет поставить +2, хотя до этого предложения хотелось поставить 0 или даже −1.
ImagineTables
02.07.2024 06:34+6Я тут на днях даже сфотографировал под впечатлением:
Flammmable
02.07.2024 06:34+6Два голоса по +1 каждый, два по +2 (Старожил, Автор или Звезда) и один +3 (Легенда).
Или один +1 и четыре +2.
Или три +1 и два +3.
ImagineTables
02.07.2024 06:34+3А как тогда получается «всего 6»? (Ну и без расшифровки весов выглядит как особая математика).
Flammmable
02.07.2024 06:34+3Шесть проголосовавших, девять очков. Есть участники, голосование которых меняет рейтинг статьи сразу на несколько пунктов.
ImagineTables
02.07.2024 06:34+3Я не про очки, а про то, как 5↑ и 0↓ дают всего 6.
apoltavcev
02.07.2024 06:34+2smells like баг, проверим
pragmatik
02.07.2024 06:34Имхо, это обусловлено тем, что мы пользователей, уличенных в накрутках, «лишаем права голоса». Голосовать они, по-прежнему, могут, но вес их голоса равен 0.
MarijQA
02.07.2024 06:34@ImagineTables пошла перечитывать правила начисления. +9, но голосов 6...
pragmatik
02.07.2024 06:34Пользователи, внесшие вклад в развитие сообщества, имеют больший вес голоса. А тех, кто был уличен в накрутках, модераторы, наоборот, «лишают права голоса». Голосовать они, по-прежнему, могут, но вес их голоса равен 0.
Vsevo10d
02.07.2024 06:34+3Этому багу уже пара месяцев точно. И бывает намного веселее, типа "рейтинг статьи +35. Всего голосов 35: 30↑ и -5↓ ". Ну то есть кто-то минусанул минус пять раз, и это перемножением ушло в плюс.
sshmakov
02.07.2024 06:34Поддержка ответила, что это фича. Считаются проголосовавшие, а не их количество голосов.
tw0face
02.07.2024 06:34+6Спасибо, воронка очень любопытная и полезная. Нигде такой подробной статистики не видел!
Hlad
02.07.2024 06:34+1Скорость скролла ниже 60 знаков в минуту - это прямо по слогам читать надо. И как она считается? Это интегральная скорость по всему тексту, или минимальная для набора небольших блоков? В первом случае статистику испортит паттерн "открыл статью, начал читать - пошёл за чаем и бутербродами", а во втором - проматывания рекламных вставок и прочей аналогичной фигни.
Правильно было бы, наверное, разбить текст на блоки по 1000 символов, и считать медианное (именно медианное, не среднее) время прочтения, но это слишком уж заморочено...
apoltavcev
02.07.2024 06:34+4Момент: ниже 60 знаков в секунду. Если что, придумали не мы — это стандарт индустрии.
Скорость считаем по всей части статьи, которую доскроллил пользователь. Учитываем только время, когда во вьюпорте находился текст. То есть если пользователь уходит на другую вкладку — мы это понимаем и трекаем правильно.
В примере с бутербродами статистика действительно портится. Через некоторое время мы поймём, что пользователь ушёл, но не сразу. К счастью, на тысячах прочтений влияние таких случаев минимально. Бороться с этим можно, но есть риск, что начнутся перекосы в статистике по читателям, которые за бутербродом не пошли)
Hlad
02.07.2024 06:34+2Полистал по своим публикациям, возник забавный вопрос: допустим есть сферическая статья в вакууме, на 10 тысяч знаков. Допустим, коэффициент дочитавших её до конца - 43%. Будем считать, что количество прочитанных знаков в ней равно 10 000 * 0,43 = 4300 знаков.
Вопрос: у какой статьи Хабра больше всего прочитанных знаков по такой метрике? Так чтобы и лонгрид, и дочитывали многие?
apoltavcev
02.07.2024 06:34+1Получается не совсем так, ведь есть прочитавшие не до конца. По идее их тоже нужно учитывать (за вычетом тех, кто дочитал до конца).
Но логика понятна, на выходе должен получиться показатель в духе «среднее количество прочитанных знаков». И больше он будет у крайне увлекательного лонгрида, да.
Примеров таких статей у меня пока нет, данные собираются с 25 мая — маловато, чтобы объективно оценить. Но потом примеры найдутся и мы наверняка включим их в золотой фонд где-нибудь в хелпе Хабра)
akibkalo
02.07.2024 06:34+2Хорошо бы статистику также разместить в трекере - Хабр (habr.com)
Авторам, мне кажется, удобнее свои статьи видеть списком, без превьюшек, и оттуда иметь доступ к статистике.
Vsevo10d
02.07.2024 06:34+9Увидел эту функцию у себя в профиле вчера или позавчера, и пошел искать этот пост в хабе Хабр :)
Прям статью захотелось написать, чтобы собрать подробную статистику с самого первого дня.
apoltavcev
02.07.2024 06:34+2Прям статью захотелось написать, чтобы собрать подробную статистику…
На то и расчёт) А вообще да, некоторые фичи мы анонсируем с задержкой, чтобы была возможность проверить на проде.
Так что внимательное использование Хабра вознаграждается. Иногда можно узнать о чём-то интересном раньше других)
Krasnoarmeec
02.07.2024 06:34+5Вы бы вставили возможность плюсовать старые статьи. А то сошлётся кто-то на старую очень хорошую статью и всё, плюсануть нельзя.
sshmakov
02.07.2024 06:34+4Или минусануть? Что наводит на мысль, что пусть уж так остаётся.
Krasnoarmeec
02.07.2024 06:34О неудачных статьях никто и не вспоминает. Так и пылятся себе в сырых подземельях Хабра.
Flammmable
02.07.2024 06:34+4И будет как на electronics.stackexchange, когда за ответ на вопрос "что такое резистор?" пятнадцатилетней давности ответивший фармит 100500 очков просто потому, что оказался первым. А новички за ответ любой сложности получают ноль целых фиг десятых. Эффект Матфея, как он есть.
У меня самого хоть и долгоактуальные статьи и мне может это было бы в плюс, но нафиг-нафиг такое.
XaBoK
02.07.2024 06:34+3Без какого-то ориентира на среднее значение по длине и сложности поста - тяжело делать выводы. На сложный пост в 15 минут чтения является ли воронка с 20% дочтения проблемой подачи или особенностью аудитории? На хабрах тяжело вообще понять как и что. Может быть 5к просмотров, 100 закладок, 0 комментариев, +20 у поста и -10 к карме. Статистика чего тут может ответить авторам?
apoltavcev
02.07.2024 06:34Будет, но позже. Полный набор параметров мы начали собирать только 25 мая — чтобы прикинуть ориентиры, нужно накопить данные.
Как посчитаем для себя, обязательно поделимся. И статью на Хабр запилим, и в интерфейсе статистики подсказки оставим)
serafims
02.07.2024 06:34От дьявола все это, весь этот маркетинг. Раньше условно "для применения порыва души" писали, не оглядываясь на цифры, и обеспечивая разнообразие, ну хоть надеюсь посты-копипасты из двух абзацев уйдут в небытие.
valery_shh
02.07.2024 06:34Чисто для порыва души много не напишешь. Кто-то должен оплачивать время авторов. В идеальном мире за контент должны платить читатели, но поскольку они не платить не хотят, то платят компании из маркетинговых бюджетов.
Flammmable
02.07.2024 06:34+3(пошёл смотреть, сколько автор комментария написал статей "от души")
serafims
02.07.2024 06:34Ваши статьи прекрасные и при этом не в корп. блоге и без ссылок на телегу. Как же так вышло? Собственно, этот факт и выглядит как опровержение комментария над вашим).
Flammmable
02.07.2024 06:34+2Ваши статьи прекрасные и при этом не в корп. блоге и без ссылок на телегу.
О, спасибо! )) Подписывайтесь, ставьте лайки, оставляйте ваши комментарии и делитесь моими статьями с друзьями ))
Но если говорить серъёзно, то не столь важно, что является мотивацией автора - если автор хочет не написать что-нибудь "в стол", а, например, бескорыстно сообщить нечто читателям , то одной из составляющих в обязательном порядке является (хотим мы того или нет) продвижение статьи. Иначе как читатели её прочитают?
Поэтому меня несколько удивляют пуристы, говорящие нечто вроде "ой, дались вам эти лайки и просмотры, главное, чтобы статья была хорошая!".
GrantM
02.07.2024 06:34+2Нейронкам теперь проще будет оценивать эффективность определенного набора слов против другого набора слов. Еще и в течение времени.
О дивный мир, сколько нам открытий чудных. Готовит обратная связь парадоксов людских в чертогах нейронных.
apoltavcev
02.07.2024 06:34+3Пока читал коммент, в голове всплыл тот самый голос) Но вообще есть такая опасность.
Поэтому доступ к данным по всем публикациям мы никому давать не планируем. Понаобучают моделей, а статей от тёплых ламповых человеков не дождёшься потом.
engine9
02.07.2024 06:34+1А учитывается эффект от такого поведени: сначала пролистал всё быстро, а потом вернулся и прочёл вдумчиво?
apoltavcev
02.07.2024 06:34+1Воронки отработают корректно: система затрекает глубину доскролла и отдельно время, чтобы посчитать дочтение. Если дело происходит в несколько сеансов — мы учтём только самое длительное и глубокое прочтение.
Но тут важно понимать, что воронки не показывают распределение внимания по частям статьи — для этого используются другие, более сложные системы (вроде яндексовского Вебвизора). То есть воронка дочтений ни при каких условиях не покажет, что дочтение 3/4 было больше, чем 2/4. Даже если по факту юзеры проскроллили кусок 2/4, но два раза внимательно прочитали 3/4.
Задача воронок другая — показать, в каком месте читатели отвалились (совсем перестали скроллить или читать). С этим наша система справляется отлично.
В будущем хотелось бы разработать условную тепловую карту, чтобы было видно, какие части статьи читались особенно внимательно. Но впереди долгий путь)
dabel1k0v
Дипломатично, а я 2 аккаунта убил, один из которых на 130к просмотров, чтобы вам эту мысль донести. А вот хотелось бы по ней стату посмотреть.
Ну и остальные баги тоже было неплохо пофиксить.
"Есть 3 типа лжи: ложь, наглая ложь и статистика"
tulaevaarinaa
А расскажите историю про удаление аккаунта подробнее: что, как, почему?
п.с. любые баги можно (и нужно) отправлять сюда: https://habr.com/ru/feedback/
dabel1k0v
Звоните, это надолго
п.с.: тестировщики тоже хотят кушать