Доброго времени суток, уважаемые Хабравчане! Считаете ли вы метрику уникальный пользователь или посетитель репрезентативной в Google Analytics или Яндекс Метрике? Я — нет. Более того, я убеждён, что значение количества посетителей на основе этих данных не имеет никакой значимости по следующим причинам:
- У большинства интернет пользователей несколько устройств и еще больше браузеров. Не всегда системам аналитики удается идентифицировать конкретного пользоватея.
- Мобильные приложения вроде Facebook, Twitter, VK, Telegram и др. имеют свой собственный webView на базе основного браузера в ОС. Куки никак не синхронизируются.
- Обилие клиентов для путешествия по интернету уже было упомянуто, но к ним стоит добавить всеразличные плагины и утилиты с VPN и блокировщиками рекламы.
- TNS утверждает, что на 1 человека в месяц приходится около 12 уникальных пользователей.
- Плюс ко всему аналитики компании Imperva Incapsula проанализировала более 16,7 млрд визитов на 100 тысяч случайно выбранных доменов и пришли к выводу, что на ботов пришлось почти 52% интернет-трафика в 2016 году.
Хочу подчеркнуть, что я говорю о нерепрезентативности уникальных посетителей до их идентификации после авторизации и попадения в конверсионную воронку. Очевидно, что там уже задействуются User ID, IDFA и browser fingerprint технология в целом.
Суть поста проста — данные в отличии от интерпретации данных не лгут, будьте бдительны.
Большое спасибо за внимание.
Комментарии (22)
ivaschenko
06.02.2017 10:26Мобильные приложения вроде Facebook, Twitter, VK, Telegram и др. имеют свой собственный webView на базе основного браузера в ОС. Куки никак не синхронизируются.
Это вы с чего так решили? У меня Android 6.0.1 с Chrome по-умолчанию. Зашёл в Хроме на заведомо непосещаемый с телефона сайт, авторизовался, скинул себе ссылку в телеграм, открыл её через телеграм weview, всё в порядке — я авторизован.
Куки как минимум уже давно синхронизируются с webview.ilusha_sergeevich
06.02.2017 10:42У меня яблоко. Если я авторизован в Twitter в Safari, то да, я буду авторизован на нём же и в Telegram. Но я не буду авторизован в Twitter через webView от Facebook. Также важно то, что я могу пользоваться Firefox а не «нативным» Safari и тогда у меня вообще ничего не синхронизируется.
ivaschenko
06.02.2017 11:33Ну это лишь один из кейсов. Я вам продемонстрировал обратный.
У вас же этот пункт выведен вторым в списке. А список якобы доказывает ваше одиозное утверждение.ilusha_sergeevich
06.02.2017 17:22Так какая разница? Даже если это только айфоны и только кейс с Firefox — это уже будет в моём списке и это уже размывает точность метрики. И почему якобы?
ivaschenko
07.02.2017 11:51Действительно, то, что у вас айфон и Firefox — доказывает размытие метрики в 12 раз.
Goodkat
06.02.2017 12:59WebView WebView рознь.
Есть старинный UIWebView и новый WKWebView.
UIWebView ни с чем не синхронизируется, а WKWebView — это как бы окно Safari внутри вашего приложения, со всеми куками, контент-блокерами, историей посещения и т.п.
Видимо, Facebook до сих пор использует UIWebView.
Но сути это не меняет — хабр я читаю на рабочем компьютере, на домашнем, на лэптопе, на планшете, на телефоне, на двух последних как раз как в Safari, так и в WKWebView внутри Feedly.
Если я не залогинен, я могу считаться пятью уникальными пользователями в день.ivaschenko
07.02.2017 11:545 != 12
И вы из тех, у кого почти максимум устройств.
12 — это прямо сильнейший перегиб. На деле не думаю, что даже до 3 коэффициент дотянет.Goodkat
07.02.2017 12:065 — это только в день. Иногда я читаю Хабр на планшете жены или мамы, иногда мне надоедают тормоза Файрфокса и я использую Хром, иногда мне надоедает однообразная таргетинговая реклама и я очищаю куки и сохранённые данные в браузере.
Так что в месяц может и 12 наберётся.
А ещё я знаю людей, которые всегда пользуются режимом инкогнито в браузере — они будут считаться уникальными при каждом заходе на сайт?
Но мне коэффициент 3 тоже кажется реалистичным — дом, работа, телефон.ivaschenko
07.02.2017 12:12Работа 1.
Телефон 1.
Дом 0,5. Вы же не один дома пользуетесь устройством наверняка.
Это если вы гик.
По факту же основной коммерческий трафик (а считать обычно важно именно его) — это не гики. Это домохозяйки, это офисный планктон, который говорит спасибо за совет «попробуйте выключить и снова включить» и т.д.
Масштаб «проблемы» сильно приукрашен. Для жёлтой прессы сойдёт, но не Хабр же, право.Goodkat
07.02.2017 13:23Любой личный пример не будет репрезентативным, конечно, но у многих моих знакомых, далеко не гиков, которым периодически приходится устанавливать драйвера на сканер, удалять левые плагины и панели из браузера и советовать попробовать выключить и снова включить, похожая ситуация: общий семейный лэптоп для хранения фоточек и скачивания фильмов, игровой компьютер ребёнка/отца, планшет у каждого ребёнка и у отца семейства, плюс, конечно же, смартфон на каждого члена семьи.
Не знаю, получится ли в итоге по 12 уников на человека, но по 2-3 устройства набирается.
Ах да, даже у моей восьмидесятидвухлетней бабушки в сибирской деревне есть смартфон и компьютер — она на почту ходила, чтобы ей воцап и скайп установили :)
Vlad_fox
06.02.2017 12:10+1я таки не понял, какую метрику вместо
уникальный пользователь или посетитель
, предоставляемую аналитиками, вы предлагаете использовать как более репрезентативную и имеющею большую или более правильную значимость?ilusha_sergeevich
06.02.2017 17:26Хиты/просмотры страниц или просто сессии. В своём мышлении искоренил понимание уника, как действительно уникального посетитетеля. Считаю это не профессиональным для человека связанного со статистикой.
ivaschenko
07.02.2017 11:55Так вы делите на 12 и вот вам уники. Такая же у вас логика? Ну и больше половины это боты — ещё на пополам делим.
ilusha_sergeevich
07.02.2017 12:25Данные TNS были только по России это раз. Ботов половина всего, сколько из них учитывается/не учитывается системами аналитики совершенно иное число.
ivan_mihailov
07.02.2017 12:25Человек, профессионально связанный со статистикой, должен понимать, что лучше всего использовать метрику, максимально приближенную к тому, что хочется оценить. Если вам нужно оценить динамику аудитории в человеках, то лучший выбор — смотреть на "уникальных посетителей", так как это чаще всего наилучшее приближение. Делая, конечно, скидку на то, что это != человек. Также имеет значение рассматриваемый период. За сутки значение будет намного ближе к "людям", чем за месяц. Смотреть на "хиты" в целом довольно бессмысленно, тк современные сайты даже за одну загрузку могут сгенерировать множество хитов. Это больше технический показатель, чем продуктовый. Визиты (сессии) тоже не хуже и не лучше, чем посетители, просто могут помочь оценить другие показатели: кол-во сессий на человека, длину сессии, и т.д.
Разные метрики в системах аналитики придуманы не просто так, хоть и все они несовершенны.
Кстати, оценить количество "посетителей на человека" можете, если у вас залогиновый сервис: посчитайте количество посетителей метрики на каждый логин
igolkin
14.02.2017 05:20Согласен с остальными, отношение 1/12 не выглядит реалистичным. (С исследованием я не ознакомился, говорю о своих ощущениях).
Давайте возьмем связку уник/посещение. При презентации данных клиенту или начальнику мы всегда говорим о паре этих параметров. Если принять за истину утверждения данной статьи, то получается, что некий процент параметра «посещение» зашит в параметре «уник». Получается, должен быть некий коэффициент. У нас он есть — 1/12. То есть на
И вот мой вопрос. Можем ли мы говорить о релевантности связки уник/посещение, если возьмем 8,3% уников из статистики, а остальное приплюсуем в посещаемость?
waltex
14.02.2017 05:21Аналогичная проблема при построении аналитики по цепочке касаний до конверсии, сталкиваемся с проблемой когда конверсия через прямой заход и данные о прошлых визитах отсутствуют.
shurupkirov
ilusha_sergeevich
Пардон, забыл поставить ссылку на VC. А там уже есть ссылки на сам отчёт.
shurupkirov
что метрика, что аналитика — позволяют отсечь поисковых ботов из данных. также идентифицируют кросс-девайсы и т.п. (тестировал на себе и знакомых)
часть вредных ботов отсекаем на хостере по фильтру импортных IP
часть отсекаем вручную через .htaccess отлавливая взломщиков. Большая часть IP-адресов принадлежит China
Так что нет, не поверю, что из 11 пользователей — 1 настоящий :-)
Но за опасения спасибо)
ilusha_sergeevich
Про ботов я не просто так упомянул лишь в 5 пункте. Кросс-устрйственность — спорный момент. Конечно у гигантов вроде Яндекса или Гугла мощнейшие аналитические системы и огромное количество данных, по которым они научились определять людей. Но если вы зайдете с десктопа и потом скажем откроете ссылку в Телеграме на этот же сайт — то будет 2 уника.
Часть там часть тут, в любом случае боты (как 5 пункт) влияют на нерепрезентативность этой метрики.
Про TNS — это всё таки TNS и их панельная выборка.