image

Доброго времени суток, уважаемые Хабравчане! Считаете ли вы метрику уникальный пользователь или посетитель репрезентативной в Google Analytics или Яндекс Метрике? Я — нет. Более того, я убеждён, что значение количества посетителей на основе этих данных не имеет никакой значимости по следующим причинам:

  1. У большинства интернет пользователей несколько устройств и еще больше браузеров. Не всегда системам аналитики удается идентифицировать конкретного пользоватея.
  2. Мобильные приложения вроде Facebook, Twitter, VK, Telegram и др. имеют свой собственный webView на базе основного браузера в ОС. Куки никак не синхронизируются.
  3. Обилие клиентов для путешествия по интернету уже было упомянуто, но к ним стоит добавить всеразличные плагины и утилиты с VPN и блокировщиками рекламы.
  4. TNS утверждает, что на 1 человека в месяц приходится около 12 уникальных пользователей.


  5. Плюс ко всему аналитики компании Imperva Incapsula проанализировала более 16,7 млрд визитов на 100 тысяч случайно выбранных доменов и пришли к выводу, что на ботов пришлось почти 52% интернет-трафика в 2016 году.



Хочу подчеркнуть, что я говорю о нерепрезентативности уникальных посетителей до их идентификации после авторизации и попадения в конверсионную воронку. Очевидно, что там уже задействуются User ID, IDFA и browser fingerprint технология в целом.

Суть поста проста — данные в отличии от интерпретации данных не лгут, будьте бдительны.

Большое спасибо за внимание.
Поделиться с друзьями
-->

Комментарии (22)


  1. shurupkirov
    06.02.2017 09:28
    +1

    1. Пруфы?
    2. Хорошие боты это какие? А плохие?


    1. ilusha_sergeevich
      06.02.2017 10:04

      Пардон, забыл поставить ссылку на VC. А там уже есть ссылки на сам отчёт.


      1. shurupkirov
        06.02.2017 10:15
        +1

        что метрика, что аналитика — позволяют отсечь поисковых ботов из данных. также идентифицируют кросс-девайсы и т.п. (тестировал на себе и знакомых)
        часть вредных ботов отсекаем на хостере по фильтру импортных IP
        часть отсекаем вручную через .htaccess отлавливая взломщиков. Большая часть IP-адресов принадлежит China
        Так что нет, не поверю, что из 11 пользователей — 1 настоящий :-)
        Но за опасения спасибо)


        1. ilusha_sergeevich
          06.02.2017 10:22

          Про ботов я не просто так упомянул лишь в 5 пункте. Кросс-устрйственность — спорный момент. Конечно у гигантов вроде Яндекса или Гугла мощнейшие аналитические системы и огромное количество данных, по которым они научились определять людей. Но если вы зайдете с десктопа и потом скажем откроете ссылку в Телеграме на этот же сайт — то будет 2 уника.

          Часть там часть тут, в любом случае боты (как 5 пункт) влияют на нерепрезентативность этой метрики.

          Про TNS — это всё таки TNS и их панельная выборка.


  1. ivaschenko
    06.02.2017 10:26

    Мобильные приложения вроде Facebook, Twitter, VK, Telegram и др. имеют свой собственный webView на базе основного браузера в ОС. Куки никак не синхронизируются.

    Это вы с чего так решили? У меня Android 6.0.1 с Chrome по-умолчанию. Зашёл в Хроме на заведомо непосещаемый с телефона сайт, авторизовался, скинул себе ссылку в телеграм, открыл её через телеграм weview, всё в порядке — я авторизован.

    Куки как минимум уже давно синхронизируются с webview.


    1. ilusha_sergeevich
      06.02.2017 10:42

      У меня яблоко. Если я авторизован в Twitter в Safari, то да, я буду авторизован на нём же и в Telegram. Но я не буду авторизован в Twitter через webView от Facebook. Также важно то, что я могу пользоваться Firefox а не «нативным» Safari и тогда у меня вообще ничего не синхронизируется.


      1. ivaschenko
        06.02.2017 11:33

        Ну это лишь один из кейсов. Я вам продемонстрировал обратный.

        У вас же этот пункт выведен вторым в списке. А список якобы доказывает ваше одиозное утверждение.


        1. ilusha_sergeevich
          06.02.2017 17:22

          Так какая разница? Даже если это только айфоны и только кейс с Firefox — это уже будет в моём списке и это уже размывает точность метрики. И почему якобы?


          1. ivaschenko
            07.02.2017 11:51

            Действительно, то, что у вас айфон и Firefox — доказывает размытие метрики в 12 раз.


            1. ilusha_sergeevich
              07.02.2017 12:28

              Не нахожу продуктивным продолжать с вами диалог.


      1. Goodkat
        06.02.2017 12:59

        WebView WebView рознь.
        Есть старинный UIWebView и новый WKWebView.
        UIWebView ни с чем не синхронизируется, а WKWebView — это как бы окно Safari внутри вашего приложения, со всеми куками, контент-блокерами, историей посещения и т.п.
        Видимо, Facebook до сих пор использует UIWebView.

        Но сути это не меняет — хабр я читаю на рабочем компьютере, на домашнем, на лэптопе, на планшете, на телефоне, на двух последних как раз как в Safari, так и в WKWebView внутри Feedly.
        Если я не залогинен, я могу считаться пятью уникальными пользователями в день.


        1. ivaschenko
          07.02.2017 11:54

          5 != 12
          И вы из тех, у кого почти максимум устройств.

          12 — это прямо сильнейший перегиб. На деле не думаю, что даже до 3 коэффициент дотянет.


          1. Goodkat
            07.02.2017 12:06

            5 — это только в день. Иногда я читаю Хабр на планшете жены или мамы, иногда мне надоедают тормоза Файрфокса и я использую Хром, иногда мне надоедает однообразная таргетинговая реклама и я очищаю куки и сохранённые данные в браузере.
            Так что в месяц может и 12 наберётся.

            А ещё я знаю людей, которые всегда пользуются режимом инкогнито в браузере — они будут считаться уникальными при каждом заходе на сайт?

            Но мне коэффициент 3 тоже кажется реалистичным — дом, работа, телефон.


            1. ivaschenko
              07.02.2017 12:12

              Работа 1.
              Телефон 1.
              Дом 0,5. Вы же не один дома пользуетесь устройством наверняка.

              Это если вы гик.

              По факту же основной коммерческий трафик (а считать обычно важно именно его) — это не гики. Это домохозяйки, это офисный планктон, который говорит спасибо за совет «попробуйте выключить и снова включить» и т.д.

              Масштаб «проблемы» сильно приукрашен. Для жёлтой прессы сойдёт, но не Хабр же, право.


              1. Goodkat
                07.02.2017 13:23

                Любой личный пример не будет репрезентативным, конечно, но у многих моих знакомых, далеко не гиков, которым периодически приходится устанавливать драйвера на сканер, удалять левые плагины и панели из браузера и советовать попробовать выключить и снова включить, похожая ситуация: общий семейный лэптоп для хранения фоточек и скачивания фильмов, игровой компьютер ребёнка/отца, планшет у каждого ребёнка и у отца семейства, плюс, конечно же, смартфон на каждого члена семьи.

                Не знаю, получится ли в итоге по 12 уников на человека, но по 2-3 устройства набирается.

                Ах да, даже у моей восьмидесятидвухлетней бабушки в сибирской деревне есть смартфон и компьютер — она на почту ходила, чтобы ей воцап и скайп установили :)


  1. Vlad_fox
    06.02.2017 12:10
    +1

    я таки не понял, какую метрику вместо

    уникальный пользователь или посетитель
    , предоставляемую аналитиками, вы предлагаете использовать как более репрезентативную и имеющею большую или более правильную значимость?


    1. ilusha_sergeevich
      06.02.2017 17:26

      Хиты/просмотры страниц или просто сессии. В своём мышлении искоренил понимание уника, как действительно уникального посетитетеля. Считаю это не профессиональным для человека связанного со статистикой.


      1. ivaschenko
        07.02.2017 11:55

        Так вы делите на 12 и вот вам уники. Такая же у вас логика? Ну и больше половины это боты — ещё на пополам делим.


        1. ilusha_sergeevich
          07.02.2017 12:25

          Данные TNS были только по России это раз. Ботов половина всего, сколько из них учитывается/не учитывается системами аналитики совершенно иное число.


      1. ivan_mihailov
        07.02.2017 12:25

        Человек, профессионально связанный со статистикой, должен понимать, что лучше всего использовать метрику, максимально приближенную к тому, что хочется оценить. Если вам нужно оценить динамику аудитории в человеках, то лучший выбор — смотреть на "уникальных посетителей", так как это чаще всего наилучшее приближение. Делая, конечно, скидку на то, что это != человек. Также имеет значение рассматриваемый период. За сутки значение будет намного ближе к "людям", чем за месяц. Смотреть на "хиты" в целом довольно бессмысленно, тк современные сайты даже за одну загрузку могут сгенерировать множество хитов. Это больше технический показатель, чем продуктовый. Визиты (сессии) тоже не хуже и не лучше, чем посетители, просто могут помочь оценить другие показатели: кол-во сессий на человека, длину сессии, и т.д.
        Разные метрики в системах аналитики придуманы не просто так, хоть и все они несовершенны.
        Кстати, оценить количество "посетителей на человека" можете, если у вас залогиновый сервис: посчитайте количество посетителей метрики на каждый логин


  1. igolkin
    14.02.2017 05:20

    Согласен с остальными, отношение 1/12 не выглядит реалистичным. (С исследованием я не ознакомился, говорю о своих ощущениях).

    Давайте возьмем связку уник/посещение. При презентации данных клиенту или начальнику мы всегда говорим о паре этих параметров. Если принять за истину утверждения данной статьи, то получается, что некий процент параметра «посещение» зашит в параметре «уник». Получается, должен быть некий коэффициент. У нас он есть — 1/12. То есть на
    И вот мой вопрос. Можем ли мы говорить о релевантности связки уник/посещение, если возьмем 8,3% уников из статистики, а остальное приплюсуем в посещаемость?


  1. waltex
    14.02.2017 05:21

    Аналогичная проблема при построении аналитики по цепочке касаний до конверсии, сталкиваемся с проблемой когда конверсия через прямой заход и данные о прошлых визитах отсутствуют.