На иллюстрации слева — маршрут таксиста, которого отследили по открытым анонимизированным данным. Krupnikas, статья «Как я нашел способ отследить всех водителей ”Ситимобил”»
Сейчас сбором таких данных через мобильные приложения занимаются десятки компаний. Только они отслеживают перемещения не такси, а людей. Всех людей. Совершенно легально.
Вероятно, о большинстве этих фирм вы никогда не слышали, но для их клиентов ваша жизнь — открытая книга. Они видят, куда вы ходите в течение дня, с кем встречаетесь и с кем спите, посещаете ли метадоновую клинику, кабинет психиатра или тайский массаж.
Это не спецслужбы, не корпорации, а обычные компании с обычными клиентами. Не за горами то время, когда вы тоже за скромную сумму в районе $20 сможете заказать полное информационное досье на своего соседа (и наоборот). Давайте посмотрим, какая информация есть у этих фирм.
Журналисты NY Times раздобыли один такой файл от трекинговой компании. Это самый крупный и наиболее информативный массив данных, когда-либо утёкший в открытый доступ. Он содержит более 50 миллиардов местоположений с телефонов более 12 миллионов американцев.
Конечно, это «анонимизированные» данные. Там нет имён и фамилий людей. Но на самом деле это и не нужно. Имена и фамилии хранятся в других базах. А их в любой момент можно привязать. Но до этого момента пользователей уверяют в «анонимности», усыпляя их бдительность. Дата-майнинг этого массива позволяет понять, кто скрывается за каждым «анонимным» объектом. Вы видите людей в Белом доме
и на даче Трампа в Палм-Бич.
В любом здании по любому адресу, даже в Пентагоне.
Очевидно, NY Times приводит примеры таких объектов, чтобы произвести максимальное впечатление на законодателей. В реальности же происходит абсолютная и тотальная слежка за всем населением. Все пользователи представлены как юниты на карте. Единственное, что нельзя обвести их мышкой и отправить на задание.
Файл с более 50 миллиардами записей изучен в рамках проекта Privacy. Каждая запись в базе данных — местоположение одного смартфона. Период — нескольких месяцев в 2016 и 2017 годах. Данные предоставил источник, который попросил сохранить анонимность, поскольку не уполномочен делиться этой информацией, а его компанию могут оштрафовать. Однако источник встревожен масштабом слежки, который ведёт его фирма и её конкуренты — поэтому решил срочно проинформировать общественность и законодателей.
Файл с данными слежки охватывает несколько крупных городов, и там он отслеживает людей практически во всех районах и кварталах, будь то трейлеры нищих пенсионеров или богатые резиденции влиятельных политиков. Файл показывает, кто посещал каждую резиденцию и кто там ночевал (некоторые гости оставались на ночь). В рамках расследования были отслежены посетители особняков Джонни Деппа, Тайгера Вудса и Арнольда Шварценеггера.
Аналогичный трекинг выполняется для любой городской квартиры. Не составляет особого труда определить личность «анонимных» пользователей по конкретному адресу. Нужно понимать, что такая история перемещений собирается буквально на каждого пользователя мобильного телефона. В настоящее время информацию можно получать из нескольких источников. Раньше были только операторы сотовой связи, а сейчас трекинг выполняется через любое мобильное приложение, у которого есть разрешение на доступ к информации о местоположении устройства или если нет такого права. Например, приложение Facebook отслеживает местоположение пользователей даже если запретить это в настройках.
Файл с 50 млрд записей — лишь крохотный кусочек того, что каждый день собирает индустрия по отслеживанию пользователей. Трекинг стал настолько вездесущным в нашей цифровой жизни, что его практически невозможно избежать.
Несколько десятилетий назад граждане США подняли бы вооружённое восстание, если бы государство надело следящее устройство на каждого жителя старше 12 лет. Сегодня 99,9% делают это добровольно.
Неужели коммерческим корпорациям больше доверия, чем государству? Если вы гражданин тоталитарной страны, то это имеет смысл. При условии, что информация хранится за границей — и режим не получит к ней доступ. В противном случае власти могут принудить любую фирму поделиться данными. И тогда сбор информации коммерческими фирмами отнюдь не безопаснее, чем тоталитарная государственная слежка.
Но почему люди соглашаются на эту слежку? Судя по всему, ради удобства современной жизни. Людям просто удобно вызывать такси одной кнопкой по текущим координатам, искать друзей поблизости, видеть коммерческие предложения, таргетированные по координатам: «Соблазн этих потребительских товаров настолько силён, что он ослепляет нас и мы забываем, что есть другой способ получить технологические преимущества без вторжения в частную жизнь, — говорит Уильям Стейплз, директор-основатель исследовательского центра Surveillance Studies в университете Канзаса. — Все эти компании действуют как целый рой, используя разные инструменты для повседневного трекинга».
Некоторые компании из индустрии трекинга. Источники: MightySignal, LUMA Partners и AppFigures
Собирать и продавать эту информацию сегодня совершенно законно в России, США и в большинстве других стран мира. Только внутренняя политика компаний и порядочность отдельных сотрудников не позволяют им заниматься злоупотреблениями — например, следить за бывшей женой или продавать информацию случайным покупателям на форуме.
Компании говорят, что данные передаются лишь проверенным партнёрам. Остаётся только верить на слово в такую корпоративную благотворительность.
Установить личность по истории перемещений легче, чем по ДНК
Исследование в рамках проекта Privacy убедительно показывает, насколько легко производится персонализация данных из анонимизированного датасета. Да, в этом файле миллиарды точек данных без идентифицирующей информации, нет имён и адресов электронной почты. Но связать полную историю о перемещениях с именем конкретного человека проще простого.
В большинстве случаев для этого достаточно посмотреть на домашний адрес и место работы — две точки, где находится смартфон в дневное и ночное время.
Называть данные о местоположении «анонимизированными», как это делает «Ситимобил» и другие — огромное лицемерие. Это совершенно ложное утверждение, которое опровергнуто рядом научных исследований. Все они нашли, что личность человека (или водителя такси) легко установить по истории его перемещений. Учёные пришли к выводу, что действительно точную и длительную историю геолокации невозможно обезличить: «Наверное, только ДНК труднее обезличить, чем точную историю геолокации», — говорит Пол Ом, профессор права и исследователь в юридическом центре Джоржтаунского университета.
Тем не менее, компании продолжают утверждать, что данные являются анонимными. В маркетинговых материалах, на конференциях — повсюду громко заявляют, что данные собираются анонимно, чтобы успокоить людей по поводу столь инвазивного мониторинга.
Перемещения чиновника министерства обороны США и его жены, принявших участие в акции протеста Women's March. Трекинг позволяет идентифицировать всех участников акции, взявших с собой мобильные телефоны
На демонстрационном массиве данных за несколько месяцев журналисты NY Times легко идентифицировали, а потом отследили несколько десятков известных людей. Они проследили маршрут военного офицера с пропуском безопасности, который вечером возвращался домой. Отследили сотрудника правоохранительных органов, когда она вела детей в школу. Наблюдали за влиятельными адвокатами (и их гостями) во время поездок на частные самолеты и курорты.
В данном случае целью журналистов было не выкопать грязь, а лишь задокументировать риски несанкционированной слежки. Но надо понимать, что ничто не мешает отследить точно так же любого из нас, а заказчиком может быть кто угодно — ревнивая жена, подруга, работодатель, бизнес-партнёр или коллега на работе, который захотел подшутить.
«Перемещения точек на карте раскрывают перед вами первые признаки распадающихся браков, свидетельства наркомании, записи посещений психологических учреждений, — пишет NY Times. — Привязка этой истории к реальному человеку по времени и месту похожа на чтение чьего-то дневника».
История геолокации многое говорит о человеке, но трекинговые фирмы собирают гораздо более подробное досье на каждого человека, включая туда информацию с других трекеров, в том числе:
- история действий в интернете, просмотренных страниц и поисковых запросов на персональном компьютере, ноутбуках, планшетах и смартфонах;
- видеоролики, фильмы и передачи, запущенные на экране телевизора;
- и многое другое.
В отсутствие федерального закона о неприкосновенности частной жизни отрасль в значительной степени опирается на саморегулирование. Несколько отраслевых групп предлагают компаниям подписаться под этическими принципами. Например, Ассоциация мобильного маркетинга нготовит проект такого документа. Отдельные штаты начинают принимать собственные законы, чтобы восполнить этот пробел.
Отдельные штаты начинают реагировать своими собственными законами. Например, в 2020 году в Калифорнии вступает в силу закон Consumer Protection Act, который немного расширяет контроль пользователей над их данными. Например, люди могут попросить компанию удалить свои данные или предотвратить их продажу.
Но кроме нескольких новых требований, отрасль в значительной степени действует свободно и без какого-то регулирования: «Если частная компания законно собирает данные о местоположении, они могут свободно распространять их или делиться ими, как они хотят», — поясняет Калли Шрёдер, юрист компании по защите конфиденциальности и данных VeraSafe.
Аналогичное законодательство действует в Российской Федерации. Частные компаниям никто не запрещает свободно собирать и продавать данные о местоположении и другую персональную информацию, пока эта информация считается анонимной.
Компании пользуются этой лазейкой и сейчас активно отслеживают людей. Информация — новая нефть. Данные продаются и покупаются практически в режиме реального времени, так что ваше местоположение может быть передано с вашего смартфона на серверы приложения и экспортировано третьим лицам за миллисекунды. Например, вы можете увидеть в браузере или мобильном приложении рекламу нового автомобиля через некоторое время после того, как пройдёте через дилерский центр.
Большинство населения не возражает против сбора данных в мобильных приложениях, потому что не осознают масштаба слежки и готовы мириться с ней ради удобства потребления и коммуникации. «Самый большой трюк, который когда-либо провернули технологические компании, — они убедили общество следить за собой», — пишет NY Times.
Компромисс современной цифровой гигиены — сохранить преимущества геолокации, но заблокировать сбор истории. Поэтому не разрешайте приложениям отслеживать местоположение на постоянной основе!
Комментарии (132)
empenoso
20.12.2019 16:33+1Хорошая статья
yea
20.12.2019 18:08А мне не понравилась. Много эмоций, мало конкретики, выглядит как попытка манипуляции.
Называть данные о местоположении «анонимизированными», как это делает «Ситимобил» и другие — огромное лицемерие. Это совершенно ложное утверждение, которое опровергнуто рядом научных исследований. Все они нашли, что личность человека (или водителя такси) легко установить по истории его перемещений. Учёные пришли к выводу, что действительно точную и длительную историю геолокации невозможно обезличить
Тут так вообще типичный прием плохой журналистики: обвинить компанию во лжи, сослаться на исследования, а оговорку про то, что геолокация должна быть точной и длительной, засунуть в самый конец и тут же забыть про неё. Точные и длительные данные в этом случае есть только для местоположения машины — даже не водителя, не говоря уже о пассажирах. Допускаю, что этот кейс тоже не слишком хорош, но конкретно в контексте статьи он просто-напросто притянут за уши, чтобы вызвать у читателя возмущение нехорошими людьми из «Ситимобила».avkudrin
20.12.2019 21:41+3А почему вы думаете, что приложение, у которого есть разрешение получать местоположение пользователя, собирает информацию о местоположении только пока вы едете в такси?
AlexTest
21.12.2019 09:56Интересно, а есть приложение типа «fake gps», в котором можно было бы включить режим случайной смены координат с заданным интервалом или диапазоном интервалов времени в заданном радиусе от реальной точки расположения? Или еще лучше — пусть генерит случайные маршруты перемещения. Тогда трекать их будет бессмысленно. Ну и только когда требуется вызвать такси или сделать другой заказ с привязкой к реальным координатам — эту штуку отключать, причем только на время, пока делаешь такой заказ.
IgorGS
21.12.2019 11:41+1естьalex005
21.12.2019 17:32К сожалению в этом приложении можно только установить точку на карте и она будет неподвижной. Было бы неплохо, если можно было бы имитировать трекинг перемещения.
nlykl
21.12.2019 22:00Наверняка такие приложения есть, так как подмена местоположения — не хак, а стандартная функция системы Android. Сам факт подмены из коробки не скрывается. Для скрытия нужно ставить модуль для Xposed Framework, для чего необходим рут.
Lennonenko
24.12.2019 12:41
fougasse
21.12.2019 11:43+1Осталось определиться с доверием к программе "fake gps".
Притом не для посетителей хабра(которые могут и в исходники глянуть, и трафик посниффать), а для обычных пользователей условных смартфонов по 200 баксов.AllexIn
21.12.2019 13:26+2Достаточно чтобы она была опенсорс и был аудит от более-менее известных личностей.
edogs
21.12.2019 17:28+1Сотовый оператор может достаточно точно определять по вышкам.
А расхождение между гпс и сотовыми данными может выглядеть как попытка замаскироваться при помощи шубы и балаклавы в общественном бассейне.nlykl
21.12.2019 22:13Есть режим «только GPS» в настройках геолокации.
edogs
21.12.2019 22:57Есть. И как мы наглядно видим — часть проблемы с этой шумихой вокруг отслеживания по gps в том, что маскируется тот факт, что от пользователя ничего не зависит в глобальном смысле и не все это понимают.
Ни фейк-гпс, ни настройки телефона — никак не спасут от определения оператором сотовой связи местонахождения абонента, который коннектится к его (оператора) вышкам. Совершает звонки через его (оператора) соты, тем самым передавая не только телефоны контактов и время звонков, но и весь голосовой траффик.
При этом у этого же оператора паспортные данные абонента, история смс, а голосового траффика вполне достаточно что бы в какой-то мере изобразить абонента что перед банком, что перед госуслугами, что перед кем угодно и вполне возможно этих данных будет достаточно.Oleg_Dolbik
22.12.2019 13:28А потом окажется, что сам факт включения и выключения телефона будет косвенной уликой в резонансном уголовном деле…
tvr
23.12.2019 16:04А потом окажется, что сам факт включения и выключения
Вот поэтому не надо его выключать, а лучше отправить кататься по городу с хорошим знакомым.edogs
23.12.2019 16:19+2А хороший знакомый может неплохо зарабатывать на таких поездках и вообще хорошие знакомые будут цениться, вспоминается анекдот советских времен
Два брата — колхозники. В войну один был командиром партизанского отряда, другой — полицаем. После войны первый остался рядовым колхозником, а второй, отбыв срок, пошел вверх: звеньевой, председатель, депутат.
Первый:
— Я понять не могу, как так? Я партизанил, герой, всю жизнь вкалывал, копейки лишней не взял, а ничего не имею. А ты предателем был, а сейчас в больших начальниках ходишь.
— Ну, всё правильно. Вот что ты в анкете в графе «Родственники» пишешь?
— Правду пишу! Что брат у меня — полицай, предатель Родины.
— Вот! А я пишу, что мой брат — герой, командир партизанского отряда.
d-stream
23.12.2019 01:08В массе простой фейкер-рандомайзер будет легко отфильтровать. Собственно как сам шум определения координат. То есть нужны более продвинутые имитации очень похожие на реальность.
Xtensive
23.12.2019 15:43А потом в лучших традициях «киберпанка», полиция предъявляет обвинение на основании таких фейковых данных: «вот мол вы были в доме где жил убитый. Вот у нас лежат нотариальное заверенные координаты от компании производителя вашего фитнесс-трекера/кардиостимулятора/умного пылесоса(подставить нужное).»
DrunkBear
20.12.2019 17:06Ага, а потом можно передавать обезличенный набор данных и никому не говорить, что userid — это sha256(номер телефона) + соль (111222333).
NAI
23.12.2019 16:49Можно просто нарандомить данных и продавать, они же обезличены на достоверность не проверить =).
Кажется, бизнес-план готов.
Dabbuger
20.12.2019 18:03+2информационный пузырь всё больше и больше стягивается. Из него сложнее вырваться. Я хочу, что бы мне интернет подсовывал НОВЫЙ контент, а не то чем я интересовался ВЧЕРА. А то такое ощущение что весь мир состоит из радиоуправляемых машинок, кроссовок, а еще мне нужны бесперебойники. Всё.
А теперь реклама будет привязываться не только к поисковым запросам, а еще и к местоположению. Тем самым еще сузив мой «круг интересов»tvr
20.12.2019 18:07Я хочу, что бы мне интернет подсовывал НОВЫЙ контент, а не то чем я интересовался ВЧЕРА.
Ага, выбирал я казан две недели назад и цены на телефоны мониторил.
Всё, теперь мне их предлагать будут ещё долго.SteelJames
20.12.2019 18:29Да ладно выбирал. Мне идиотский «ИИ» от яндекса предлагает купить то, что я УЖЕ КУПИЛ!
Areso
20.12.2019 22:12По-моему у Гугла была такая кнопочка — скрыть эту рекламу, потому что я это уже купил.
Давайте попросим Яндекс такое же сделать?)ragman
21.12.2019 08:40Вы бы попробовали — у яндекса уже это давно есть:
Скрыть рекламу:
Не интересуюсь этой темой
Товар куплен или услуга найдена
Нарушает закон или спам
Мешает просмотру контентаachekalin
21.12.2019 09:00+3Ага, юзер купил кроссовки! Значит, предложим ему ещё кроссовок, он их явно покупает!
Сработает для сливочного масла (часто покупаю), для кроссовок не работает (реже ищу), Яндексу с Гуглом пофиг. "Пипл никуда не денется!"
fougasse
21.12.2019 11:44Абонемент от Амазона на минималках, прямо, закажите кроссовки на каждый месяц — 15% скидка на каждую пару.
tvr
21.12.2019 11:20Вы бы попробовали — у яндекса уже это давно есть:
Вот только оно не работает, один хрен везде теперь казаны Xiaomi.
Так же как и постоянные предложения «Установить самые безопасные яндекс.стринги!», которое вылазит несколько раз в день.
SteelJames
23.12.2019 16:26-1Во-первых, у яндекса такая кнопка давно уже есть.
Но не для того я на свет появился, чтобы тыкать на кнопочки вместо тупых роботов, которых по недоразумению назвали «ИИ»
Kastrulya0001
21.12.2019 11:34+1Яндекс вообще самый тупой ИИ. Спрашивается, зачем у них есть аккаунт общий везде если они не могут запомнить, что я уже пользуюсь их тем или иным говносервисом?
Kwisatz
21.12.2019 14:29+2Даже внутри сервиса не могут. Так смешно закрывать окно с предложением «попробовать» подписку на кинопоиск, внутри самого кинопоиска, с активированной подпиской.
Dabbuger
21.12.2019 20:51+1ладно что купил, действительно яндекс может не знать об этом. НО САМОЕ ПОРАЗИТЕЛЬНОЕ, что реклама мне предлагается ровно в том же магазине в котором я смотрел сам и ровно те же модели машинок и вертолётиков и пр., которые я там разглядывал. Не какой-то другой магазин с аналогичным товаром, или хотя бы похожим.(что было бы логичным) а именно всё тоже самое что я и без этой рекламы сам нашёл на сайте. Посмотрел в Юлмарте товар, он мне рекламу на этот же юлмарт этот же товар и долбит в каждом окошке. Неужели так сложно понять, что это не эффективный алгоритм?
Kwisatz
21.12.2019 14:28+1Ну рекомендации не работали вообще никогда, за очень очень редкими исключениями. Мне прям любопытно, те кто их пишут, действительно не понимаю, что хрень делают?
Печально, что сейчас поисковики в ту же степь полезли. Мне яндекс нравился куда больше, когда честно сознавался, что ничего не нашел. После последнего обновления им пользоваться вообще нереально. Причем он упорно поет «все хороно, прекрасная маркиза»: вчера искал очень специфическую информацию по PostgreSQL в специфичных терминах. Сразу приготовился к проблемам. В итоге минут за 30 поисков нашел 1.5 результата, перерыв дурное количество страниц, как эти страницы попадают в выдачу, когда там ни поисковых слов, ни похожего смысла, вообще ничерта нету общего с запросом, мне непонятно.
В гугле в итоге за 5 минут нашел вообще все интересующие меня статьи и разобрался по каким темам искать бесполезно. А когда гугл такой же фигней займется как и яндекс, то куда бежать? В технической сфере итак уже стало хуже. Лет 6 назад при работы с Java и задачами по поиску нечетких дубликатов я моментально находил релевантные статьи (0,5-2,5 шт), доки (1-2 шт) либо ничего. Сейчас по сходным запросами: вагон soe-оптимизированных сайтов, с гайдами на 3 строки (еще и в пересказе друг друга своими словами), всевозможные переводов so (которые частенько выше оригинала) и, если повезет, нечто, нужное нам.
Ощущение… неприятное
PastorGL
20.12.2019 18:22Как разработчик геоинформационной системы, аналитика которой целиком строится на собранных треках пользователей, попрошу отставить панику и прекратить истерику.
Нам нафиг не интересны перемещения отдельно взятого userid. И вообще, датасеты, содержащие меньше 50000 разных пользователей. Потому что они не дают никакой внятной статистики.
Большие данные позволяют оценивать поведенческие изменения в популяциях статистическими методами, а каждый отдельно взятый юзер — он как пчела, летает по карте хаотическим образом, и из его метаний нельзя извлечь никаких данных, за которые рекламщики готовы нам заплатить.
Так что данная статья походит на мультик, в котором «нас сосчитали!» Да, мы вас сосчитали (и себя в том числе). Только всех разом, а не каждого по отдельности.vtolstov
20.12.2019 18:31+3Вы не правы. Паника идет от того, что становится понятно, что в любой момент времени за тобой при желании могут следить тысячи неизвестных людей и организаций. И никто не знает когда и почему он вдруг кому-то станет интересен. Вычленить из большого дата сета бизнесмена, который посещает одни и те же места периодически, а потом сделать какую-то гадость или шантаж ему или его близким не составляет труда.
yea
20.12.2019 18:33Дело в том, что ничто не ново под луной, и слежка тоже. Бизнесменов «вычленяли», выслеживали и шантажировали ещё задолго до этой вашей биг даты, просто сейчас это другой облик приняло.
UPD: я даже соврал, не «приняло», а «может принимать». Старые методы никто не отменял.
PastorGL
20.12.2019 18:38Вы, очевидно, не владеете темой, и даже не представляете, насколько дорого отыскать нужный userid в коммерческом датасете какого-нибудь Tamoco или SafeGraph. Их там сотни миллионов. И это очень грязные данные, из которых извлечь знания ещё надо постараться.
Традиционные доцифровые методы типа скрытной слежки в разы дешевле, быстрее, и надёжнее.vtolstov
20.12.2019 18:41+1я уверен что есть набор автоматики который это сделает достаточно быстро, а дальше в полу ручном режиме останется откинуть лишнее
PastorGL
20.12.2019 19:03Я пишу такую автоматику на Spark и запускаю её в AWS. Я в точности знаю, сколько это стоит, и сколько на это надо времени. И вообще, существует ли она (нет, потому что мне приходится писать её с нуля).
Вы сейчас пытаетесь мне доказать, что моя работа — это вот так раз плюнуть? Ну-ну.vtolstov
20.12.2019 19:40+2Глупо считать, что раз вы пишите с нуля, то этого не существует.
PastorGL
20.12.2019 21:35Если бы существовало, я бы с радостью использовал готовые инструменты. Уж поверьте, мне довольно далеко до идиота.
Но эвристик, вычленяющих нужного пользака из сырого датасета, не существует. Даже те готовые наработки, которые собирают некоторую популяцию пользователей, настолько несовершенны, что нормальные алгоритмы для выбора по набору критериев приходится реализовывать самим по различным white papers.
Если интересно, я могу написать об этом целую серию статей здесь. И, наверное, после нового года таки напишу.vtolstov
20.12.2019 22:14+1Вот я думаю проблема что в открытом и коммерческом варианте это не предлагается. Но то, что оно есть я уверен. Просто используется для себя. Обычно в открытый доступ идёт то, что уже не представляет большой коммерческой выгоды для себя. А на продажу идёт та версия, что уступает по характеристикам внутренней. Может это моя паранойя, но я в этом уверен. Да и в целом я бы и сам так делал.
dravor
21.12.2019 11:01Это ошибочное мнение. Я бы прислушашся к тому, что говорит человек, работающий в теме.
AllexIn
21.12.2019 13:41Который говорит что работает в теме. И который утверждает что является специалистом.
ffs
21.12.2019 16:06+1Ребята не стоит вскрывать эту тему. Вы молодые, шутливые, вам все легко. Это не то. Это не Чикатило и даже не архивы спецслужб. Сюда лучше не лезть. Серьезно, любой из вас будет жалеть. Лучше закройте тему и забудьте что тут писалось. Я вполне понимаю что данным сообщением вызову дополнительный интерес, но хочу сразу предостеречь пытливых — стоп. Остальные просто не найдут.
Iamkaant
21.12.2019 11:29+3Так в статье же прямым текстом написано как это сделать, зная место работы и адрес проживания человека.
PastorGL
22.12.2019 13:04Так это и не нужно делать, если вы заранее знаете своего пациента. Он уже найден. Просто проследите за ним от двери дома или офиса.
Задача для нас может звучать так: найти всех пользователей, которые представляют определённый интерес. Например, любят кушать филе миньон по четвергам, и курят сигареты некоторой марки. После чего определить, какой кинотеатр у них самый любимый.
Вот это — то, за что нам платят.Iamkaant
23.12.2019 10:50Ну, это нужно за ним везде ездить несколько дней, т.е. нужна техника и опытные люди, которые все сделают так, чтобы не вызвать у клиента подозрений. А с отслеживанием местоположения все намного проще, записать треки и за полчаса просмотреть.
keydon2
21.12.2019 15:30+1Не знаю что вы у себя считаете, но отфильтровать CSV с координатами близкими к месту работы и месту дома это раз плюнуть. Гигабайты посчитаются за минуты, терабайты скорее всего уложатся в несколько часов на типичном рабочем ноутбуке с awk. Параллелится хорошо — можно смело делить время на количество нод в кластере.
vtolstov
21.12.2019 16:22csv это же для выгрузки, по факту пихается это все в явно другую аналитическую систему.
PastorGL
22.12.2019 13:34Посчитать не проблема, доказать — проблема.
Вот вы говорите «близкими координатами». А что значит «близкими»?
Я в качестве подопытного использовал себя, конечно. Так на моём устройстве систематическая ошибка определения координат сносит меня куда-то в полквартала от адреса, где я живу. Уже с полтысячи человек проверять. А на месте работы GPS вообще не ловит, и координаты определяются по cell id и вайфай сетям с точностью в 150 метров в самом лучшем случае. И крупный транспортный узел близко, в котором 90% из этих полутысячи соседей тоже есть, причём многие наследили куда больше меня. Но себя я нашёл, конечно, но только потому что я знаю, где и когда я ещё был.
Кроме отвратительной точности коммерческих датасетов есть ещё куча всяких факторов, из-за которых массовая статистика работает, а одиночный userid пришлось бы подтверждать по другим каналам.
jahr
22.12.2019 16:51Вы выше пишете, что конкретный userid никому не нужен, а теперь добавляете, что пишете автоматику для его выделения.) И какому из этих утверждений нужно верить?)
fogx
21.12.2019 17:56Я не владею темой и не понимаю, в чём проблема среди «сотен миллионов» отыскать userid нужного бизнесмена, просто введя координаты его дома?
zerg59
21.12.2019 08:59+1Из другой статьи на хабре: Билайн. Определение местоположения абонентов в реальном времени – от 3000 до 4000 рублей за одно определение.
МТС. Определение местоположения абонентов в реальном времени – от 10000 рублей за одно определение.
Andriy1218
20.12.2019 18:29Вот интересное выступление на Теде еще с 2015 года. Там наводиться пару интересных моментов анализа местоположения по сотовой связи.
TED | Зачем правительству следить за нами, если мы никто?
tvr
Это временно.
Хотя, постойте…
Мы же можем обвести скопление
юнитовпользователей мышкой на карте, и отправить им мессагу вида «Бегите,глупцы, с юга приближается радиоактивное облако!скорее, — в МакДаке на Пушке раздача бесплатных слонов!».Или ещё не можем?
arandomic
Скорее как в стратегиях с непрямым контролем — можем ткнуть в точку на карте и сказать, «всем в радиусе N от этой точки» — отправить мессагу…
reinvent
Этот давно реализовано в Google ads и Яндекс Директ. Только отправляется реклама.
prolis
Что-то уже тестируют
От: MCHS
Vsevo10d
Это уже отработано при помощи редких покемонов.
Victor_koly
Где-то упоминалась функция «Послать SMS всем телефонам вокруг», но сейчас работающей ссылки не нашел.
bougakov
target.megafon.ru
vikarti
А как вы думали зачем Ingress и Pokemon Go придуманы -:)?
upviqq
А ингресс за что? Там только отдельные мероприятия проходят в крупных городах, повседневной игрой управлять не получится.