![](https://habrastorage.org/getpro/habr/upload_files/1c8/2e6/09a/1c82e609a6d15ec538549d86576bd31a.jpg)
Привет Хабр. Сегодня мы поговорим о том, какую информацию можно получить с веб-ресурса для последующего использования в OSINT. Какие сервисы для этого есть и какую конкретно информацию они для нас нароют. Данная информация и методики будут также полезны и простым смертным людям, которые не связаны с IT сферой, так как помогут определить «на глазок» благонадежность того или иного сайта, прежде чем вводить на нем данные своей банковской карты…
DISCLAIMER: Данная статья написана в ознакомительных целях и не является руководством к неправомерным действиям или обучающим материалом для сокрытия правонарушений.
Исследование веб-сайтов в рамках OSINT может предназначаться для решения целого ряда задач:
идентификации владельцев или администраторов;
мониторинга изменения цен;
анализ конкурента;
SEO или используемые ключевики и др.
Анализ любого веб-сайта начинается с получения регистрационных данных WHOIS.
![](https://habrastorage.org/getpro/habr/upload_files/589/f85/248/589f85248be62d7f47057becb2847814.png)
WHOIS-сервисов очень много. Поэтому приведу лишь несколько популярных:
Как вы можете видеть, WHOIS содержит данные о сроках регистрации домена, его IP-адреса, владельце, регистраторе и их контактах.
![](https://habrastorage.org/getpro/habr/upload_files/65e/166/31a/65e16631a3e1043ebacdb712ac19c17b.png)
Разумеется если, интернет-магазин обещает вам сказочно низкие цены и вообще «МЫ УЖЕ 10 ЛЕТ НА РЫНКЕ!», но его домен зарегистрирован 2-3 дня назад, то следует задуматься о том, а не лохотрон ли тут часом…
Однако, о грустном... После введения норм GDPR про открытую публикацию персональных данных владельцев доменных имен пришлось забыть. А для поиска по старым записям WHOIS, в которых персональные данные были сохранены, могу порекомендовать еще пару полезных ресурсов:
![](https://habrastorage.org/getpro/habr/upload_files/574/4da/a85/5744daa852a6eb345465b857176609d9.png)
Продолжаем о грустном. Как известно, есть такая компания - Cloudflare, которая позволяет дополнительно при использовании ее услуг - скрывать данные о владельцах вебсайтов.
Так вот, ее анонимность иногда можно приоткрывать. Для этого я использую такой опенсорсный продукт, как CrimeFlare: https://github.com/zidansec/CloudPeler.
![](https://habrastorage.org/getpro/habr/upload_files/cf8/d9d/88e/cf8d9d88e1e1fbf77f28cf1a706bde2c.png)
Он существует и в веб-интерфейсе по ссылке: https://crimeflare.herokuapp.com. CrimeFlare позволяет делать немногое, но важное - получать реальный IP-адрес сайта, скрытого за Cloudflare.
Еще пара ресурсов, на которых могут попадаться утёкшие пароли от различных онлайн-сервисов. В числе последних может оказаться и исследуемый вами сайт:
Как мы все знаем, сайт — это не только доменное имя. Сайт должен быть где-то физически расположен. Место его расположения — это хостинг.
![](https://habrastorage.org/getpro/habr/upload_files/26a/ad2/bd3/26aad2bd39106111ba76d5e06489d3d4.png)
Данные хостинга того или иного сайта также можно узнать в открытых источниках:
Перейдем к контенту, размещаемому на сайте, и обратимся к анализу различных метрик (рекламных идентификаторов).
![](https://habrastorage.org/getpro/habr/upload_files/179/ba0/776/179ba077638849cc145e05d2cdef4599.png)
Следующая подборка сервисов позволит вам понять, какие технологии рекламной слежки (и не только) присутствуют на сайте:
Впрочем, вы можете открыть исходный код веб-страницы, а дальше поискать рекламные идентификаторы в ручном режиме по следующим ключевым словам:
AdSense: Pub- или ca-pub
Analytics: UA-
Amazon: &tag=
AddThis: #pubid / pubid
Metrika: mc.yandex / ym
Rambler: top100
Mail.ru: Top.Mail.Ru
Если мы нашли код одной из метрик, то мы можем открыть ее публичную статистику. Для этого введите ID метрики в одну из следующих гиперссылок:
https://metrika.yandex.ru/dashboard?id=ВВЕДИТЕ_ID
https://top100.rambler.ru/search?query=ВВЕДИТЕ_ID
https://top.mail.ru/visits?id=ВВЕДИТЕ_ID
Публичная метрика интересна тем, что первым посетителем сайта она засветит того администратора, который ставил ее на веб-ресурс. Это может быть владелец сайта. Тогда мы получим сведения о его поле, возрасте и городе проживания. Вы можете проверить это на следующей метрике Яндекса https://metrika.yandex.ru/dashboard?id=55694881.
![](https://habrastorage.org/getpro/habr/upload_files/e31/04a/1ce/e3104a1ce9f3c8fc5cb5b545b45cf164.png)
Кроме этого, коды метрик или рекламных идентификаторов позволяет находить в сети дополнительные сайты, использующие ее в своем коде. Для этого можно воспользоваться следующими сервисами:
Реверсивный поиск дополнительных (аффилированных с проверяемым) веб-ресурсов возможен не только по рекламным идентификаторам.
Вы можете использовать реверсивный поиск по IP-адресу размещения вебсайта, при помощи ресурсов:
![](https://habrastorage.org/getpro/habr/upload_files/fba/a9b/14d/fbaa9b14d8cbdb033cd63bcdfb21f394.png)
Вы также можете осуществлять реверсивный поиск по совпадению связанных адресов электронной почты:
![](https://habrastorage.org/getpro/habr/upload_files/b77/fe7/937/b77fe79379fe39147049a245c36af8ab.png)
А еще реверсивному поиску можно подвергать SSL-сертификат сайта:
![](https://habrastorage.org/getpro/habr/upload_files/eb4/2bd/405/eb42bd405ac55d1f66918a1bfc8260d2.png)
Переходим к сбору контактов. Часть контактной информации владельца веб-ресурса выкладывают на сайте или при регистрации доменного имени. Попробуем найти максимальное число контактов (адресов электронной почты) при помощи таких сервисов, как:
![](https://habrastorage.org/getpro/habr/upload_files/d12/a5d/64f/d12a5d64f5cf81dfe9e1437a933e2f36.png)
Плавно переходим к анализу DNS.
DNS (Domain Name System) используется для получения IP-адреса по имени хоста, получения информации о маршрутизации почты и/или обслуживающих узлах для протоколов в домене. Эти данные также будут нам полезны при изучении вебсайта:
![](https://habrastorage.org/getpro/habr/upload_files/dc6/47e/42e/dc647e42ed8a0c5e1e91ca5fa8513c85.png)
Исторические данные DNS можно посмотреть по ссылке:
Старые копии веб-страниц и сайтов (веб архивы) тоже пригодятся в расследовании. Мало ли, что писали на сайте пару лет назад. Ссылки на популярные веб архивы ниже:
![](https://habrastorage.org/getpro/habr/upload_files/1c9/093/f3b/1c9093f3b9e3852ef890fc5b3d402d50.png)
Полезные подборки дополнительных сервисов для изучения вебсайтов можно найти тут:
А также, в качестве сладкого, комплексные сервисы для проведения расследований по веб-ресурсам. Начнем с модульного сервиса Spiderfoot, который позволяет делать 3 проверки в месяц совершенно бесплатно.
![](https://habrastorage.org/getpro/habr/upload_files/c0e/7b3/e39/c0e7b3e39721a1632beaf8840d31c228.png)
Ну и Maltego с его бесплатными модулями и кучей халявных API не стоит забывать. Вполне себе крутой инструмент для расследователя.
Напоследок расскажу об изучении сайта с позиции маркетолога. Тут нас будет интересовать CMS сайта, который можно узнать на ресурсах:
Без сомнения, нас заинтересует статистика трафика сайта, его ключевики и прочие рекламные фишки. Их можно почерпнуть на сервисах:
![](https://habrastorage.org/getpro/habr/upload_files/3ca/ad1/876/3caad1876707c6bd9e147afef916ec19.png)
Ну вот и все на сегодня. Надеюсь, подборка была для Вас полезной. Подписывайтесь, чтобы не пропустить новые статьи. До новых встреч.
ommunist
Полезный набор, спасибо. Не знал что историю DNS можно бесплатно поднять.