ХостТрекер предлагает вниманию веб-мастеров функцию автоматического мониторинга контента веб-сайтов. Она позволяет отслеживать наличие или отсутствие на проверяемых страницах определенных ключевых слов.




Зачем это нужно?


Допустим, вы приобрели для сайта серию из 50 статей, каждая из которых должна содержать фразы «выбор хостинг провайдера», «надежный хостинг», «проверка надежности хостинга». Проверять наличие этих фраз во всех текстах вручную — не очень радужная перспектива. Но у вас же есть URL-ы всех страниц — значит, задача существенно облегчается. Сервис позволяет добавлять адреса нужных страниц списком, а функция проверки контента поможет быстро найти халтуру. Для этого просто укажите в специальном поле все ключевые слова и выставьте необходимый интервал времени проверки (минимальный 1 минута). Для этого конкретного случая интервал не важен, так как нужно проверить лишь единожды. Если система не обнаружит на какой-либо странице ключевые фразы, она оповестит вас об этом письмом на электронную почту на указанный адрес.

Но в регулярных проверках тоже есть смысл. Рассмотрим другую ситуацию: у вас продвинутый сайт, с блэкджеком и базами данных. Когда пользователь заходит на какую-то страничку — специальный скрипт подгружает на нее информацию из базы данных. Лучшие маркетологи разработали для ваших клиентов специальное предложение, которое принесет вашим клиентам много добра, а вам — денег. И это предложение содержится по ссылке «горячее предложение». Но весь маркетинг разбивается о технические проблемы — вы заметили, что иногда данные не отображаются на странице. Мониторинг контента позволит с определенной периодичностью контролировать наличие на странице ключевого слова и оповещать вас, если оно вдруг исчезло. Это может помочь найти слабые места системы — например, может оказаться, что база недоступна во время бэкапа.
Иногда полезно отслеживать не только присутствие, но и отсутствие на сайте определенных слов. Бывает, что кто-то чуть недоглядел — и уже на вашем сайте вредоносный скрипт публикует контекстную рекламу без вашего согласия. Код вируса вы нашли. Он содержит, например, слово «iframe». Вы заменили зараженный файл старым из бэкапа, но через некоторое время через раздолбайство хостинга вирусный код появляется снова. Конечно, проблему нужно решать кардинально — но для начала можно хотя бы ее стабильно «ловить». Задайте на сервисе путь к проблемному файлу, в качестве ключевого слова укажите «iframe». В настройках отметьте, что ключевик должен отсутствовать. Как только слово появится в указанном файле — вы будете оповещены: можно начинать новый скандал с хостингом.

Настройка проверки


Занимает менее минуты. На домашней странице Host-Tracker (после регистрации) нажмите на клавишу «Добавить». Из раскрывающегося списка выберите пункт «Проверить контент».
В форме создания задания укажите адрес страницы, которую необходимо проверять (можно задать много страниц списком). Ключевые слова вводятся в соответствующее поле. Как уже упоминалось, можно выбрать проверку как на присутствие, так и на отсутствие определенных слов. По необходимости выбираем некоторые дополнительные настройки. И вуаля!


Как только система обнаружит отсутствие (или присутствие) ключевых фраз на сайте, она пришлет вам такое сообщение. При этом, есть возможность получать уведомления по емейлу, СМС, Skype, Hangouts.


Теперь можете заняться своим делом. Контроль за работой ваших сайтов мы возьмем на себя.
Всегда рады вашим отзывам и предложениям.

Комментарии (5)


  1. Valdei
    24.06.2015 16:01

    Что с морфологией ключевых слов/фраз, есть нормализация или нужно указывать все варианты?

    Учитывается ли содержимое iframe'ов или подгружаемое через js/json?

    Есть ли возможность прикрутить проверку по каким-то внешним спискам (отслеживание нецензурной лексики по словарям, например)?

    Реализована ли как-то история проверок?


    1. smiHT Автор
      24.06.2015 19:37

      Нужно указывать все варианты слов, которые желаете найти. js при наших проверках не отрабатывает, iframe-ы не подгружают другие страницы. Подключать внешние списки возможности нет. Вся история сохраняется в виде логов, доступных с интерфейса. Если были ошибки (отсутствие/присутствие ключевого слова — тоже ошибка, если выбрана эта опция) — в логе их легко можно найти и посмотреть их причину.
      Если есть желание использовать сервис для каких-то интересных задач — напишите в поддержку ваши требования. Многие полезные функции появлялись именно по запросу клиентов.


      1. Valdei
        25.06.2015 01:46

        Сервис может быть весьма полезным, но допиливать придётся много.
        Если у вас есть спец по контекстной рекламе (а лучше — SEO-спец), отловите его и покажите эту штуку. Если не начнёт бурно радоваться и сыпать идеями, то у него, наверно, очень спокойная работа, где ничего внезапно не меняется и не пропадает…

        Описанное вами отслеживание статей потребует как минимум отслеживания корректности/количества ссылок в них, а не только ключевых слов.
        А также проверки наличия целого текста или куска html-кода.

        Отслеживание изменений своих/клиентских сайтов — также проверка наличия самой страницы, кусков кода на ней, заголовков и метатегов, текстов и ссылок.
        И нормально реализованного экспорта истории проверок в понятном виде.


      1. Sayonji
        25.06.2015 01:47

        wget | grep?


        1. bhavenger
          25.06.2015 09:19
          -1

          Любой спец накидает скрипт для подобного на коленке за 5-10 минут. А это сервис с GUI для тех, кто не обладает подобной экспертизой.