Это история о том, как я случайно обнаружил масштабную аферу с поисковой оптимизацией.

Резюме


Некоторые высокорейтинговые онлайн-инструменты для редактирования или «очистки» HTML, похоже, тайно вставляют ссылки в свои выходные данные, чтобы протолкнуть себя и связанные с ними сайты в рейтинге поисковых систем. Эта афера очень успешна и, похоже, до сих пор оставалась незамеченной.

Инструменты, которые, кажется, делают это, созданы одними и теми же людьми:

  • html-cleaner.com
  • html-online.com/editor/
  • html5-editor.net
  • htmlg.com
  • … и другие

Жертвами этого стали сайты BoingBoing, официальная футбольная ассоциация Германии и Kaspersky. Забавно, что «хакнутая» статья Касперского посвящена «защите от хакеров».

Обнаружение подозрительного


Итак, вот подробный отчет о том, как я сделал это открытие, вместе с доказательствами, которые я обнаружил.

Все началось с загадки продукта, который я создаю. Продукт представляет собой онлайн-табло, и, несмотря на наличие (что я думаю) надежной стратегии SEO, мне не удалось завоевать желанное первое место на странице результатов поисковой системы. Последние 12 месяцев меня всегда опережал участник под названием «Scorecounter».

image

Теперь, в связи с особенностями моего продукта, люди делятся ссылками на него и встраивают его на свои веб-сайты, а это означает, что со временем я накапливаю много входящих ссылок. Со временем мой рейтинг SEO станет непревзойденным. У конкурента нет такой заметной виральности, как у меня, но он у меня всегда лучше, чем у SEO. Какой трюк они используют?

Итак, вчера вечером я выпил 2 стакана красного вина и вместо того, чтобы удалять производственную базу данных (как в прошлый раз), я решил разобраться в ней. Я заплатил за подписку Ahrefs и взглянул на «профиль обратных ссылок» Scorecounter. Вот что я нашел:

image

Scorecounter имеет 3600 входящих ссылок, которые он накопил за очень короткое время. Впечатляющие!

Затем я начал просматривать страницы, содержащие ссылки, и именно здесь у меня возникли подозрения.

Например, я видел сообщение в блоге Немецкой футбольной ассоциации, содержащее ссылку на Scorecounter. Слово, на которое была сделана ссылка, было «оценка» (score), но наличие ссылки здесь не имело абсолютно никакого смысла в контексте статьи. Что происходило?

Вот еще несколько примеров ссылок, которые я нашел на случайных доменах (вам нужно искать на странице «оценка»).


Таких страниц там просто куча (посмотрите сами, если у вас есть учетная запись Ahrefs).

Поэтому я написал несколько электронных писем на 1-2 из этих сайтов и спросил их, почему на их страницах есть эти ссылки. Все ли эти сайты продавали ссылки?

Я получил следующий ответ от новостного онлайн-портала:

Спасибо, что обратились к нам. Нет, мы не продаем ссылки ни за какие деньги.

На самом деле я использовал очиститель HTML (html-online.com/editor/) с прошлого года, который в первые месяцы работал нормально, как и предполагалось, но несколько недель назад я понял, что инструмент внезапно начал тайно вводить ссылки в содержание HTML документа.

Для нескольких публикаций я не смог обнаружить подобное, но когда я узнал об этом, все сообщения, которые я мог вспомнить, были очищены вручную. Оказывается, к сожалению, некоторые из них, как вы отметили, все еще там. Я сегодня просто найду-и-заменю эту ссылку из всей базы данных для большей безопасности.

Бинго


Ага! Вот в чем был секрет: создатели Scorecounter также сделали онлайн-редактор HTML, который вставляет ссылки по определенным ключевым словам. Прелесть этой аферы в том, что, внедрив ссылки в свой собственный редактор HTML, они создали замечательный цикл положительной обратной связи: чем выше он поднимается в рейтинге поиска, тем больше людей используют его и тем больше секретных ссылок они могут ввести.

Теперь, если вы чувствуете себя очень великодушным, вы можете возразить, что редактор — это инструмент freemium, а добавленные ссылки — это то, как вы платите за бесплатную версию. Что ж, я не чувствую себя великодушным, подозреваю, что и Google тоже.

Помимо улучшения самого HTML-редактора и Scorecounter, я нашел третий продукт, который пользовался всеобщим вниманием:

Кубик Рубика


Ruwix.com создан теми же людьми и посвящен знаменитой головоломке. Опять же, очень легко найти большое количество обратных ссылок на Ruwix.com на случайных сайтах с помощью Ahrefs.com. Каждая из этих статей представляет собой несоответствие в тексте, в который они втиснуты, что показывает мне, что авторы этих статей понятия не имели, что происходит. Взгляните (на странице нужно искать «Rubiks»):


UPD: Касперский удалил ссылку, но у меня есть скриншот:
image

Чтобы узнать, насколько распространена эта инъекция, попробуйте поискать в Google: «Learn how to solve a Rubix Cube with the beginner method». Более 600 посещений на самых разных сайтах. Удивительно, но ссылка даже пробралась в исследовательскую статью (она находится на странице 24, внизу раздела «Ссылки»)!

Целая сеть инструментов


Покопавшись в обратных ссылках, я обнаружил, что существует целая сеть инструментов, которые являются частью одной операции. У всех одинаковые профили обратных ссылок. Они включают:

  • htmltidy.net
  • html-css-js.com
  • divtable.com
  • html-cleaner.com
  • html5-editor.net
  • htmlg.com

Выполнение поиска в Google по запросу «HTML Editor» показывает, что эти инструменты занимают три верхних позиции в результатах поиска. Это демонстрирует, насколько успешной была эта афера.

Внедрение ссылок упоминается в «Условиях Использования» этих инструментов


Это правда, что «условия использования» по крайней мере одного инструмента содержат следующее:

Мы показываем рекламу и можем случайным образом разместить ссылку на конец очищенных документов.

Я искренне сомневаюсь, что этого отказа от ответственности достаточно, чтобы предотвратить кару от Google. Скоро мы это выясним.