Единственный мем который пришел в голову
Единственный мем который пришел в голову

Я был в восторге, когда узнал об утечке проприетарного исходного кода Яндекса. И после анализа данных я должен сказать, что выводы оказались весьма интересными! Итак, без лишних слов, давайте окунемся в основные выводы, которые я сделал.

(Upd.) В самой утечке было около 40 Гб, н​о я изучал только файл в котором описаны  все 1992 фактора ранжирования. Кому интересно название файла - factors_gen.txt

#1 Возраст ссылок имеет значение

Одним из открытий стало то, что возраст ссылок является фактором ранжирования. Это означает, что старые ссылки считаются алгоритмом Яндекса более надежными и авторитетными. Поэтому важно построить ссылочный профиль, в котором будут присутствовать как старые, так и новые ссылки.

#2 Платный трафик и органический трафик влияют на ранжирование

Еще одним ключевым моментом стало то, что трафик и процент органического трафика являются факторами ранжирования. Это означает, что если вы платите за PPC, это может потенциально повлиять на рейтинг в поисковиках. Поэтому очень важно отслеживать объем платного трафика вашего сайта и стараться максимизировать органический трафик.

#3 Цифры в URL-адресах могут быть вредными

Я был удивлен, когда узнал, что наличие цифр в URL-адресах может негативно сказаться на рейтинге. Это следует иметь в виду при создании URL-адресов для ваших страниц.

#4 Слишком большое количество слешей в URL может повредить рейтингу

Слишком большое количество слешей в URL-адресах также может негативно сказаться на рейтинге. Поэтому очень важно, чтобы ваши URL были чистыми и лаконичными.

#5 Жесткая оптимизация равна PR=0

Если вы пытаетесь "обмануть" систему чрезмерной оптимизацией, Яндекс поймет это. Утечка исходного кода показывает, что жесткая оптимизация может привести к PR (рангу страницы) 0. Поэтому важно использовать более целостный подход к SEO и сосредоточиться на создании качественного контента и построении сильного ссылочного профиля.

#6 Ошибки хостинга могут навредить

Надежность вашего хостинга также является фактором ранжирования. Чем меньше у вас ошибок 40x/50x, тем лучше для вашего органического трафика. Поэтому очень важно выбрать надежного хостинг-провайдера и следить за производительностью своего сайта.

#7 Отдельный фактор ранжирования для Википедии

Интересно, что существует отдельный фактор ранжирования для поднятия Википедии. Это показывает важность присутствия ссылок на авторитетных сайтах, таких как Википедия.

#8 Поведенческие факторы имеют огромное значение

Многие факторы ранжирования связаны с поведением пользователей, такие как высокий CTR, last-click, время на сайте и показатель отказов. И согласно моему анализу, эти факторы оказывают гораздо большее влияние на ранжирование в Яндексе, чем в Google. Поэтому важно следить за поведением пользователей на вашем сайте и при необходимости вносить улучшения.

#9 Возраст документа и последнее обновление

Возраст вашего документа и время его последнего обновления также являются факторами ранжирования. Это означает, что поддержание свежести и актуальности вашего контента имеет решающее значение для поддержания хороших позиций в рейтинге.

#10 Средняя позиция домена по всем запросам имеет значение

Средняя позиция домена по всем запросам является фактором ранжирования. Это означает, что поддержание хороших позиций по целевым ключевым словам важно для общего успеха.

#11 Глубина сканирования

Если вы хотите, чтобы ваши важные страницы хорошо ранжировались, убедитесь, что они находятся всего в одном или нескольких кликах от главной страницы. Чем ближе, тем лучше.

#12 Страницы-сироты

Не забывайте о страницах-сиротах - они не связаны ни с какими другими страницами вашего сайта. Используйте такой инструмент, как Screaming Frog, чтобы выявить их и включить их в структуру сайта.

#13 Обратные ссылки

Обратные ссылки с главной страницы сайта более ценны, чем ссылки с внутренних страниц. Это простая логика - главная страница обычно является самой авторитетной и надежной на сайте.

#14 Количество поисковых запросов

Чем больше поисковых запросов получает ваш сайт или URL, тем выше он будет ранжироваться. Все просто - больше трафика = выше рейтинг.

#15 Трафик из Википедии

Трафик, поступающий из Википедии, также может повлиять на рейтинг. Поэтому убедитесь, что у вас есть сильное присутствие на этой популярной платформе.

#16 Последний URL-адрес поисковой сессии

Если пользователь находит на вашем сайте то, что ищет, это может положительно сказаться на ранжировании. Например если пользователь искал “купить пластиковые окна в Москве” и после вашего сайта не вернулся в поиск = повышение позиций.

#17 Закладки

Поощряйте пользователей делать закладки на ваш сайт - чем больше закладок получит ваш URL, тем выше будет значение фактора ранжирования.

#18 Короткие видеоролики

Существуют специальные факторы ранжирования для платформ коротких видео, таких как TikTok, Shorts и Reels. Убедитесь, что у вас есть активное участие на этих платформах.

#19 Карты JS-API

Интеграция API карты, например, Google Maps, в вашу страницу является фактором ранжирования. В таких нишах, как путешествия, наличие полезной и функциональной карты может поднять позиции в поисковиках.

#20 Ключевые слова в URL

Включение ключевых слов в URL является еще одним фактором ранжирования. Оптимальным считается включение до трех слов из поискового запроса.

#21 Возвращение пользователей

Хорошая новость для разработчиков продуктов - удержание пользователей является фактором ранжирования. Чем больше пользователей возвращаются на ваш сайт, тем лучше это скажется на вашем SEO. У Яндекса есть несколько факторов ранжирования для измерения показателя, поэтому если на ваш сайт возвращаются = сайт поднимется в ПС

#22 Заглавные буквы в Title

Когда в последний раз вы видели полностью заглавный заголовок сайта в верхней части Google? Не часто, верно? Оказывается, процент заглавных букв в теге является фактором ранжирования. Поэтому для лучшего ранжирования сохраняйте заголовки в нижнем регистре.

#23 Прямой трафик

Сочетание прямого и органического трафика полезно для ранжирования. Если весь ваш трафик поступает из органического поиска, это подозрительно и может негативно повлиять на ваше ранжирование. Помните, что процент прямого трафика также является фактором ранжирования.

#24 Сломанные встроенные видео

Качество контента всегда является ключевым фактором ранжирования, и на этот раз речь идет о встроенных видео на вашем сайте. Внедрение видео - это хорошая практика для SEO, но если видео не работает, это может повредить вашим позициям в рейтинге. Поэтому убедитесь, что все ваши встроенные видео работают и актуальны.

#25 Верифицированные аккаунты в социальных сетях

Поиск по бренду имеет важное значение для SEO, и наличие в топ-10 только ваших доменов и верифицированных социальных сетей - идеальный вариант. У Яндекса есть фактор ранжирования по верифицированным аккаунтам в социальных сетях, поэтому убедитесь, что они у вас заведены для получения лучших позиций.

#26 Анкоры в обратных ссылках

Ключевые слова в анкорах обратных ссылок являются фактором ранжирования. Если слова в анкорах совпадают с ключевыми словами, это еще лучше. А если они находятся в одной ссылке, это еще более выгодно, особенно если порядок слов одинаковый.

#27 Соотношение хороших и плохих обратных ссылок

Соотношение «хороших» и «плохих» обратных ссылок является фактором ранжирования, хотя до сих пор нет четких критериев, что такое «хорошая» обратная ссылка. По опыту могу предположить, что обратные ссылки с высококачественных сайтов соответствующих вашей тематике будут считаться «хорошими».

#28 Качество текстов на сайте

Качество текстов на сайте также является фактором ранжирования. Страницы с низкокачественным контентом будут влиять на весь домен, поэтому убедитесь, что весь ваш контент высокого качества.

#29 Количество рекламы на странице

Меньше - лучше, когда речь идет о рекламе на вашей странице, поскольку количество рекламы на странице является фактором ранжирования. Поэтому постарайтесь свести количество рекламы к минимуму, если она не от Яндекса. Если у вас на сайте реклама Яндекса, то это положительный фактор.

#30 Фактор случайности

Хотите верьте, хотите нет, но для случайности существует отдельный фактор ранжирования, хотя все и так давно знали об “одноруком бандите”. Иногда страницы оказываются на вершине просто для проверки поведенческих факторов, так что если вы ломаете голову над тем, почему определенная страница ранжируется, это может быть просто случайность.

#31 JS из Google Analytics

Неудивительно, что JS из Google Analytics является фактором ранжирования в Яндексе. В конце концов, "говносайты" реже используют GA, чем хорошие.

#32 Обратные ссылки с 100 лучших сайтов

Наконец, обратные ссылки со 100 лучших сайтов по PageRank также влияют на ранжирование. Это не совсем новость, но ее всегда полезно иметь в виду.

Выводы

Спасибо, Яндекс, за предоставленную нам информацию о твоих главных факторах ранжирования. Не то чтобы нам нужны были еще какие-либо дополнительные причины одержимости SEO, но мы их принимаем. Мы обязательно доведем наши URL до совершенства и будем избегать этих надоедливых слешей как чумы. Кому нужен сон, когда есть шанс занять более высокое место на Яндексе?

Но если серьезно, спасибо за смех. Мы ценим отдельный фактор ранжирования для поднятия рейтинга Википедии и фактор случайности для проверки поведенческих. И давайте не будем забывать о том, что качество наших текстов влияет на весь домен. Мы определенно будем внимательно следить за этим.

Итак, спасибо Яндексу за утечку этой сокровищницы информации. Теперь мы все можем продолжить бесконечную погоню за лучшими позициями в рейтинге.

Если вам понравилась эта статья и поставьте большой палец вверх!

Если тебе интересно SEO и исследования на эту тему - рекомендую мою статью на тему изучения SLI слов

Комментарии (122)


  1. sidristij
    30.01.2023 14:20
    +3

    А в какой группе файлов это?


    1. franky_d_zoro Автор
      30.01.2023 14:28

      файл factors_gen.txt


    1. vanxant
      31.01.2023 14:27

      В архиве search файл geo/tools/serp_tools/factors.txt

      Факторы там те ещё - кроме википедии есть афиша, варез и прочий ведроид с айосом.


  1. vilgeforce
    30.01.2023 14:33
    +73

    Загаживать Википедию ради продажи пластиковых окон? Ну спасибо...


    1. franky_d_zoro Автор
      30.01.2023 14:35
      +1

      Слушай, пластиковые окна это SEO-шутка, не более)


      1. WondeRu
        30.01.2023 20:05
        +12

        скорее, челендж)


    1. Didimus
      30.01.2023 20:15
      +6

      Это тайная реклама википедии, тик-тока и т.п.
      Кто-то из сеошников полезет проверять, что там в этом файле factors_gen?
      Завтра на всех баннерах у всех сеошников страны: продвижение в википедии, бесплатно и без СМС


      1. s-a-u-r-o-n
        30.01.2023 21:59
        +1

        В Википедии есть спам-лист для ссылок.


        1. Ole
          31.01.2023 11:48

          Он устарел. Некоторые домены мертвы, например

          \bgreatpioneer\.ru # раскрутка. по запросу на ВП:СЛ track13

          Домен свободен! Купите, пока этого не сделал кто-то другой.

          greatpioneer.ru


    1. aborouhin
      31.01.2023 15:05
      +3

      А вот любопытно, учитываются все языковые версии Википедии? Если да - то представляю SEOшников, обильно загаживающих Википедию на каком-нибудь экзотическом языке, где википедистов мало и почистить это толком некому...


      1. holodoz
        01.02.2023 10:43

        Много лет существовала "шотландская" вики с десятками тысяч статей, которую пилил один подросток, используя свою, выдуманную, версию языка. Так что направление перспективное


  1. shornikov
    30.01.2023 14:51
    +2

    самое интересное это лимиты по п.5. Они в утечке есть?


    1. franky_d_zoro Автор
      30.01.2023 15:59

      Ну я лимитов не нашел. Они я подозреваю в закрытой Вики для сотрудников описываются, на которую есть ссылка с самом файле с факторами.


  1. expdxx
    30.01.2023 16:30

    Так или иначе, большинство тезисов подтвердилось.

    А как Я.поиск качество текста оценивает не понятно? Было бы круто почитать.


    1. franky_d_zoro Автор
      30.01.2023 16:42
      +8

      Яндекс до сих пор использует старый добрый алгоритм Алгоритм BM25. Писать про него смысла нет, и так слишком много статей про не го уже есть


      1. franky_d_zoro Автор
        30.01.2023 17:50

        Та за шо минус то)


        1. glupiyyashik
          31.01.2023 09:36
          +1

          Качество текста и бм25.... Теплое с мягким


  1. webhamster
    30.01.2023 16:42
    +12

    Цифры в URL-адресах могут быть вредными

    Не повезло сайтам с уникальными числовым ID на статью. И чем больше статей тем хуже, так как порядок чисел больше. Тот же Хабар в зоне риска.

    Но вообще непонятно сколько цифр допустимо. На моем сайте Яндекс методично снижает рейтинг, обратно пропорционально Гуглу:

    https://webhamster.ru/site/page/index/main/news/683

    Я начинаю подозревать, что частично причина этого в том, что у меня на 90% страниц идентификаторы имеют вид 10 цифр (таймштамп) + 10 цифробукв, типа такого: 1538142860rj87grzkqq

    Не ожидал, что организация неповторяющихся URL через технически уникальную строку может отрицательно сказываться на ранжировании. Зачем это сделано?


    1. franky_d_zoro Автор
      30.01.2023 16:45
      +8

      Красиво ссылку вставил, не придраться)

      Слушай, я думаю это что-то из старого, когда они активно с дорвеями боролись. У них как раз URL'ы часто создавались по схеме [уникальный высокочастотный ключ] +[циферно-буквенное значение]


      1. webhamster
        30.01.2023 17:41
        +1

        Ну в моем случае это следствие формата баз данных MyTetra, которые сайт вытягивает с GitHub (ты меня напугал, я уже боюсь ссылки давать, поиск в помощь).

        Изначально такой формат ID разрабатывался исходя из того, что вероятность коллизии будет где-то e-15 в секунду, хотя в процессе разработки я думал делать уникальные ID-шники как адреса в Bitcoin, но все-таки решил что это будет перебор.


        1. franky_d_zoro Автор
          30.01.2023 17:45
          +5

          На самом деле использовать цифры в урле стандартная практика для интернет магазинов и маркетплейсов, очень часто они помещают некий буквенно-циферный код во имя уникализации этого самого url.



      1. Maccimo
        31.01.2023 00:17
        +1

        [уникальный высокочастотный ключ] +[циферно-буквенное значение]

        Medium с такими как-то живёт.
        Например: https://netflixtechblog.medium.com/introducing-jvmquake-ec944c60ba70


        1. franky_d_zoro Автор
          31.01.2023 06:45
          +7

          Не уверен что медиум хоть как-то ориентируется на Яндекс)


    1. Didimus
      30.01.2023 20:17
      +1

      Это сделано, чтобы продавать этот секрет "своим" сеошникам.


    1. Wesha
      30.01.2023 21:43
      +3

      Не повезло сайтам с уникальными числовым ID на статью

      Скоро в магазинах города: буквенные ID на статью (в 26-ричной системе счисления)!


      1. Fen1kz
        31.01.2023 09:43
        +4

        Держите :D

        mappedStart = 1040;
        getCode = (char) => char.charCodeAt();
        codeToMappedIndex = (code) => code >= 48 && code <= 57 ? code - 48 : code >= 97 && code <= 122 ? code - 87 : code;
        mappedIndexToChar = (index) => String.fromCharCode(index <= 35 ? mappedStart + index : index);
        codeToUnmappedIndex = (code) => code >= 1040 && code <= 1075 ? code - 1040 : code;
        unmappedIndexToChar = (index) => String.fromCharCode(index < 10 ? index + 48 : index <= 35 ? index + 87 : index);
        mapUUID = (uuid) => uuid.split('').map(getCode).map(codeToMappedIndex).map(mappedIndexToChar).join('');
        unmapUUID = (uuid) => uuid.split('').map(getCode).map(codeToUnmappedIndex).map(unmappedIndexToChar).join('');
        
        console.log(mapped = mapUUID('75442486-0878-440c-9db1-a7006c25a39f')) 
        // ЗЕДДВДИЖ-АИЗИ-ДДАМ-ЙНЛБ-КЗААЖМВЕКГЙП
        console.log(unmap = unmapUUID(mapped)) 
        // 75442486-0878-440c-9db1-a7006c25a39f
        


        1. Wesha
          31.01.2023 20:21
          +1

          К чему такие сложности?

          > n = rand(1000000000000)
          => 302593367291
          > n.to_s(26)
          => "1bhdmhia7"
          Проще надо быть — и люди к Вам потянутся

          потными волосатыми руками!


          1. Fen1kz
            01.02.2023 02:05

            10 цифр (таймштамп) + 10 цифробукв


          1. iig
            01.02.2023 10:43

            Не думаю что заменить uid набором рандомных английских слов это запредельно сложно.


        1. Maccimo
          01.02.2023 00:09

          Код сразу обфусцированным пишете?


    1. Maccimo
      31.01.2023 00:29

      Не повезло сайтам с уникальными числовым ID на статью. И чем больше статей тем хуже, так как порядок чисел больше. Тот же Хабар в зоне риска.

      Твиттор тут вне конкуренции. И много, и только числовые ID.


      1. nitro80
        31.01.2023 04:49
        +5

        А он вообще попадется в выдаче?


    1. webhamster
      31.01.2023 01:14

      Ну, в общем, подытоживая мои ковыряния, я в значимых факторах количество цифр в урле в явном виде не нашел. Гораздо важнее, например, длинна урла.

      Единственное что похожее есть - это фактор FI_NUM_NON_LETTERS_IN_URL (Количество 'небукв' в урле). Но небуквы - это же не только цифры, но и плюсики-минусики, вопросики, процентики и т.п. Стоимость у этого фактора небольшая отрицательная 0.01. В принципе, далеко не главный параметр, чтобы с ним морочиться, когда можно другие до ума доводить.


      1. franky_d_zoro Автор
        31.01.2023 06:47

        А как же


        1. webhamster
          31.01.2023 10:05

          Хм, этого фактора нет в таблице github.com/lord-alfred Y-Factors Formula, посему не видно для него коэффициента. Или Index 331 - это позиция в важности учета фактора?


        1. pudovMaxim
          02.02.2023 07:21

          А точно есть влияние цифр именно в slug, а не в хосте?

          И второе, а ранжирование идёт относительно всей выдачи или того же сайта?


    1. edogs
      31.01.2023 02:49
      +2

      организация неповторяющихся URL через технически уникальную строку может отрицательно сказываться на ранжировании. Зачем это сделано?

      Одно время генераторы дорвеев всегда имели числовой ИД в строке, т.к. это тупо проще и быстрее, чем по строке идентифицировать. Поэтому числа были одним из признаков дорвея. Гугл якобы тоже числа не любил по этой причине.
      Так же был ответ от кого-то из яндекса, что сайты надо делать для людей, а не для роботов, поэтому неинформативный для человека ИД это фу какая гадость (бесполезная для человека информация ака спам), а набор текст в урле это ах какая прелест (человек сразу мол поймет что такое luchshaya-statiya-obo-vsem). После чего пошло повальное увлечение ЧПУ в разных формах.


    1. arman_ka
      31.01.2023 08:29

      Кажется вы не на то обратили внимание, у вас жесть какой длинный адрес с кучей слешей и подпунктов. Они нафиг не нужны, если у вас есть новости так и сделайте wevhamster.ru/news/683


      1. webhamster
        31.01.2023 09:41
        +2

        Хех, еще немного и вы были бы близки к wethamster :)

        Тут вы правы, надо заняться роутингом. Это в любом случае будет эффективней влиять чем пляски с ID.


  1. nin-jin
    30.01.2023 17:36
    +7

    Так и какие приоритеты у этих факторов? Сейчас все бросятся слеши выпиливать, а там приоритет 0.000000000001


    1. franky_d_zoro Автор
      30.01.2023 17:42
      +5

      Только что нашел таблицу (кто автор я не знаю и насколько она достоверна тоже), в ней написано что коэффициент 0.050576094170344 на слеши

      Дисклеймер к таблице:
      Здесь опубликованы коэффициенты для одного из внутренних ранжировщиков в поиске Яндекса. Это не итоговая формула, которая влияет на результат появления ссылки в серпе, т.к. судя по изученному коду – внутри используется несколько ранжировщиков и поисковых движков, результаты которых мержатся между собой и уже итоговый результат приводит к распределению ссылок по топу выдачи.

      Ссылка на таблицу - https://gist.github.com/lord-alfred/97400a79f10f3bb13bb4bcd42268b1f8


      1. technik
        30.01.2023 20:16
        +5

        Офигенно. Просто в афиге полнейшем что это стало доступно всем. Прям бери и делай сайт по этой таблице.

        Удивительным видится фактор FI_IS_COM | Домен в зоне .com.

        И это при том, что они всегда говорили что все доменные зоны равны. А получается что некоторые равнее :))


        1. franky_d_zoro Автор
          30.01.2023 20:26
          +1

          Да, утечка прям глобальная. А многие говорят не шутить над этим, а как тут без юмора?


        1. webhamster
          30.01.2023 23:10
          +12

          Еще Яндекс за то, что домен не в зоне .RU тоже премию выдает (фактор IS_NOT_RU). Эпично!



          1. Cerberuser
            31.01.2023 07:27
            +3

            То есть зона .рф - это для них замечательно и православно, а .ru - зашквар?


        1. webhamster
          30.01.2023 23:33
          +3

          Ох, щи... Плюсом к вышесказанному.

          В Яндексе в итоговый ранг добавляется оценка PAGE_RANK_UKR с офигеть каким коэффициентом. То есть, на выдачу сайта влияет украинский Page Rank. Зачем ставить сайт в выдачу в зависимости от его оценки через украинский Page Rank - это большой вопрос к руководству поисковика.

          Понятно, что это влияние времени, но блин, вот так вот определять "хорошесть" сайта? Через Ukrainen Page Rank?


          1. toxicdream
            31.01.2023 09:52
            +1

            Месть за Яндекс.Новости?


          1. sets
            31.01.2023 14:08
            +1

            Видимо они расчитывают русский и украинский Page Rank по-отдельности, приходится складывать, потому что интернет более-менее общий, по крайней мере был.


          1. Arhammon
            31.01.2023 15:34
            +3

            Кстати при поиске запчастей очень часто вываливаются украинские сайты(которые естественно не нужны) но имеют нужную позицию. А вот причина это или следствие...


      1. Cerberuser
        31.01.2023 07:27

        -0.250928463672112 FI_ADV На сайте есть реклама.

        Мне кажется, или этот коэффициент будет присутствовать на подавляющем большинстве индексируемых сайтов?..


        1. Mausglov
          31.01.2023 08:13
          +1

          зависит от тематики. На интернет-магазинах ( не маркетплейсах) рекламы обычно нет.


  1. franky_d_zoro Автор
    30.01.2023 17:49
    +2

    Эх, хоть бы кто мем оценил)


    1. Breathe_the_pressure
      31.01.2023 09:58
      +1

      Кстати на Ютубе какой-то чувак нашёл это место, это сделанов Испании г. Girona, районе центра.


    1. svoezemtsev
      01.02.2023 06:47
      +3

      Задрали авторы уже этими дебильными картинками. Одно и то же.


    1. Kiryla
      02.02.2023 05:46

      Мем получился годный. Особенно с chatGPT


  1. thevlad
    30.01.2023 19:21

    Факторы ранжирования, это лишь половина вопроса. Там же машинное обучение на деревьях(градиентный бустинг) очень давно и matrixnet в частности. Факторы не независимы и действуют далеко не аддитивно(плохо/хорошо).


    1. franky_d_zoro Автор
      30.01.2023 19:54

      Полностью согласен. Я и не говорю что вот вам инструкция как надо SEO делать)


    1. edogs
      31.01.2023 02:52

      Но если их обучали по результатам ранжирования на базе этих факторов, то в конце концов эти факторы и будут решающими, разве нет?


      1. thevlad
        31.01.2023 09:51
        +2

        Будут, только какое решение будет принято на основе конкретного значения факторов это вопрос. Если бы была линейная регрессия, то да "решающая формула" имела бы вид a_1*f_1 + a_2*f_2 + .. + a_n*f_n (a_i - подбираемые коэффициенты, f_n - факторы) с однозначной интерпретацией влияния факторов. Но там деревья https://en.wikipedia.org/wiki/Decision_tree а конкретно градиентный бустинг, соответственно результат зависит от некоторой входной совокупности факторов. Конечно, там есть некоторые факторы, которые можно определить, как однозначно "хорошие", которые чем больше тем лучше, но в общем случаи это не верно.


      1. webhamster
        31.01.2023 10:11
        +1

        Тоже хочу это понять. Итоговые коэффициенты ведь не на пустом месте появились.


        1. thevlad
          31.01.2023 10:29

          Коэфициенты на странице гитхаба, которые я видел, явно не про основной ранжировщик поисковой выдачи. Там и комментарии помоему были соответствующие, что это какой-то подпроект.

          PS: сначала я подумал, что эти коэфициенты показывают feature importance, но они там были и отрицательные


  1. YemSalat
    30.01.2023 19:46
    +1

    Надежность вашего хостинга также является фактором ранжирования. Чем меньше у вас ошибок 40x/50x

    4хх ошибки - это с хостингом слабо связано, это ошибки клиента
    5хх - ошибки сервера, но не обязательно хостинга (может у вас сайт крашится из-за бага в коде)

    Так что не надо гнать сразу на хостинг, надо сначала проверить что сами не косячите :)


  1. glupiyyashik
    30.01.2023 19:52
    +3

    #3 Цифры в URL-адресах могут быть вредными
    Где там написано, что они вредные? Это просто фактор, в зависимости от контекста (свежесть запроса или коммерческость) может по-разному ролять, полагаю.


    1. franky_d_zoro Автор
      30.01.2023 19:54

      Мне кажется что тут по контексту, нет цифр - хорошо


      1. Sild
        30.01.2023 20:21
        +2

        В мл все не очень с черно-белым восприятием, у факторов вообще нет "хорошо" и "плохо". Есть только корреляция из комбинации факторов в вероятность события

        Т.е. при наличии фактора "тип данных" со значением "историческая энциклопедия" фактор "есть цифры в урле" - повышает ранг страницы
        А для фактора "тип данных": "поэзия" - понижает

        И только на данной конкретной модели, обученный на данном конкретном наборе данных)


        1. franky_d_zoro Автор
          30.01.2023 20:26

          Возможно так и есть


        1. webhamster
          31.01.2023 00:25

          Только не следует забывать, что у факторов разная стоимость. И более дорогой фактор может быть скомпенсирован только большим количеством дешевых. Стоимость фактора не просто так введена, даже если учесть что нейросетка или другой категоризатор сама себе на уме содержит весовые коэффициеты, связванные с факторами, и потенциально могла бы компенсировать зависимости факторов, задвинув стоимость куда подальше.


      1. glupiyyashik
        31.01.2023 09:41
        -1

        Вот серьезно, и с таким пониманием вы побежали строчить статью на хабре?) А цифры у новостников тоже плохо? а цифры вида "best-of-2023"? Мдэ...


        1. franky_d_zoro Автор
          31.01.2023 10:37
          +1

          Я пошел делаться мнением, не более.
          Думаю если цифра - часть ключа, Яндекс это как-то учитывает.


  1. Storm2003
    30.01.2023 21:18

    Получается, html-разметка ни на что не влияет? (h1-h6, strong/em, header/main и проч.)


    1. franky_d_zoro Автор
      30.01.2023 21:27

      Нет, почему)
      В файле есть много про заголовки, я просто уж такие банальности не стал писать

      Вот например


    1. webhamster
      31.01.2023 00:41

      Может быть, за каким-то фактором скрыт учет "всратости" разметки. Типа розовым шрифтом по перламутровому фону - пессимизация.

      Но судя по коэффициентам, важнее то, что написано в head в метатегах, а не то как оформлены заголовки в тексте. Еще важно содержание title. Положительно оценивается наличие синонимов и связанных словоформ в заголовке и тексте страницы к словам, содержащимся в тексте запроса. Длинный текст - хорошо. А еще лучше большая длина кусков текста, в которых нет ссылок (видимо, имеется в виду внешних).

      В принципе, многие факторы ожидаемы, хотя попадаются и такие, которые вызывают неудобные вопросы типа а почему это у вас .COM - весомый аргумент, а рядом не-RU тоже с похожей оценкой.


      1. franky_d_zoro Автор
        31.01.2023 06:49
        +1

        Думаю что если у сайта плохой дизайн, значит у него плохие поведенческие


  1. Flux
    30.01.2023 22:09
    +8

    Очень надеюсь что Яндекс будет детектить изменения в этих метриках с даты утечки и убивать в ноль позицию пытающихся их "оптимизировать".
    А за попытки править Википедию ради позиции в поисковой выдаче я бы вообще уголовную статью ввёл.


    1. gchebanov
      30.01.2023 22:35

      Так что детектить если создаются новые сайты с высоким значением? Тут уже ничего не попишешь, нужно подождать пока накидают мусора, потом переобучится на новых данных, как результат качество поиска упадет.


      1. fire64
        31.01.2023 09:12
        +2

        А чем Википедия помешала.

        В свое время помещение ссылки под тематической статьей, принесло много хорошего живого трафика мне на сайт.

        Понятно, что люди переходя по ссылке, видели именно то, что искали, так что никто не ушел обиженным.


        1. franky_d_zoro Автор
          31.01.2023 09:21

          Вообще ссылка с Вики давняя практика


    1. Maccimo
      31.01.2023 01:00
      +8

      Вы поосторожнее с законодательными инициативами, часть «ради позиции в поисковой выдаче» могут потерять между чтениями.


  1. ZakharS
    31.01.2023 10:01
    +9

    Пока читал, была только одна мысль: просто хорошо спроектированный сайт с полезным уникальным содержанием и работающий на нормальном хостинге, будет иметь наивысшие позиции. И в чем тут секрет?

    Когда-то давно вел техноблог безо всяких оптимизаций, просто писал статьи на интересные мне темы. Трафик был очень неплохой, из википедии ссылки ставили, из поисковиков приходили сотнями. Потом темы временно иссякли, и блог забросил. Траффик, естественно, упал.


    1. dunkelfalke
      31.01.2023 10:37
      +3

      Ну так всё правильно, SEO нужна чтобы продвинуть сайты, в которых нет уникального (и часто даже просто полезного) содержания среди моря таких же вторичных.


    1. franky_d_zoro Автор
      31.01.2023 10:38
      +1

      На самом деле согласен, если делаешь хороший сайт - получишь трафик. Просто если будешь делать это с оглядкой на SEO, трафика можно получить больше. Но еще раз, качество сайта и контента во многом определяющий фактор.


      1. ZakharS
        31.01.2023 11:06
        +1

        Да просто все перечисленные пункты - это вообще не про SEO. Это руководство по созданию нормального, продуманного и удобного сайта для людей, не более. Ну разве что выбор хорошего URL может оказаться проблемой, но и здесь просто надо поломать голову или попытаться купить у сквоттеров (постараюсь без мата про них). Остальное - обычная качественная работа без мыслей о какой-либо "оптимизации".


    1. PEgorov
      31.01.2023 13:13
      +4

      Это собственно ровно то, о чем Яндекс, Гугл и прочие товарищи неоднократно и прямым текстом говорили - делайте интересные сайты на нормальном хостинге и будете иметь наивысшие позиции.


    1. i86com
      31.01.2023 15:00

      Когда-то давно вел техноблог безо всяких оптимизаций

      Вероятно, потому что большую часть оптимизаций сейчас выполняют движки и блог-платформы. Так что для их разработчиков это будет важным.

      А самому пользователю не обязательно знать, что у него есть robots.txt, sitemap.xml, description, keywords, h1-h3 и прочие штуки для не-человеков.


  1. makovke
    31.01.2023 10:10
    +2

    а теперь, после этой статьи в том числе, Яндекс, по обыкновению, поменяет алгоритмы))


    1. Maxim_Q
      01.02.2023 20:17

      Да они что-то поменяют, что-то оставят. Кто там занимается SEO максимально плотно подскажите где и какие изменения могут быть в алгоритме яндекса из-за утечки исходников?


  1. Aquahawk
    31.01.2023 10:26
    +2

    В одной статье говорится о полезности количества закладок и в ней же говорится о том что пойдут ссылки переделывать. Имеено из за таких переделывальщиков ссылок закладки умерли как явление.


    1. franky_d_zoro Автор
      31.01.2023 11:06

      Буквально все кого я знаю используют закладки, с чего вы взяли что они умерли?
      Ну и плюс, когда вы переделываете ссылку, неужели вы не ставите 301?


    1. ipodman
      01.02.2023 14:35

      Есть же редиректы


  1. Soukhinov
    31.01.2023 10:59
    +4

    если пользователь искал “купить пластиковые окна в Москве” и после вашего сайта не вернулся в поиск

    То, значит, он окончательно плюнул на это дело, и ваш сайт сыграл решающую роль.


    1. franky_d_zoro Автор
      31.01.2023 11:07
      +1

      Ну далеко не всегда так)


  1. ifap
    31.01.2023 13:12
    +1

    Хм... а без изучения алгоритма поисковиков всё это не было очевидно?! Меня только пункт 9 удивил - очень спорно, но вряд ли он имеет решающее значение и применяется без учета других факторов, а также ключевые слова в URL - серьезно? В XXI веке?! Впрочем, Яндекс и description настойчиво рекомендует воткнуть в каждую страницу, чему тут удивляться...


  1. PEgorov
    31.01.2023 13:18
    +6

    Так здесь же нет вообще ничего, о чем господа из СЕОшной братии бы не знали, ну либо не догадывались. Никакого срыва покровов о том, что наличие желтой фавиконки влияет на выдачу (привет, серчи года 2012), ничего такого. Ну то есть это как если бы кто-то бы слил вики господа бога (или Дарвина, кому что ближе) и там в секции "факторы, влияющие на продолжительность жизни" бы увидел, что не нужно бухать, курить и жрать что попало, а нужно заниматься физнагрузками.


  1. mrkaban
    31.01.2023 13:21

    На самом деле все указанные в статье факторы ранжирования уже давно известны и доказаны опытами всевозможных блого-сеошников.


  1. johnfound
    31.01.2023 13:42

    Ну, статья для СЕОшников может и полезна, хотя мне кажется, что они как раз все это знают. А для любителей как я, она слишком лаконичная.


    Например, #5 – Что значит «жесткая оптимизация»? Оптимизация чего? Обычно оптимизация это хорошо. Меньше размер страницы, быстрее загрузка, шустрее работает сайт и т.д. Или это не та оптимизация?


    Потом, что значит #8 – время на сайте? Откуда Яндекс может знать сколько времени проводят на мой сайт посетители???


    Так же #21: Откуда Яндексу знать возвратился ли посетитель на сайт позже или нет? Я например для всех сайтов на которые возвращаюсь регулярно просто ввожу URL в адресной строке.


    То же самое #17: Закладки они в браузере стоят и по сети не рассылаются. Как Яндекс может знать сделал ли посетитель закладку или нет?


    1. nin-jin
      31.01.2023 13:48
      +4

      Всё просто: Яндекс следит за пользователями Я.Браузера и посетителями сайтов с Я.Метрикой.


    1. Ivan22
      31.01.2023 13:49

      "Яндекс.Браузер" !!


      1. johnfound
        31.01.2023 13:59

        Ну так-то да, но это работало бы только если пользователи Я браузера равномерно распределены по всему миру – то есть, могут быть использованы в качестве репрезентативной выборки всех потребителей. Но это далеко не так. Я бы не сказал что пользователи вообще какого-то отдельного браузера можно считать репрезентативной выборкой.


        1. thevlad
          31.01.2023 21:00
          +1

          Так им и ненужна репрезентативная, для фактора достаточно, что она человечья, и трудно накручиваемая.


    1. mrkaban
      31.01.2023 13:55
      +3

      На самом деле согласен с @PEgorov тут ничего нового, всё это лет 10 назад уже говорили, просто лишний раз подтвердили то, что сеошники и так знали.

      #5 это не про техническую составляющую, а про оптимизацию контента. Например, сильно много и явно вставили поисковых ключей.

      #8 Яндекс метрика много где есть, по ней и смотрят, а еще есть яндекс браузер)

      #21 Тоже самое, что и 8 пункт.

      #17 тут нужно прочитать что в оригинале написано, но есть специальные сервисы закладок, которые 100 лет в обед считаются факторами ранжирования. Либо закладка это прямой заход на сайт, который они палят через Я браузер или метрику, прямой заход это отдельный фактор ранжирования (#23).


    1. morijndael
      31.01.2023 18:35
      +1

      Очень просто. Если на сайте есть Яндекс.Метрика — она это сливает

      Если нет — добавляется отрицательный коэффициент :))

      Плюс ещё, можно анализировать из вкладки с результатами поиска, смотреть, куда там пользователи тыкают


  1. Sergey_Viryasov
    31.01.2023 19:09
    -1

    А вы автор фантазер :)))

    Заглавные буквы в Title - Скажите это ОЗОНу, они всегда название бренда пишут заглавными, и что же им все лучше и лучше то ?

    Ключевые слова в URL - кто вам сказал что норм 3 ? Это вы где взяли ? Сами придумали ? Ну давайте посмотри на сайт ВсеИнструменты и поразмышляем, какже они ранжируются с такой портянкой в урлах.

    Количество поисковых запросов (Все просто - больше трафика = выше рейтинг.) Тут вроде как про кол-во написано, а не про объем трафика. Или у вас всегда 10 бабок это 10 рублей ?

    Слишком большое количество слешей в URL может повредить рейтингу

    Ну пойдем снова ВсеИнструменты посмотрим и подумаем.

    Цифры в URL-адресах могут быть вредными - и тут идем смотреть и ОЗОН и кого только можно.

    Автор, вы как бы пишите отсебятину не имеющую ни чего общего с выводами или вы в принципе не понимает, как это работает от слова ВООБЩЕ или совсем.


    1. franky_d_zoro Автор
      31.01.2023 19:28
      +5

      Боже, сколько злобы в твоем комменте брат)
      1) Да, заглавные буквы для брендов и аббривиатур думаю нормальная история, вопрос больше про злоупотребление. Ну типа написать весь тайтл капсом, чтобы выделиться на SERP

      2) Изучите файл, поймете откуда я взял. Ну давай изучим немного все инструменты. Большинство высоко-частотных запросов содержат не более 3 слов, например https://www.vseinstrumenti.ru/category/dreli-elektricheskie-10/. Этот урл ранжируется достаточно высоко по конкурентному ключу и что мы видим? Урл состоит из [домен]/[техническая категория]/[название категории из 2 ключей]

      3) Как правило больше запросов = больше трафика, так как много низкочастоток тянут высокие ключи

      4) На давай посмотрим. Самая глубокая целевая страница у них - страница товара, и что мы видим?
      www.vseinstrumenti.ru/product/sverlilnaya-mashina-fiolent-ms8-16re-m-master-f0059-idfr298112002-01k2-770472 - 2 слеша. Или ты считаешь что это много?

      5) Про цифры уже обсуждалось выше, почитай - узнаешь полезную информацию

      Автор пишет свое мнение. Статья называется "выводы", любой вывод субъективен. В чем проблема, изучи файл сам и напиши свою статью. Я же не назвал статью "10 неоспоримых фактов" или как-то так)

      И друг, будь попроще, ты чего злой такой


      1. Sergey_Viryasov
        31.01.2023 20:02

        1. Писать капсом можно, например ни кто не запретит написать АКЦИЯ и СКИДКИ и ни чего не будет. Написать все заглавными, сорян, это не комильфо.

        2. https://www.wildberries.ru/catalog/zhenshchinam/odezhda/verhnyaya-odezhda/kurtki-i-vetrovki - что-то не подходит под ваши примеры.

        3. В вашем примере есть цифры в урле, а вы говорите плохо, а сами пишите что не мешает ранжированию. Определитесь.

        4. Больше запросов = больше трафика ? Возьмите банальный пример "ипотека" и посмотрите какие доли какие запросы занимают.

        Давайте я вам поясню кое-что.

        Кол-во запросов не про трафик, как бы вам хотелось, а про ядро сайта, запросы по которым пользователи постоянно на него приходят. Это не про то, о чем вы пишите.

        Ну так если это ваши личные выводы, так и напишите заголовок статьи, Выводы имени такого-то на то, что я увидел. Будет справедливо.


        1. franky_d_zoro Автор
          01.02.2023 06:05

          1) да ок, согласен
          2) Ну и по целевому ключу "Куртки и ветровки" в wb другой url в выдаче, где вложенность меньше. Ну и не стоит забывать что это же не единственный фактор
          3) Никто не говорит что это смерть и все, имеется ввиду что чем цифр меньше, тем лучше. Опять, это на мой взгляд. Url www.example.ru/1234521243 будет ранжироваться хуже чем www.example.ru/primer, при прочих равных. Ну и опять таки, я думаю что это что-то из старого, когда Яндекс боролся с Дорвеями, которые часто юзали цифры в url.
          4) Ну мы же говорим про редлевантные запросы. Сам по себе запрос Ипотека - бесполезен. Ипотека что? Взять ипотеку или узнать что это вообще такое? Согласен, может я не совсем корректно выразился в статье. Ну и плюс у сайта не может быть трафик только по одному высокочастотному ключу, там еще будет милилард лонг-тейл запросов. Я имел ввиде вот это.

          Писать "Личные выводы" это как "Эмпирический опыт" или "Масло маслянное". Выводы они уже личные, они уже субъективны. Опять же, заголовок не кликбейтный ни разу, описывает буквально то, что находится в статье. Не понимаю что ты к названию придрался)


    1. Blackness
      31.01.2023 20:19
      +1

      Очевидно вы не очень понимаете в SEO, если по 1 фактору выводы делайте, да и время не потратили чтоб проверить свою аргументацию


      1. PEgorov
        01.02.2023 04:25

        Там есть коммент чувака, который напрямую отвечал за это самое ранжирование (там прям натурально его ник проходит красной полосой через все это счастье), который уже лет дохрена не работает в яндексе, но который прямо говорит, что этот файлик не имеет никакого отношения к формированию результатов поиска. Он, видимо, тоже не очень понимает в SEO.

        UPD О, он теперь и тут есть https://habr.com/ru/post/713666/comments/#comment_25175498


  1. RAtioNAn
    31.01.2023 19:21
    -5

    авторитетных сайтах, таких как Википедия

    Прям на ноль поделили.


  1. DenPlusPlus
    31.01.2023 21:03
    +1

    nav_linear.h не имеет никакого отношения к ранжированию результатов поиска Яндекса. Можно расходиться.


  1. kycok
    31.01.2023 21:10

    Фактор-судьбы, который даёт шанс каждому попасть в ТОП :)


    1. franky_d_zoro Автор
      01.02.2023 06:06

      Я думаю это старый добрый "однорукий бандит" ну или что-то подобное.


    1. 6095959
      01.02.2023 10:53

      Там слово "Случайный" вообще-то в кавычках.


  1. lll000lll
    01.02.2023 00:42
    +1

    Подскажите плз., в каком виде ключевые слова из запроса подразумевается включать в URL, если запрос русскоязычный?

    Транслит? Перевод? UTF-8?


    1. franky_d_zoro Автор
      01.02.2023 06:09
      +1

      Я руководствуюсь вот этими правилами транслитерации - https://yandex.ru/support/nmaps/app_transliteration.html


      1. lll000lll
        01.02.2023 18:35

        Спасибо!


  1. wilelf
    01.02.2023 07:07

    Все эти выводы бесполезны без понимания веса факторов.


  1. seo7908801
    01.02.2023 15:03

    Не все так гладко... Читаем: "

    #19 Карты JS-API

    Интеграция API карты, например, Google Maps, в вашу страницу является фактором ранжирования. В таких нишах, как путешествия, наличие полезной и функциональной карты может поднять позиции в поисковиках."

    Лезем в факторы и смотрим что там написано

    Это такой крутой фактор, что как бы есть, но как бы нет)) /


  1. Yuriks111
    01.02.2023 15:38

    )) приходит в голову всем по любому поводу, с текстом и без


    1. johnfound
      01.02.2023 17:13
      +2

      image


  1. Alexey_Salyukov
    02.02.2023 05:46

    Прикол в том, что сеошники знали эти факторы и работали по ним. Главная проблема была и остается в количестве и инвестициях, ссылок например, чтобы вес вашего сайта был больше конкурента