image


В целом в статье речь пойдет о том, как, руководствуясь вкусами и талантами пользователей платформы golos.io/steemit.com, получить информацию о том, что понравится аудитории. В основе предложенного рейтинга лежит идея своеобразного делегирования "вкусов".


Кому хочется больше деталей о платформе Голос — смотрим сюда или, если в трех словах, — то сюда. Стим и Голос – братья, есть нюансы, но они нам не важны.


Но для прочтения и понимания данной статьи достаточно будет знать, что golos.io/steemit.com — это платформы для ведения блогов (на базе блокчейнов GOLOS/STEEM, т.е. с оплатой в криптовалюте, но это не так уж важно) и что на них (а точнее, в блокчейнах GOLOS/STEEM, но и это тоже не так важно) за "некоторые" действия пользователя (например, за публикацию авторской статьи, но все малость сложнее) начисляется репутация, которая берется нами за основу.

Т.е. суть такова — есть некоторые активисты платформы, и качественным показателем их активности и успешности можно считать их общую репутацию.


Теперь к сути самой идеи выборки статей (т.е. рейтинга)


Итак, у нас есть пользователи-блогеры, которые публикуют статьи, используя определенные теги. На сегодняшний день суточная пользовательская активность приносит на каждую платформу не менее 1000 статей, а все подряд читать никому не хочется, как и не хочется пропустить что-то интересное.

Т.е. физически покрыть такой объем – невозможно (лично для меня точно, но, быть может, есть и «информационные маньяки», кто знает?).

Но, если задуматься, при правильном подходе нам это и не нужно.

Ход мыслей таков: если пользователь публикует какой-то материал с тегом, например, "двигатель", и набирает лайки от местных активистов – растет его репутация по тегу "двигатель" + общая репутация пользователя. Т.е. если статья многим понравится, то его репутация в этом теге значительно вырастет. Если статья выйдет «так себе» по мнению пользователей (=понравится небольшому количеству людей), то и репутация хоть и вырастет, но незначительно. А если не понравится – то репутация автора может даже и в «минус» уйти.


Т.е. в целом при должном уровне репутации получается такой "народный" специалист именно по тегу (читай – теме) "двигатель".

В свою очередь, «народный» специалист тоже читает чьи-то статьи, награждая некоторые из них своими лайками. Отдавая свой «голос» (=лайк) статье по теме «двигатель», в которой он выступает своего рода признанным экспертом, "народный" специалист сигнализирует нам, что она интересна, по его мнению. Предположим, что таких "народных" специалистов в теге «двигатель» у нас не один, а с десяток или более – получается, что на основании их вкуса можно формировать список рекомендуемого контента для других пользователей.

В этом и состоит главная идея и вся «соль» рейтинга.


Итак, давайте еще раз и кратко.


  • у каждого пользователя есть общая репутация
  • для каждого пользователя рассчитывается репутация по тегам
  • для статей рассчитывается рейтинг по тегам

    Т.е. общая репутация пользователя > репутация по тегу > рейтинг статьи по тегу

Пример


  • Петя опубликовал статью с тегом "еда", его лайкнул Ваня с репутацией Х. Значит, Петя теперь имеет Х репутации по тегу "еда", и величину Х будем считать за показатель его умения. При этом по всем другим тегам Петя имеет нулевую репутацию (т.е. совсем как на Хабре, нет статьи – нет голоса).
  • Через какое-то время Лена публикует статью с таким же тегом, "еда", и получает лайк от нашего Пети. Петя имеет репутацию Y как пользователь, и она пойдет Лене как Y репутация по тегу "еда", а также Петя имеет репутацию по тегу "еда" Х, и эта репутация Х пойдет Лене к рейтингу статьи по тегу "еда". Т.е. рейтинг статьи формируется репутацией по тегам тех пользователей, которые эту статью лайкнули. Например, если кто-то, кто ни разу не публиковался по тегу "еда" лайкнет Лену, от него ее статье не прибудет никакого рейтинга по этому тегу.

Что нам это дает??


  • Рейтинг будет удовлетворять вкусам большинства, поскольку формируется "народно-признанными" специалистами платформы. Признание ценности статьи (=лайк) уже «народно-признанными» специалистами платформы фактически гарантирует высокие шансы на ее успех у большинства сообщества (репутация по тегам будет выше у тех, кто нравится большинству, а те, в свою очередь, будут формировать рейтинг статей для большинства — так реализуется обратная связь в системе, в виде своеобразного делегирования вкусов. Это – фундамент идеи рейтинга).
  • Репутация пользователей всегда растет, и всегда размазывается с ростом числа пользователей. Т.е. невозможно накрутить себе репутацию по тегам и постоянно влиять на рейтинг. Чтобы это было возможным — необходимо публиковать такие статьи, которые будут нравиться как можно большему числу людей, да еще и по всем тегам. А с ростом числа людей в системе вклад от одного будет все меньше. Т.е. в таких условиях манипулировать рейтингом становится практически невозможным (практически — потому что я знаю о теории вероятности, с точки зрения которой я могу быть пришельцем с вероятностью > 0).
  • Ввиду пункта выше мы получаем иммунитет не просто от накрутки, а от накрутки ботами! Бот-нет становится бесполезен в данной экосистеме. Писать статьи, которые зацепят человеческие души – это вам не капчу вводить )
  • Вводится понятие некой теговой "экспертности". Дамы, публикующие статьи с тегом "рецепт", не влияют на репутацию статей с тегом "синхрофазотрон" или "адронный-коллайдер". Т.е. люди, постоянно публикующие "котиков", не испортят жизнь другим, у всех "кружки по интересам". )
  • Репутация по тегам у пользователей растет вместе с платформой, т.е. она – величина непостоянная, и при большой аудитории мы не получим постоянства (динамика в виде смены кумиров).
  • В данном сценарии большее значение имеет не количественный, а качественный параметр. И это, в свою очередь, тоже идет во благо самой платформе, обеспечивая стимулирование на "завоевание сердец" большей аудитории.
  • Ну и, конечно, выкидываем фактор самонакрутки, зачем оно нам?

Ну и самое интересное: а что на практике?


А на практике имеем следующее: рейтинг статей публикуется на платформе golos.io каждый день на протяжении многих месяцев. По фидбеку пользователей, идея рейтинга тяжело воспринимается (объяснения – не моя сильная сторона), но как только люди начинают ее понимать, то уже воспринимают с энтузиазмом и как некий элемент геймификации. Ну и конечно, рейтинг выполняет свою главную цель — рекомендует "вкусное" среди статей.

Конечно, платформа имеет не так много кураторов (=тех, кто лайкает) в сутки, и только последние недели число статей перевалило за 1000, что не дает оценить всех прелестей рейтинга в полной мере (хотя для того же steemit.com, англоязычного «брата», активность выше и динамика в рейтинге боле высокая).

Недавно я стал публиковать параллельно второй вариант рейтинга — для начинающих блогеров. Идея – та же, с той лишь разницей, что в нем отсеиваются статьи авторов с высокой репутацией, т.е. своеобразный рейтинг "песочницы".

И этот вариант рейтинга меня порадовал, поскольку при небольших масштабах платформы, он:


  • отлично отображает оригинальные статьи новичков;
  • ограничение по рейтингу «сверху» не дает застаиваться в рейтинге авторам с одним стилем статей;
  • видны все «подающие надежды» новички, что большой плюс для развития платформы.

P.S.


В целом идея рейтинга прекрасна еще и тем, что ее можно адаптировать ко многим сферам и получать схожий результат, например, для поисковой выдачи или отзывов в магазине, все упирается в вашу фантазию.

Поделиться с друзьями
-->

Комментарии (10)


  1. sic
    16.06.2017 16:06
    -1

    Идея рейтинга не очень хороша тем, что если он чего-то да стоит, то всегда найдется способ его накруить (в частности я не понял Ваш довод про то, что размытие рейтинга мешает ботоводам: да, у «топов» рейтинг будет размываться, но и у остальных-то тоже, так что позиции сохраняются), а если они ничего не стоит, то желание писать за рейтинг быстро пропадает и сам ресурс превращается в подобие уютной жжшечки. А теги эту ситуацию не спасают, если выбираются автором, т.к. по тегам «статистика, исследование, аналитика» я бы вообще не особо хотел бы видеть Вашу заметку, а по тегам «golos, steem» — вполне, а рейтинг-то общий.


  1. T3RAN13
    16.06.2017 17:06
    -1

    мешает ботоводам

    • как вы представляете ботов пушущих статьи? ну даже если они заработают крохи рейтинга по тегам, это не внесет большого значения. Покупать статьи чб прокачать бота??? дорого! смотрите ниже почему
    • рейтинг каждого по тегам растет вместе с платформой. нет максимума. бот должен не один раз что-то запостить, а делать это а) постоянно б) получать хороший рейтинг по тегам за материал, а для этого контент должен впечатлять
    • с ростом числа пользователей ваш вклад в рейтинг будет прямо пропорционально падать. почему? да потому что с огромной аудиторией невозможно чб все обсолютно пользователи были подписаны на вас. А вторая причина, не на одного вас будут подписаны они, у вас будут конкуренты. Вы представте в инстаграмме хоть одного на кого подписаны абсолютно все, или в контакте?
    • рупутация и рейтинг не по одному тегу, их море. чб влиять мнением, придется прокачиваться по нескольким тегам как минимум, в идеале — по всем.

    а теперь прикинте бота, который пишет по всем тегам посты и при этом в топе по всем абсолютноп остам????


    Вы знакомы с теорией вероятности? если вероятность дождя 50%, и вероятность что вы выйдите на улицу 50%, то вероятность того, что вы выйдете в дождь на улице будет 0,5*0,5=0,25 или 25%.


    Если учесть все факторы написаные выше вместе, то получится как с переумножением вероятностей — Ваш шанс на успех сремится к 0/


    Ботоводам мешает не 1 фактор, а их комбинация. по отдельности все факторы "несущественны")


    то всегда найдется способ его накруить

    Вы-то его накрутите, но во времени не удержите постоянным. Устрированный пример — если каждый раз постить одно и тоже, у вас этот контент будет каждый раз получать одно и тоже число лайков? сомневаюсь.


    «топов» рейтинг будет размываться, но и у остальных-то тоже, так что позиции сохраняются

    смотрите ответ выше. вкусы меняются, в конце концов Вам надоест читать что-то изодня в день и вы перестанете лайкать своих кумиров и они уже не всплывут в рейтинге. Время опять не даст вам быть статичным. Будут другие люди которые будут иметь репутацию по тем же тегам как и вы и будут по этим тегам тоже влиять на рейтинг.


    А теги эту ситуацию не спасают, если выбираются автором

    Шкурный инетерс. кому интересно качать ненужные ему теги???
    Если бы теги были так неэффективны, от них бы давно отказался твитер и все прочие)


    1. sic
      16.06.2017 19:15

      Мне кажется, Вы не очень понимаете, чем боты занимаются, боты не пишут статьи а в большом количестве их смотрят и «плюсуют». Собственно, дальнейшие рассуждения читаются как, «почему нельзя открутить гайку отверткой», не более того.

      Кому интересно качать ненужные теги? Всем: ради рекламы, чем больше показов — тем лучше.

      Ну, а еще рекомендую с теорией вероятности ознакомиться, ибо вероятности независимых событий друг на друга не влияют, и вероятность выйти на улицу в дожь, внезапно, те же 50% и остается. Ну правда это к размышлениям все равно никакого отношения не имеет.


  1. T3RAN13
    16.06.2017 22:43

    Мне кажется, Вы не очень понимаете, чем боты занимаются, боты не пишут статьи а в большом количестве их смотрят и «плюсуют». Собственно, дальнейшие рассуждения читаются как, «почему нельзя открутить гайку отверткой», не более того.

    Вы видимо невнимательно читали. Чб боту влиять на рейтинг, ему нужна репутация по тегу. чб получить репутацию по тегу, нужно опубликовать пост и получить лайки. И это я не говорю о том, что тут важна качественная характеристика, т.е. очень важна величина репутации по тегам.


    Т.е. Ваш вариант бота будет вносить в рейтинг 0, поскольку он не публикует статей. В этом и есть суть рейтинга. Все как на хабре — пока не запостишься у вас будет режим ридонли(без приглашения).


    Кому интересно качать ненужные теги? Всем: ради рекламы, чем больше показов — тем лучше.

    Какие показы??? вы о чем?? чб в рейтинг попасть, вам показы не помогут.


    Ну, а еще рекомендую с теорией вероятности ознакомиться, ибо вероятности независимых событий друг на друга не влияют

    События не влият друг на друга, но независимые события могут происходить одновременно. выше я вывел вероятность ОДНОВРЕМЕННОГО происхождения двух НЕЗАВИСИМЫХ событий.


    1. sic
      17.06.2017 04:22

      Вы видимо невнимательно читали. Чб боту влиять на рейтинг, ему нужна репутация по тегу. чб получить репутацию по тегу, нужно опубликовать пост и получить лайки. И это я не говорю о том, что тут важна качественная характеристика, т.е. очень важна величина репутации по тегам.

      Если так, то действительно ничего не мешает ботам сразу публиковать части чужого контента, чтобы мгновенно получить + к собственному рейтингу на короткий срок и произвести голосование. Больших рейтингов не будет, но количеством ботов это компенсируется, а без модерации этот процесс сложно остановить. В общем здесь без конкретных формул можно много домысливать, но я все же повторю изначальную идею, какой бы формула не была, — накрутить ее не так сложно, как может казаться. Тут целый арсенал уже готовых методов SEO есть.

      Т.е. Ваш вариант бота будет вносить в рейтинг 0, поскольку он не публикует статей. В этом и есть суть рейтинга. Все как на хабре — пока не запостишься у вас будет режим ридонли(без приглашения).

      На хабре без инвайтов все бы сразу развалилось. Это совсем не то же самое, что
      И этот вариант рейтинга меня порадовал, поскольку при небольших масштабах платформы, он:

      отлично отображает оригинальные статьи новичков;

      На хабре у новичков уже давно нет почти никаких шансов :)

      Какие показы??? вы о чем?? чб в рейтинг попасть, вам показы не помогут.

      Но рейтинг поможет увеличить количество показов (мы оптимизируем это). А добавление пусть и странных тегов — привлечь более широкую аудиторию. Это совсем-совсем наука о SEO.

      События не влият друг на друга, но независимые события могут происходить одновременно. выше я вывел вероятность ОДНОВРЕМЕННОГО происхождения двух НЕЗАВИСИМЫХ событий.

      Пример просто как раз неудачный выбрали. Все-таки Вы считаете условную, а не совместную вероятность по двум независимым событиям, т.е. P{идет дождь|когда я вышел на улицу}=P{идет дождь}.
      Вот вероятность находиться под дождем действительно 25%, но тут, как и во всем выше, дьявол в деталях.


      1. jahr
        17.06.2017 12:36

        Непонятна Ваша стратегия накрутки в таком рейтинге. Можете расписать гипотетичекий пример по шагам по тегам «двигатель» и «еда», с учетом того, что у Вас есть 1000 ботовских аккаунтов и в системе — 1000 честных пользователей?


        1. T3RAN13
          17.06.2017 12:44

          в данном случае есть только один вариант накрутки — скупка голосов реальных пользователей.
          но в "больших аудиториях" это будет экономически невыгодно.
          Ну и опять же, делать это на постоянной основе тоже нереально, а разовый хак не страшен для системы. Случайные флюктуации и в природе происходят, главное чб они не преобладали ведь)


          1. sic
            18.06.2017 06:56

            Тогда расскажите, чем по вашему мнению бот отличается от пользователя.

            Может ли бот постить контент? Да.
            Может ли бот голосовать? Да.
            Может ли бот иметь рейтинг? Да.
            У кого лучше с координацией действий, у системы ботов, или же у разнородной группы пользователей?
            Что мешает группе ботов влиять на рейтинг более отчетливо, чем реальным пользователям?
            Кто может быстрее переопубликовать чужой контент, боты или пользователь?

            Ну и да, вы правы, рейтинговые аккаунты реальных пользователей вполне можно скупать, и не за огромные деньги, если этот рейтинг не дает никаких возможностей. Но это то, с чего я начал, и мы, похоже, с этой точки никуда не сдвинулись.

            но в «больших аудиториях» это будет экономически невыгодно.

            А это почему? Если аудитория большая, то и рекламировать что-то на нее очень даже выгодно.

            Вы просто как-то опускаете факт, что существенная часть пользователей является потребителями контента, и рейтинга у них, как я понял, будет ноль, и повлиять они ни на что не могут. А генераторы контента редко заинтересованы в том, чтобы «бороться» с тем, что их не касается.


            1. T3RAN13
              18.06.2017 10:40

              У кого лучше с координацией действий, у системы ботов, или же у разнородной группы пользователей?

              в предложенной модели рейтинга нет завязок на координацию действий. так что все равно, это НЕ синхронное плавание.


              Что мешает группе ботов влиять на рейтинг более отчетливо, чем реальным пользователям?

              мы поговорили об этом в самом первом комментарии, но давайте подругому раз не понятно:


              • чб влиять на рейтинг, нужна репутация по тегам
              • чб заработать репутацию по тегам, нужно писать статьи и получать "хорошие оценки" написанному
              • если поставить бота и творческую личность в равные условия, кто будет писать лучший контент? бот или человек? Так что у человека будет выше репутация по тегам, нежели у бота. притом на порядки.
              • теперь представим что вы начали качать бота покупая статьи — это дорого и не выгодно. один бот не воин, а чб сделать армию — разоритесь! к тому же, если вы прокачаетесь, то что бы вам сохранить позицию, потребуется постить что-то постоянно (опять деньги) и разнообразное (если контент приестся людям, вас перестанут читать), а чб качать по 1 тегу вам нужен однообразный контент, опять ваша репутация по тегам перестанет расти.
              • представим что вы начали постить "краденое" и бесплатное. как только вскрывается что-то, или просто кому-то что-то не понравится написанное вами, вашу репутацию по тегу могут убить в минус и опять ваша армия ботов станет хромой и не способной. А т.к. вам нужно постить постоянно, то когда вас разоблочат — это лишь вопрос времени.

              Учитывая все факторы из статьи и пояснения написанные выше, я не вижу способов накрутки кроме скупки голосов живых людей, но это дорого и потому накрутка не имеет смысла. Если на платфформе будет море людей, скажем 1кк, то прокачать бота 1 голосом будет нереально! Нужны будут миллионы голосов для прокачки 1 бота, а если каждый голос стоит по 1 копейке, то кому нужны будут боты в которые нужно миллионы вкладывать?


              А это почему? Если аудитория большая, то и рекламировать что-то на нее очень даже выгодно.

              Вы много знаете статей которые бы окупили многомиллионую рекламу среди аудитории в 1 миллион пользователей??? Да кому нужна такая раскрутка?


              Вы просто как-то опускаете факт, что существенная часть пользователей является потребителями контента, и рейтинга у них, как я понял, будет ноль, и повлиять они ни на что не могут. А генераторы контента редко заинтересованы в том, чтобы «бороться» с тем, что их не касается.

              Лично из практики работы с голосом/стимом. Видя как "спам" или "краденое" набирает больше чем хорошие статьи -это очень хорошо стимулирует творческую личность на борьбу с "вредителями". И такой контент быстро собирает минуса.


              А люди которые опенсорсом занимаются? они вкладывают намного больше времени чем поставить лайк или дислайк.


              Опять же, система кармы на хабре введена и работает. Так что утвержение


              генераторы контента редко заинтересованы в том, чтобы «бороться»

              не соответствует дейтвительности.


  1. T3RAN13
    17.06.2017 12:38
    -1

    Если так, то действительно ничего не мешает ботам сразу публиковать части чужого контента, чтобы мгновенно получить + к собственному рейтингу на короткий срок и произвести голосование. Больших рейтингов не будет, но количеством ботов это компенсируется, а без модерации этот процесс сложно остановить. В общем здесь без конкретных формул можно много домысливать, но я все же повторю изначальную идею, какой бы формула не была, — накрутить ее не так сложно, как может казаться. Тут целый арсенал уже готовых методов SEO есть.

    добро пожаловать на GOLOS/STEEM для проверки своего утверждения о накрутке.
    Я так же писал, в предложенной идеи можно схлопотать и минус, как по репутации по тегу так и по рейтингу.
    Стоит один раз спалиться, и приплыли. Чужим контентом не прокачаетесь.
    Теперь от практики к теории — на голосе есть боты, и если скопипастить что-то, то это будет известно. Более того, люди объединяются и вгоняют в минуса "преступников".
    На словах у Вас просто. на практике не реализуемо.
    Вам придется держать армию ботов, постить от них хороший контент. будите постить плохое — можно схватить минус, не будите постить хорошее — не сможите накрутить рейтинг. Кнут и пряник.


    На хабре без инвайтов все бы сразу развалилось.

    а кто-то утверждает обратное?
    Я лишь сказал что идея хабра с инвайтами и моя идея — ограничивают и похожи.


    Это совсем не то же самое

    внимательно читайте и не вырывайте из контекста.
    И вообще, вы говорили о инвайтах и о моем выводе оригинального контента одновременно? вы мягкое с тептым не мешайте, только потому что и то и то приятно


    На хабре у новичков уже давно нет почти никаких шансов :)

    нужно фильтровать контент по тем же принципам но с ограничением по рейингу. тогда это будет рейтинг среди молодых аккаунтов. проблема быстро решиться)


    Но рейтинг поможет увеличить количество показов (мы оптимизируем это). А добавление пусть и странных тегов — привлечь более широкую аудиторию. Это совсем-совсем наука о SEO.

    опять вы теплое с мягким путаете. Рейтинг с последсвиями от попадаения в него. Для начала цель рейтинга — найти инетерсный контент. Цель SEO — раскрутить его. Рейтинг не занимается сео, я вообще в статье вопрос сео не затрагиваю.


    Пример просто как раз неудачный выбрали. Все-таки Вы считаете условную, а не совместную вероятность по двум независимым событиям, т.е. P{идет дождь|когда я вышел на улицу}=P{идет дождь}.
    Вот вероятность находиться под дождем действительно 25%, но тут, как и во всем выше, дьявол в деталях.

    А боже мой. Какова вероятность выбросить 6 на кубике? А на двух кубиках одновременно?