Почему не взлетели тематические гипертекстовые ссылки (тэги, Semantic web), а платформы загаживаются спамом и как это исправить.

Казалось бы, нужно только придумать универсальную разметку для [тематических гипертекстовых] ссылок. Попыток было уже много — от навороченной концепции Semantic Web до простейшего инструмента навигации по тэгам (как в ЖЖ). Но как это работает в реальной экономике, где ссылка становится товаром? Да фигово это работает. Спамеры, SEOшники и прочие паразиты легко загаживают любую гипертекстовую экосистему (Википедия уже основательно загажена). СМИ перестают ставить ссылки на первоисточники (не хотят отдавать трафик). Соцсети пессимизируют посты со ссылками (классический бред Фейсбука — люди боятся использовать гипертекст в постах и пишут «ссылка в первом комментарии».) Лёха (Алексей Андреев), ЖЖ.

Типичная интернет-платформа
Типичная интернет-платформа

Платформы, владеющие социальными сетями, а также Wikimedia Foundation пишут сложные пользовательские соглашения, постоянно их обновляют, нанимают множество модераторов и привилегированных пользователей для слежки за обычными пользователями, а сотрудников компании для надзора за модераторами. Игра «Жизнь» (клеточный автомат) Конвея содержит очень простые правила в которых явно не описываются ни осциллирующие состояния, ни глайдеры, ни глайдерные ружья. Без возможности получать эти интересные и сложные состояния игра «Жизнь» была бы никому не интересна, но многие из этих состояний даже не нужно конструировать специально, а можно получить, наблюдая развитие случайных начальных конфигураций. Можно ли на платформах заменить сложные правила чем-то очень простым и при этом отказаться от нанятых контролёров?

Глайдерное ружьё стреляет глайдерами
Глайдерное ружьё стреляет глайдерами

Выбор явных требований применяется в плановой экономике (СССР, Китай), дирижизме и кейнсианстве западных стран. Второй подход соответствует либеральному принципу невмешательства, Láissez-fáire, но также содержит какой-то небольшой набор требований, иногда крайне незаметный в силу привычности. Проблема выбора либо явных требований к формулировке законов природы на основе имеющихся экспериментальных данных, либо сочинения математических моделей согласно простым идеям с последующей проверкой и уточнением возникла в физике задолго до развития компьютеров. Оба подхода успешно применялись в физике, экономике, и многих других областях, но в современном ИТ известен и используется исключительно первый подход, по крайней мере я давно не встречал ничего иного. В этой статье я разберу примеры второго подхода из физики и лингвистики, а далее перейду к возможным решениям «неразрешённых» и «нерешаемых» проблем социальных сетей и Semantic web, включая засилье рекламы и спама, на основе второго подхода – получения желаемых свойств не напрямую из навязывания явных правил, а косвенным образом из устройства пространства решений.

Данный текст описывает общие принципы для создания платформ с низким уровнем спама и копипасты. Это – примитивизация правил; замена прямого регулирования обратными связями, подавляющими нежелательное силами самих пользователей; организация авторов в сообщества единомышленников (дискурсы), в которых обратные связи могут работать; замена глобальной кармы локальной кармой в пределах сообщества без участия в оценке чужих; применимость локальной кармы для монетизации.

Сложное из простого

Общая теория относительности (ОТО) Эйнштейна была получена из принципа эквивалентности инерции и гравитации. Два требования к теории – ньютоновский предел и Лоренц-инвариантность из специальной теории относительности. ОТО позволяет точно вычислить смещения перигелия Меркурия, отклонение света, потери энергии нейтронных звёзд на излучение гравитационных волн (до открытия самих гравитационных волн) и многое другое на что не закладывались при создании теории.

На примере игры «Жизнь» и ОТО мы убедились, что системы, описываемые простыми правилами, могут давать очень сложные и заранее непредсказуемые решения. Наоборот, системы, описываемые сложными правилами, часто дают примитивные решения, непредсказуемость которых сводится к скрытым возможностям злоупотреблений. Борьба с этими злоупотреблениями требует написания новых правил, а также найма вахтёров, следящих за их соблюдением.

Простые правила дающие сложные решения на своём уровне являются примитивизацией. Это стандартный, но кажется всегда нетривиальный путь развития. Одна операция одним рабочим на конвейере вместо надомных рабочих на улицах Ствольная, Замковая и Ложевая в Туле (что тоже было прогрессом против средневековых цехов) – примитивизация труда каждого из рабочих, позволяющая создавать более сложные и качественные, за счёт точности обработки, изделия. Другой пример развития через примитивизацию – изначально контринтуитивный и примитивный фонетический алфавит. Пиктограммы – интуитивные: было много независимых центров их происхождения в разных частях света. Китайские единственные сохранились и продолжают развиваться в XX и XXI веках в сторону усложнения даже в упрощённом китайском, но отказываться от пиктограмм китайцы не будут ради единства письма сильно отличающихся произношением региональных диалектов. Все линейные фонетические алфавиты произошли от греческого, а греческий от финикийского от которого произошли все линейные (согласно Уолтеру Онгу, но кто-то усомнится), а финикийский от упрощенного египетского слогового письма для малограмотных и обучения детей грамоте. Переходы от пиктограмм к небольшому фонетическому алфавиту, то есть идея записывать отдельные звуки, а до этого звучание отдельных слогов символами, было крайне нетривиальным изобретением, но при этом примитивизацией пиктограмм.

Простые правила для платформ можно попытаться получить исходя из нескольких общих принципов, подобных принципу эквивалентности ОТО.

Необходимость обратных связей

Спам, реклама, копипаста и кролики будут публиковаться или размножаться неограниченно пока не запустится и наберёт силу какой-то механизм отрицательной обратной связи, препятствующий их росту. Кролики на островах без хищников ограничены только кормовой базой, а в местах их естественного обитания ещё и хищниками. В центре крупных городов кроликов вообще нет, а если кролик забежит в центр, то погибнет. Задача борьбы с кроликами на островах без хищников может решаться либо полным истреблением кроликов и карантином, либо завозом хищников. В естественной среде обитания или в центре города задача борьбы с кроликами обычно вообще не стоит. (В игре «Жизнь» отрицательная обратная связь тоже присутствует в виде ограничения плотности сверху – гибели клеток от перенаселённости, но нет ограничений на пустоту.)

Перечислим ограничители на рекламу в интернете. Обычно реклама контролируется владельцами платформы, иногда допускается реклама от пользователей, как часть поста или видео на YouTube. YouTube помечает такую рекламу предупреждением. Количество рекламы на платформе ограничивается количеством рекламы на конкурирующих платформах, нельзя забивать платформу рекламой намного сильнее, чем это делают конкуренты. Можно сделать ограничение на рекламу, спам, копипасту и генерируемый ИИ бред в виде отрицательной обратной связи источником которой будут действия пользователей, но пользователи возможно ограничат рекламу в ноль, а платформы на такое не согласны. В продуктивном варианте пользователи должны эффективно подавлять неуместный и некачественный контент вообще и позволять уместный и качественный контент, включая уместную рекламу. Для этого генерирующие качественный контент пользователи должны получать какую-то долю рекламных доходов. Такой подход должен также улучшить таргетирование рекламы, а значит приветствоваться рекламодателями, которые готовы платить больше за рекламу с высокой конвертацией.

Быстрые обратные связи также необходимы для улучшения качества текстов и для решения проблемы отказа ставить ссылки на первоисточники и подавления публикаций со внешними ссылками для сохранения трафика внутри системы: необходимые ссылки будут подавляться для предотвращения выхода из системы, пока за подавление таких ссылок нет немедленного и видимого наказания, а за расстановку необходимых ссылок поощрения.

Другие требования необходимые для реализации обратных связей будут описаны ниже.

Устройство социальных сетей не соответствует социальной организации людей

ОТО формулируется в 3+1 искривленном пространстве-времени, а не в плоском 3 мерное пространстве классической механики, отделённом от времени. Для включения инициированных пользователями механизмов обратной связи тоже нужно адекватное социологическое описание пользователей, а также их взаимодействия между собой с помощью текстов, а не какие-то взятые с потолка и навязанные пользователям конструкции. Существующая система организации на уровнях платформа – пользователи – подписки или ограниченные тематические сообщества под руководством отдельных пользователей явно не описывают существующие сообщества единомышленников и мало помогают их организации.

Пространства смыслов организовано в виде дискурсов, то есть сообществ единомышленников, делящих также и понятийный аппарат, «общий язык». Каждый дискурс обладает своей точкой зрения. Организация дискурса или даже просто описание норм сообщества возможно только в рамках этого дискурса, организация дискурса всегда является самоорганизацией. «Нейтральная точка зрения» базирующаяся на «авторитетных источниках» – не отражение реальности, а инструмент тотального контроля. «Нейтрального» дискурса не существует, есть только самый популярный дискурс. Множественные дискурсы не представлены ни на одной из платформ, но каждая из платформ насаждает единственный дискурс в интересах своих владельцев, что гарантирует обоснованное недоверие к интернет-платформам со стороны всех сторонников других дискурсов. Неспособность корпоративных интернет-платформами одновременно поддерживать разные дискурсы, а также давать инструменты для их формирования и развития, стало причиной застоя интернета, вставшего на квадратные колёса Википедии и социальных сетей в нулевые.

Построить заслуживающую всеобщего доверия платформу можно если это распределённая p2p система на основе открытого кода, которая никому не принадлежит и может быть реализована без централизованного контроля[1]. Доверие можно считать всеобщим если каждая группа единомышленников сможет хранить и контролировать материалы своего дискурса на своих серверах согласно собственным правилам, подобно тому как на узлах Фидонета хранились интересные владельцам узлов эхоконференции (форумы), а в торрентах на раздачу идут только закачиваемые и сохранённые фильмы. Фидонет, в силу распределённой архитектуры, обладал преимуществом над интернетом, но его критическим недостатком был ограниченный базовый формат форума. Тем же недостатком, ограниченностью базового формата, обладают и все остальные распределённые социальные сети и системы, массово появляющиеся в последние годы. Следующая статься будет посвящена проблеме создания универсальной платформы, обладающей функционалом множества других интернет-систем в рамках единого и простого пользовательского интерфейса и единой базы данных.

Только локальная карма, только локальная репутация

Существующие платформы используют глобальную карму, напоминающую рейтинги состояний миллиардеров. Хотя со времён древней Греции существует многоборье, но обычно у шахматистов, бегунов и боксёров отдельные рейтинги. Глобальная карма бессмысленна: оценка единомышленников и оценка посторонних относятся к разным категориям и их нельзя мешать. Единомышленники могут оценивать творчество друг друга индивидуально, а также близость или удаленность чужих дискурсов в целом. Индивидуальная оценка от посторонних вообще не нужна. Критика принципиально отличной точки зрения является предметом публикации в собственном дискурсе, а не поводом для расстановки галочек или эмодзи. Например, православные не критикуют и не минусуют отдельных католиков за филиокве, а пишут статьи почему филиокве неправильно, то есть критикуют католический дискурс в рамках своего дискурса.

Дискурс составляют как тексты, так и авторы и их читатели. И тексты, и текущие авторы дискурса должны обладать согласием между собой. Тексты и читатели пассивны. Основа дискурса – активные авторы. Избежать ручной взаимной оценки авторов невозможно, но можно ограничиться этим. Оценка читателей не нужна вообще, если дискурс читают — значит дискурс популярен и этого достаточно.

Механизм дискурсов предполагает, что «авторитетность источников» должна устанавливаться на уровне отдельных дискурсов. Разные дискурсы могут обладать согласием по ряду вопросов и считать одни и те же источники авторитетными, но проверка каждого из источников будет осуществляться в каждом из дискурсов независимо.

Механизмы дискурса с локальной кармой также практически исключают возможность интернет травли: в своём дискурсе травить не будут, до чужих дискурсов нет дела, а дискурсы в целом будут противостоять не кому-то лично, а другим дискурсам.

Кристаллизация дискурсов

Необходимо предоставить явные механизмы для организации дискурсов, то есть механизмы отношений пользователя со всем сообществом дискурса, а не только парные отношения друзей или подписки на автора. Необходимы механизмы кристаллизации и роста новых дискурсов, объединения дискурсов при достижении согласия и разделения при утрате согласия. В рамках механизмов дискурсов нужны механизмы монетизации для авторов, создателей системы и программистов, осуществляющих поддержку системы после её запуска.

Создание нового дискурса подобно кристаллизации снежинки из переохлаждённого пара, что может случиться случайно или из внешнего центра, например пылинки или перехода на новую платформу существующего сообщества из социальной сети. Дискурс может явно декларироваться (авторами или даже создателями системы при её запуске), но может и вычисляться, а затем проверяться через согласие «вычисленных» авторов. Можно сочетать оба подхода. Если согласие авторов теряется, то дискурс надо разделять на несколько обладающих согласием. Для этого авторам можно предложить голосование о возможном разделе. Процесс вынесения на голосование может быть автоматическим, но алгоритм опубликованным и обсуждаемым. Для каждого дискурсов авторы-владельцы могут индивидуально голосовать за местные значения параметров алгоритмов.

Монетизация и количество дискурсов

Монетизация возможна с помощью отдельной криптовалюты для каждого дискурса. Майнинг будет просто ростом кармы автора за счёт создания вкладов в дискурс, а также поддержанием системы. Например, создатели и разработчики системы получают 10% крипты каждого дискурса, ещё 10% будет раздаваться за хостинг, остальные 80% – авторам. Выводить деньги можно продажей локальной кармы, то есть локальной криптовалюты, рекламодателям. В процессе публикации рекламы сжигается карма, то есть криптовалюта. Скорость сжигания кармы будет зависеть от того насколько неуместна реклама: раздражающая реклама будет сжигать криптовалюту быстро, а значит будет невыгодной рекламодателям. Существующие криптовалюты – фиатные, то есть базируются на доверии. Криптовалюты дискурсов будут нефиатными, то обеспеченными популярностью дискурса у читателей и эффективностью рекламы в дискурсе, что также защитит от спама: ценность криптовалют населённых роботами дискурсов будет как у долларов Зимбабве в 2008 году.

Ожидаемое распределение популярности дискурсов по каждой теме может быть 50% для самого популярного дискурса, 25% для следующего, 12.5% для третьего и так далее, то есть альтернативы представлены и создают конкуренцию самому популярному дискурсу, но значимых альтернатив не будет слишком много. В разных темах самыми популярными могут быть разные дискурсы. Слишком мелкие дискурсы и крипта этих дискурсов никому не нужны кроме его авторов – для успешной монетизации дискурс должен быть достаточно большим, что даёт стимул не создавать новых дискурсов без необходимости, а находить единомышленников, у которых может не быть согласия по всем вопросам, но точно есть способность вести конструктивный диалог между собой.

Как создавать конкуренцию между разными дискурсами, то есть разными точками зрения на одну тему, для повышения качества контента в каждом из дискурсов, будет обсуждаться в следующей статье.

Заключение и библиография

Я следую идеям Уолтера Онга из Торонтской школы коммуникации исследовавшего устность, письменность и выступления на ТВ и в интернете (вторичная устность) как технологии. Я пытаюсь расширить подход Онга в область инженерии, то есть создания новых технологий общения. Краткий обзор подхода описан в моей статье «Как технологии коммуникации диктуют механизмы мышления человека».

Мои статьи писались в обратном порядке от необходимого: эта статья по смыслу должна быть первой. В следующей статье приведены метрики для оценки систем письменного (текстового) общения и дана оценка развития с середины ХХ века. Затем будет статья, описывающая идею универсальной платформы сочетающей свойства многих других платформ в рамках единого пользовательского интерфейса и единой базы данных. В предыдущей статье описана проблема доверия, решить которую невозможно при помощи LLM. В статье «Наука является прикладной технологией и это создаёт проблемы» я разбираю проблемы науки возникающие в следствие неразвитости технологий общения. В статье о многомерных ссылках объясняется почему расширенная Википедия++ (В++) способна выглядеть как большинство существующих интернет-платформ в зависимости от выбора направления навигации в системе, а также обеспечить максимальную связность системы.


[1] Контроль над отдельными доменами (наборами дискурсов) p2p системы может быть настроен в широком диапазоне от анонимного децентрализованного (как биткоин) до привязки ключей к Госуслугам. Анонимные домены и контролируемые государством домены могут сосуществовать и взаимодействовать в рамках одних протоколов подобно разным сайтам Веба или разным языковым версиям Википедии на разных серверах, но под одним пользовательским интерфейсом.

Комментарии (9)


  1. mol4b
    05.12.2024 13:52

    "Механизмы дискурса с локальной кармой также практически исключают возможность интернет травли: в своём дискурсе травить не будут, до чужих дискурсов нет дела, а дискурсы в целом будут противостоять не кому-то лично, а другим дискурсам."

    как при этом спорить для выяснения истины представителям локальных дискурсов между собой? если представитель одного не может зайти в другой и высказаться там?
    Буду ждать следующую статью!


    1. vignatovic Автор
      05.12.2024 13:52

      Даже у людей в разных странах бывает двойное, тройное и множественное гражданство. В дискурсах это должно быть ещё более распространено, тем более что некоторые дискурсы могут быть на разные темы (из физики, и на гуманитарную тему например), но и в каждом из близких дискурсов можно обладать местной кармой, как можно владеть несколькими типами крипты и активами в нескольких валютах.

      Если между двумя дискурсами острые неразрешимые противоречия, то надо в своём дискурсе писать статью параллельную статье в чужом дискурсе, в том же формате, с тем же заголовком, с отличием только по координате "дискурс" и в содержании статьи. Такая статья в В++ будет на расстоянии одного нажатия мыши от другой статьи, как две статьи под одним заголовком на русском и на английском в Википедии, но по дискурсу, а не языку.


      1. mol4b
        05.12.2024 13:52

        МБ: Пример: есть текст на сайте типа вики. выделяешь фразу, с которой не согласен, вписываешь свою взамен. Система смотрит на реакции авторов того-же уровня в теме. если они согласны с изменениями они вносятся. не согласны- предложение усыхает
        Yuriy: Я понимаю B++, как систему разграничивающую и создающую отдельные дискурсы. Значит после редактирования должно появится два текста - оригинальный и в новом прочтении.
        МБ: Да, я имел ввиду редактирование внутри дискурса. Совместная работа над документом. Как повлияет попытка редактирование персонажами извне дискурса - надо подумать. Как и то, как повлияет на уже принятые тексты уход из дискурса автора правок.


        1. vignatovic Автор
          05.12.2024 13:52

          Пусть персонажи из вне дискурса либо заберут текст в свой дискурс, либо купят немного крипты исходного дискурса, а потом редактируют. Если редактирование отменят - крипта сгорит, если их редакцию примут то сохранится или даже немного приумножится.

          При покупке крипты дискурса не обязательно платить деньгами, а можно попытаться обменять крипту одного дискурса на крипту другого. На продажи крипты можно вводить ограничения, чтобы не скупали на корню, а максимум 1% в день, 10% в месяц, 20% в год например.


      1. qw1
        05.12.2024 13:52

        Даже у людей в разных странах бывает двойное, тройное и множественное гражданство. В дискурсах это должно быть ещё более распространено

        А кто мешает условным католикам (при условии, что их гораздо больше православных) набежать в дискурс православия, засрать там все тексты своими догмами, а всех местных заминусовать по самые помидоры?


        1. vignatovic Автор
          05.12.2024 13:52

          С локальной кармой такой набег практически невозможен (разорителен для набегающих и выгоден для тех на кого набежали), экономика и обратные связи работают:

          Чтобы постороннему прибежать в чужой дискурс, придется купить немного кармы. Если он будет гадить или даже просто тупить, его карма сразу сгорит в ноль, а то что он нагадил удалят, причем возможно на автомате с удалением всех его вкладов. Минусы набежавших купивших мало кармы ничего не стоят. Если набег будет большой, то придется купить много кармы и дорого (стоимость кармы пойдёт резко вверх), а удалять набежавших будут оптом и быстро. Деньги за покупку кармы уйдут не на ветер, а тем на кого пытались набежать.


          1. qw1
            05.12.2024 13:52

            В статье нет исчерпывающего описания способов увеличения и снижения кармы, так что остаётся только гадать, как это работает. Новички не смогут присоединиться к дискурсу, или это будет для них слишком дорого?

            У постов есть система рейтинга? Можно плюсовать и минусовать публикации? Как возможность плюсования зависит от собственной кармы?

            Есть ли принцип - кто раньше встал, того и тапки карма? Чем дольше человек в сообществе, тем он весомее?


            1. vignatovic Автор
              05.12.2024 13:52

              Я не хочу давать слишком много деталей, главное принцип локальной кармы и обратной связи, так как способов расчета и применения кармы (и рейтингов постов) может быть несколько (или один с числовыми параметрами, некоторые из которых могут быть нулевыми) и при создании системы можно их все попробовать в разных дискурсах одновременно (дискурсам можно самим выбирать локальные правила).

              Дискурс, то есть его авторы, владельцы крипты, могут сами решать на сколько дорого впускать новичков, но по идее присоединяться должно быть недорого, если делать в дискурсе, то что там (о)ценят и разорительно пытаться делать то, что там не хотят.

              Карма = крипта, и в системе биткоина, чем больше кармы, тем больше голосов, то есть дневной запас плюсов или минусов, как сейчас на Хабре например, и/или может быть мощнее плюс или минус. Отличие кармы от обычной крипты или акций - возможность крипту терять за косяки, но дискурс должен ограничить максимальную потерю за каждый тип косяка (не всё в ноль) или выдвинуть требование косяк самому исправить, чтобы прекратить потери.


              1. qw1
                05.12.2024 13:52

                Я убеждён, что алгоритмическое регулирование не работает. Требуется ручная модерация + институт владельцев/диктаторов. Иначе бы по-децентрализованные p2p-файлообменники уже давно бы вытеснили торрент-трекеры.