Предлагаются метрики для оценки общения при помощи текста. Делается вывод, что по большинству метрик в интернете нет прогресса по сравнению с временами бумажного общения.

Alexander Leydenfrost, Наука на марше (1952)
Alexander Leydenfrost, Наука на марше (1952)

Прежде чем писать техзадание для будущих платформ надо оценить текущее состояние технологий текстового общения при помощи метрик. Под таким общением я понимаю не только прямое общение при помощи социальных сетей, электронной почты, мессенджеров, форумов и корпоративных средств управления разработкой, но любых технологий на выходе, дающих какой-то текст доступный другим, включая книги, статьи и даже подкасты и умные видео.

Перечисленные ниже метрики описывают качество текстов (1 и 2), долговечность и доступ к информации (3 – 5), связность информационного пространства (6 и 7) и отношения между людьми через тексты (7 – 9). Метрики частично повторяются или дополняют друг друга, например, наличие быстрой обратной связи необходимо для обеспечения качества. Данный список должен обсуждаться, уточняться и дополняться.

  1. Обеспечения качества заметных текстов. Не только прямое повышение качества, но и снижение ранга некачественных текстов.

  2. Наличие быстрой обратной связи. Возможность задавать вопросы и получать ответы, большая скорость исправления текстов для повышения их качества, обновление по мере необходимости.

  3. Долговечность хранения информации. Доступность старых качественных текстов для повторного использования, дополнения и исправления вместо написания новых текстов. Сохранение истории правок и удаленного в архивах.

  4. Универсальность платформы для разных форматов информации и любой пользовательской аудитории, то есть обладание функционалом множества других систем (Вики, архивы оригинальных публикаций, социальные сети, форумы, обзоры и отзывы, маркетплейсы, поисковики и мессенджеры) в рамках единого пользовательского интерфейса. Выдача текстов согласно текущему контексту обсуждения и аудитории.

  5. Доступ к текстам и информации. Включает возможность быстрой публикации авторами, быстрой проверки, оценки и исправления текста другими, и быструю доставку текста до читателей (то есть пункт 2).

  6. Плотность связей между текстами, включая неявные (вычисляемые) связи с версиями на других языках и переводами текста, обсуждениями темы текста, альтернативными текстами на ту же тему, историей правок текста, библиографическими прямыми и обратными ссылками включая ссылки на первоисточники.

  7. Качество связей между текстами. Включает возможность продуктивной дискуссии между группами людей со стойкими неразрешенными противоречиями, например сторонниками и противниками вакцинации от ковида-19, Российской империи, октябрьской революции, СССР, Трампа и Камалы…

  8. Количество качественных связей между людьми (определяется через уровень взаимного доверия и взаимную работу над текстами). В данный момент ограничено числом Данбара, а значит возможность преодолеть это ограничение.

  9. Качество механизмов разрешения конфликтов, что не сводится только к механизмам раздачи привилегий. Также относится к возможности вести продуктивную дискуссию в условиях стойких неразрешённых противоречий из пункта 7.

Прогресс по некоторым из этих метрик был достигнут на отдельных платформах, например в Википедии, и в узкоспециализированных системах вроде корпоративной Вики Confluence и в системе отслеживания ошибок для программистов Jira от Atlassian. В интернете в целом по перечисленных выше метрикам, кроме доступа к текстам (если текст в интернете сохранился), с начала XX века не было достигнуто значительного прогресса или наоборот произошла деградация:

  1. Простота публикации приводит к падению качества текстов. Интернет наполнен копипастой и заспамлен. Распространение ИИ приводит к генерации вторичных текстов, а не исправлению стиля исходных текстов без создания излишних копий.

  2. Скорость получения обратной связи, повысилась радикально. На форумах и под постами в социальных сетях отвечают крайне быстро, но это обычно не приводит к исправлению и улучшению текстов. Для исправления научных текстов используется старая процедура рецензирования и отзыв полностью фальсифицированных статей, но не исправление отдельных ошибок.

  3. Интернет не приспособлен для долговременного хранения информации. Например, упоминаний Джека Ма до 2005 года в интернете найти невозможно, то же было проверено с Касперским, но найдены были только несколько ссылок на Лента.ру. Если есть старая ссылка, то можно попытаться воспользоваться интернет-архивом, но ссылки тоже утрачиваются из-за проблемы со связностью интернета. Первые два десятилетия XXI века через 100 лет возможно окажутся черной дырой, о которой сохранится намного меньше источников, чем копий бумажных публикаций в архивах о двух последних десятилетиях ХХ века.

  4. Достигнутый предел универсальности – мессенджеры с интегрированными социальными сетями.

  5. Доступ к информации, включая дистанционное общение, кардинально улучшился благодаря развитию интернета. Научные статьи, даже спрятанные за paywall подписки, можно найти в бесплатном доступе на Sci-Hub, а не ехать в библиотеку в университетском городе. Бумажные книги массово сканируют и выкладывают в интернет, особенно в русском интернете.

  6. Возможность ставить ссылки пришла в массы, но журналисты и блогеры часто не ставят даже минимально необходимые ссылки на цитируемые или копируемые источники. Обратные ссылки (кто на меня ссылается?) редко вычисляются и мало используются. Количество ссылок явно не достаточное, хотя библиографии научных статей стали длиннее от того, что статей стало намного больше. Связи в интернете потенциально могут заменить плохо работающий поиск в старом Google и новых ИИ системах вроде perplexity.ai.

  7. Качество ссылок в научных статьях ухудшилось. Авторы научных статей копируют ссылки из других статей, не читая. Например, не замечают, что цитируемые статьи давно отозваны. Библиографии в книгах обычно прорабатывают хуже, чем в прошлых веках. В остальном интернете недостаток ссылок заменяет поиск.

  8. Количество двухсторонних связей между людьми по-прежнему ограничено числом Данбара, а односторонние связи реализуются в интернете примерно также как в эпоху бумажных изданий и ТВ. Качество связей между людьми возможно упало, так как упал общий уровень доверия. Мы часто не знаем даже своих соседей по дому или офису, а индустрия массового мошенничества получила новое развитие.

  9. Конфликты разрешаются при помощи привилегий и бана. Привилегии раздаются административными методами либо голосованием за глобальную карму авторов и рейтинг публикаций. Рейтинг сайтов в выдаче поисковых систем управляется с помощью «тайных механизмов» или покупается за деньги. Данные механизмы отличаются от редакционных механизмов, существовавших до интернета, только массовостью и автоматизацией.

Можно также попытаться составить метрики роста, связанные с привлекательностью системы для авторов и читателей (и оценить прогресс по этим метрикам). Эти метрики описывают возможность захватить единственный ограниченный ресурс – время пользователей, авторов и читателей. Первая задача: привлечь лучших авторов и эффективно использовать их время. Для привлечения лучших авторов система должны выбирать, продвигать и сохранять лучшие тексты. Это работает и для привлечения читателей, а значит перечисленные выше метрики достаточны для оценки возможностей роста системы.

Проект платформы В++ позволяющий достичь значительных улучшений по всем метрикам письменного общения описан в моих прошлых статьях. В++ использует явно оформленные и самоуправляемые сообщества единомышленников (дискурсы), что позволяет создавать эффективные обратные связи для улучшения качества текстов и подавления копипасты и спама. Для навигации В++ используем многомерную систему координат (заголовок, дискурс, формат, сложность, язык…) что позволяет помещать рядом (перечислять в меню дискурсов подобному меню языков Википедии) статьи на одну тему написанные с разных точек зрения и принадлежащих к разным дискурсам.

Комментарии (5)


  1. newintellimouse
    06.12.2024 11:11

    Первые два десятилетия XXI века через 100 лет возможно окажутся черной дырой, о которой сохранится намного меньше источников, чем копий бумажных публикаций в архивах о двух последних десятилетиях ХХ века.

    ну, уже первая четверть века, всё же. А вторая четверть века, в дополнение к этому, будет обильно намазана AI-текстами.


    1. vignatovic Автор
      06.12.2024 11:11

      Да, мой текст устарел на пару лет, так как не учитывает недавно начавшуюся деградацию от воздействия ГИИ.


  1. LesnoyChelovek
    06.12.2024 11:11

    Материал очень отдаёт фразой «А в наше время книги читали и были умнее».


    1. vignatovic Автор
      06.12.2024 11:11

      К сожалению, да. "Читать книги лучше, чем читать новости в ТГ или смотреть видео с котиками."

      Польза от метрик есть если попытаться достичь улучшения по этим метрикам, но в массовом секторе никто и не пытается. Попытка улучшения описана по ссылкам на B++ в последнем параграфе.


      1. newintellimouse
        06.12.2024 11:11

        Ещё сейчас встречал привычку кинуть текстом в AI пресловутый и получить краткую выдержку основных тезисов :) И ладно, когда это бестолковый коммерческий текст.

        Но кидают и научные статьи.

        А некоторые исследователи предлагают проводить соцопросы на AI-личностях для скорости получения ответов.