Метрики для технологий письменного общения / forpes.ru

Главная
Метрики для технологий письменного общения

Метрики для технологий письменного общения

06.12.2024 10:56

vignatovic 5 470 Источник

Предлагаются метрики для оценки общения при помощи текста. Делается вывод, что по большинству метрик в интернете нет прогресса по сравнению с временами бумажного общения.

Alexander Leydenfrost, Наука на марше (1952)

Прежде чем писать техзадание для будущих платформ надо оценить текущее состояние технологий текстового общения при помощи метрик. Под таким общением я понимаю не только прямое общение при помощи социальных сетей, электронной почты, мессенджеров, форумов и корпоративных средств управления разработкой, но любых технологий на выходе, дающих какой-то текст доступный другим, включая книги, статьи и даже подкасты и умные видео.

Перечисленные ниже метрики описывают качество текстов (1 и 2), долговечность и доступ к информации (3 – 5), связность информационного пространства (6 и 7) и отношения между людьми через тексты (7 – 9). Метрики частично повторяются или дополняют друг друга, например, наличие быстрой обратной связи необходимо для обеспечения качества. Данный список должен обсуждаться, уточняться и дополняться.

Обеспечения качества заметных текстов. Не только прямое повышение качества, но и снижение ранга некачественных текстов.
Наличие быстрой обратной связи. Возможность задавать вопросы и получать ответы, большая скорость исправления текстов для повышения их качества, обновление по мере необходимости.
Долговечность хранения информации. Доступность старых качественных текстов для повторного использования, дополнения и исправления вместо написания новых текстов. Сохранение истории правок и удаленного в архивах.
Универсальность платформы для разных форматов информации и любой пользовательской аудитории, то есть обладание функционалом множества других систем (Вики, архивы оригинальных публикаций, социальные сети, форумы, обзоры и отзывы, маркетплейсы, поисковики и мессенджеры) в рамках единого пользовательского интерфейса. Выдача текстов согласно текущему контексту обсуждения и аудитории.
Доступ к текстам и информации. Включает возможность быстрой публикации авторами, быстрой проверки, оценки и исправления текста другими, и быструю доставку текста до читателей (то есть пункт 2).
Плотность связей между текстами, включая неявные (вычисляемые) связи с версиями на других языках и переводами текста, обсуждениями темы текста, альтернативными текстами на ту же тему, историей правок текста, библиографическими прямыми и обратными ссылками включая ссылки на первоисточники.
Качество связей между текстами. Включает возможность продуктивной дискуссии между группами людей со стойкими неразрешенными противоречиями, например сторонниками и противниками вакцинации от ковида-19, Российской империи, октябрьской революции, СССР, Трампа и Камалы…
Количество качественных связей между людьми (определяется через уровень взаимного доверия и взаимную работу над текстами). В данный момент ограничено числом Данбара, а значит возможность преодолеть это ограничение.
Качество механизмов разрешения конфликтов, что не сводится только к механизмам раздачи привилегий. Также относится к возможности вести продуктивную дискуссию в условиях стойких неразрешённых противоречий из пункта 7.

Прогресс по некоторым из этих метрик был достигнут на отдельных платформах, например в Википедии, и в узкоспециализированных системах вроде корпоративной Вики Confluence и в системе отслеживания ошибок для программистов Jira от Atlassian. В интернете в целом по перечисленных выше метрикам, кроме доступа к текстам (если текст в интернете сохранился), с начала XX века не было достигнуто значительного прогресса или наоборот произошла деградация:

Простота публикации приводит к падению качества текстов. Интернет наполнен копипастой и заспамлен. Распространение ИИ приводит к генерации вторичных текстов, а не исправлению стиля исходных текстов без создания излишних копий.
Скорость получения обратной связи, повысилась радикально. На форумах и под постами в социальных сетях отвечают крайне быстро, но это обычно не приводит к исправлению и улучшению текстов. Для исправления научных текстов используется старая процедура рецензирования и отзыв полностью фальсифицированных статей, но не исправление отдельных ошибок.
Интернет не приспособлен для долговременного хранения информации. Например, упоминаний Джека Ма до 2005 года в интернете найти невозможно, то же было проверено с Касперским, но найдены были только несколько ссылок на Лента.ру. Если есть старая ссылка, то можно попытаться воспользоваться интернет-архивом, но ссылки тоже утрачиваются из-за проблемы со связностью интернета. Первые два десятилетия XXI века через 100 лет возможно окажутся черной дырой, о которой сохранится намного меньше источников, чем копий бумажных публикаций в архивах о двух последних десятилетиях ХХ века.
Достигнутый предел универсальности – мессенджеры с интегрированными социальными сетями.
Доступ к информации, включая дистанционное общение, кардинально улучшился благодаря развитию интернета. Научные статьи, даже спрятанные за paywall подписки, можно найти в бесплатном доступе на Sci-Hub, а не ехать в библиотеку в университетском городе. Бумажные книги массово сканируют и выкладывают в интернет, особенно в русском интернете.
Возможность ставить ссылки пришла в массы, но журналисты и блогеры часто не ставят даже минимально необходимые ссылки на цитируемые или копируемые источники. Обратные ссылки (кто на меня ссылается?) редко вычисляются и мало используются. Количество ссылок явно не достаточное, хотя библиографии научных статей стали длиннее от того, что статей стало намного больше. Связи в интернете потенциально могут заменить плохо работающий поиск в старом Google и новых ИИ системах вроде perplexity.ai.
Качество ссылок в научных статьях ухудшилось. Авторы научных статей копируют ссылки из других статей, не читая. Например, не замечают, что цитируемые статьи давно отозваны. Библиографии в книгах обычно прорабатывают хуже, чем в прошлых веках. В остальном интернете недостаток ссылок заменяет поиск.
Количество двухсторонних связей между людьми по-прежнему ограничено числом Данбара, а односторонние связи реализуются в интернете примерно также как в эпоху бумажных изданий и ТВ. Качество связей между людьми возможно упало, так как упал общий уровень доверия. Мы часто не знаем даже своих соседей по дому или офису, а индустрия массового мошенничества получила новое развитие.
Конфликты разрешаются при помощи привилегий и бана. Привилегии раздаются административными методами либо голосованием за глобальную карму авторов и рейтинг публикаций. Рейтинг сайтов в выдаче поисковых систем управляется с помощью «тайных механизмов» или покупается за деньги. Данные механизмы отличаются от редакционных механизмов, существовавших до интернета, только массовостью и автоматизацией.

Можно также попытаться составить метрики роста, связанные с привлекательностью системы для авторов и читателей (и оценить прогресс по этим метрикам). Эти метрики описывают возможность захватить единственный ограниченный ресурс – время пользователей, авторов и читателей. Первая задача: привлечь лучших авторов и эффективно использовать их время. Для привлечения лучших авторов система должны выбирать, продвигать и сохранять лучшие тексты. Это работает и для привлечения читателей, а значит перечисленные выше метрики достаточны для оценки возможностей роста системы.

Проект платформы В++ позволяющий достичь значительных улучшений по всем метрикам письменного общения описан в моих прошлых статьях. В++ использует явно оформленные и самоуправляемые сообщества единомышленников (дискурсы), что позволяет создавать эффективные обратные связи для улучшения качества текстов и подавления копипасты и спама. Для навигации В++ используем многомерную систему координат (заголовок, дискурс, формат, сложность, язык…) что позволяет помещать рядом (перечислять в меню дискурсов подобному меню языков Википедии) статьи на одну тему написанные с разных точек зрения и принадлежащих к разным дискурсам.

Комментарии (5)

newintellimouse
06.12.2024 11:11
#27641264
Первые два десятилетия XXI века через 100 лет возможно окажутся черной дырой, о которой сохранится намного меньше источников, чем копий бумажных публикаций в архивах о двух последних десятилетиях ХХ века.

ну, уже первая четверть века, всё же. А вторая четверть века, в дополнение к этому, будет обильно намазана AI-текстами.
1. vignatovic Автор
  06.12.2024 11:11
  #27641296
  Да, мой текст устарел на пару лет, так как не учитывает недавно начавшуюся деградацию от воздействия ГИИ.

LesnoyChelovek
06.12.2024 11:11
#27641618
Материал очень отдаёт фразой «А в наше время книги читали и были умнее».
1. vignatovic Автор
  06.12.2024 11:11
  #27641628
  К сожалению, да. "Читать книги лучше, чем читать новости в ТГ или смотреть видео с котиками."
  
  Польза от метрик есть если попытаться достичь улучшения по этим метрикам, но в массовом секторе никто и не пытается. Попытка улучшения описана по ссылкам на B++ в последнем параграфе.
  1. newintellimouse
    06.12.2024 11:11
    #27641654
    Ещё сейчас встречал привычку кинуть текстом в AI пресловутый и получить краткую выдержку основных тезисов :) И ладно, когда это бестолковый коммерческий текст.
    
    Но кидают и научные статьи.
    
    А некоторые исследователи предлагают проводить соцопросы на AI-личностях для скорости получения ответов.

Метрики для технологий письменного общения

Комментарии (5)

newintellimouse

vignatovic Автор

LesnoyChelovek

vignatovic Автор

newintellimouse