Здесь был большой пост, который состоял из нескольких частей, но он подвергся цензуре и был удален за "инициирование политических дискуссий". Поэтому я решил создать новый пост, содержащий только одну из его частей.

В условиях усиливающейся изоляции России, тем, кто здесь остался, как никогда, нужна актуальная информация, знания и технологии. Не сказать, чтобы наша наука и раньше была глубоко интегрирована в мировую, но сейчас она практически откололась от мира. Количество современных знаний на русском языке не идет ни в какое сравнение с материалами на английском языке, а переводится лишь малая часть, и то, далеко не сразу. Кроме того, доступ к научной информации многим совсем не по карману, специализированная литература даже в электронной версии может стоить сотни долларов за книгу из-за жадности издателей-монополистов, а доступ к одной научной статье на Sciencedirect обходится в 30$, что является неподъемной стоимостью даже для некоторых западных университетов, потому что в процессе работы учёным нужен доступ к большому количеству статей. К счастью, есть такие ресурсы, как Sci-Hub и Library Genesis. На данный момент второй заблокирован в России, но в текущих условиях я призываю снять с него блокировку, так как это огромная бесплатная библиотека, содержащая более 2 миллионов книг, которые могут оказать огромный вклад в развитие нашей страны.

Еще одной проблемой является то, что, если смотреть на ситуацию реально, уровень владения английским, достаточный для самостоятельного чтения и получения знаний из литературы, у россиян, в целом, очень низкий. В результате, возникает огромный разрыв между теми знаниями, которые доступны среднему россиянину и носителем английского языка. Английский на данный момент является языком международного общения и науки. Но в сегодняшних реалиях заставлять всё население учить английский, чтобы иметь доступ к современным знаниям, не является рациональным. Поэтому наличие платформы, где каждый гражданин России, будь то школьник, студент, ученый или специалист в любой сфере, мог бы структурированно получать актуальную информацию в каждой области знаний на русском языке, мне видится одним из важнейших факторов развития страны.

Несколько лет назад у меня возникло видение такой платформы на основе базы Library Genesis. (Хочу отметить, что я не являюсь частью команды Library Genesis и не принимаю участия в распространении материалов, защищенных авторским правом, без разрешения их правообладателей). Первостепенной задачей является автоматизированная классификация всех книг, присутствующих там. Часть того, что я успел сделать, доступна здесь, но, в тот момент, я отложил эту идею на будущее, так как это крупный некоммерческий проект, который требует как трудозатрат, так и вычислительных мощностей и приличного по объёму хранилища данных, чтобы выкачать десятки терабайт книг и подвергнуть их автоматизированной обработке.

Library Genesis удобна только в том случае, если при поиске заранее известно название книги или автор. У каждой книги есть такой идентификатор, как ISBN (их может быть несколько), но в базе LibGen он присутствует далеко не у всех книг. Метаданные книг могут тоже быть неправильными или неполными. Соответственно, одной из задач является написание скриптов, извлекающие ISBN из файлов книг в любых форматах. Я писал такие скрипты для PDF и ePub файлов, результат получается очень приличный в плане точности. Зная ISBN, есть множество сервисов, позволяющих получить полные метаданные любой книги, также библиотека конгресса США (крупнейшая в мире) предоставляет полный набор всех метаданных в разных форматах. Про библиотечные форматы и модели типа BIBFRAME можно написать целую отдельную статью, поэтому не буду подробно на этом останавливаться, суть лишь в том, что имея локальную копию всех книг библиотеки Genesis, исправление и обогащение метаданных является лишь вопросом вычислительных ресурсов и может быть произведено автоматически. Получив полную базу всех метаданных, сами книги можно рассматривать отдельно от неё, вопрос их хранения и распространения может решаться любыми способами. Благодаря тому, что в базе метаданных присутствуют хэши всех файлов, любой файл можно скачать по прямой ссылке с любого зеркала, получить через торрент (точнее, через DHT) или через IPFS (как это сейчас реализовано). Для дальнейшей работы понадобится только база метаданных.

Существуют разные системы классификации информации, которые используются в библиотеках, такие как УДК, ББК, DDC, LCC. Каждая их них представляет дерево, в котором могут содержаться более ста тысяч категорий информации, охватывающее все области знаний, от самых широких к самым узким. Пример сильно упрощенного дерева УДК, содержащего лишь 2600 верхних уровней, можно посмотреть здесь. Полные таблицы большинства систем отсутствуют в свободном доступе или в машиночитаемом виде, так как на предоставлении доступа к ним каждой библиотеке зарабатываются большие деньги. Наиболее перспективным вариантом является перевод классификации библиотеки конгресса США (LCC) в машиночитаемую форму, так как она свободно доступна в формате PDF. Скрипт, который я написал для этого, и результат конверсии можно посмотреть по ссылке. На данный момент скрипт требует доработки, так конверсия происходит не на 100% корректно, хотя и показывает хороший результат.

Каждой книге (как печатной, так и электронной версии) в каждой крупной библиотеке мира присвоен один или несколько кодов в рамках используемых этой библиотекой систем классификации. Существует такая организация, как OCLC, к которой подключены большинство мировых библиотек, и которая предоставляет API, которое при отправке в него ISBN книги, выдает коды классификации в системах LCC и DDC, назначенные соответствующей книге во всех библиотеках, подключенных к системе. У некоторых книг в базе уже присутствуют коды классификации, а дамп метаданных библиотеки конгресса содержит код LCC для каждой книги, что позволяет полностью обогатить базу по этой системе без необходимости вызывать метод API на сайте OCLC более 2 миллионов раз.

Имея машиночитаемую базу кодов классификации и базу метаданных классифицированных книг, можно создать сайт для просмотра всего дерева знаний и легкого поиска книг по областям. Я наскоро набросал пример, используя первую тысячу книг из базы LibGen, его можно посмотреть здесь, хотя бэкенд для этого придется поднимать самому по инструкции из репозитория.

Но каталог книг — это всего лишь начало. По каждому коду классификации автоматически может создаваться пространство с разнообразным функционалом. Среди возможностей:

  • Членство в пространствах. Любой пользователь выбирает коды классификации в зависимости от тем, которые представляют для него интерес - профессиональный, любительский или академический, и становится участником каждого выбранного пространства.

  • Подписка на новые книги и статьи. При появлении в библиотеке новых книг с соответствующим кодом, пользователям, состоящим в сообществе соответствующего пространства, приходит уведомление.

  • Кураторы. В каждом пространстве назначается один или несколько кураторов, варианты назначения могут быть разными, основные требования - быть специалистом в соответствующей области и знать английский язык, для того чтобы быть в состоянии полностью понимать содержание всех публикаций с кодом классификации, соответствующему этому пространству.

  • Роли пользователей. Кураторы могут назначать пользователям некоторые роли, которые будут открывать возможность различных действий. Также роли могут предоставляться автоматически в зависимости от определенных действий пользователя или данных о его статусе из других внешних систем.

  • Иерархия пространств. Кураторы пространств, относящихся к более широким кодам классификации, могут выполнять действия, затрагивающие несколько подпространств или пространство и подпространство.

  • Редактирование сообществом. Любые члены сообщества могут предлагать свои правки в любых страницах и в любых компонентах, доступных для редактирования. Одобряют или отклоняют правки пользователи, имеющие соответствующие права в пространстве. Механизм примерно такой же, как редактирование страниц в Википедии и пулл-реквесты на GitHub.

  • Рецензии и метки. Пользователи могут писать рецензии на книги, если рецензия написана куратором или пользователем, имеющим роль эксперта в соответствующем пространстве, она будет выделяться особы образом. Также такие пользователи могут помечать книги в своем пространстве такими метками как "учебник", "энциклопедия", "сборник статей", "современный стандарт", "устаревшее", и т.д.; что позволить сразу видеть наиболее актуальные книги по конкретной теме.

  • Извлечение информации. Из любых форматов, содержание книг в автоматическом режиме должно экспортироваться в единый семантический формат для дальнейшего анализа и обработки. Шаблоны для конкретных форматов, серий книг и издательств создаются и редактируются пользователями, имеющими соответствующие роли. Под семантическим форматом подразумевается не отдельные страницы с расположенными на них элементами, а текст с конкретными разделами, имеющими определенную структуру, а также ссылками на изображения, таблицы, графики и формулы.

  • Глоссарий и словарь. В рамках пространства должен существовать список всех терминов, имеющих отношение к соответствующей области, с толкованием на русском языке и обязательным английским вариантом, использующимся в литературе. Другие языки могут быть добавлены по мере необходимости. Ответственность за те или иные термины может передаваться между пространствами одного или разных уровней.

  • Перевод. Всё содержимое книг и статей автоматически подвергается машинному переводу на русский язык, учитывая словари соответствующих пространств. После этого пользователи могут проверять и редактировать перевод вручную. После проверки пользователями, имеющими соответствующие роли, информация помечается как имеющая достоверный перевод.

  • Новости. Пользователи, имеющие соответствующие роли, могут вести в пространстве обновляющиеся списки новостей, относящихся как к деятельности самого пространства, так и к информации, размещенной и находящейся в ведении данного пространства.

  • Обсуждения. В рамках пространства должна существовать площадка для обсуждения его участниками вопросов, относящихся как к деятельности самого пространства, так и к информации, размещенной и находящейся в ведении данного пространства.

  • Структурирование информации. На основе извлечённого и переведенного содержимого книг и статей, в рамках каждого пространства строится дерево информации, для каждого узла этого дерева создается страница, выглядящая как статья в Википедии, куда участниками пространства копируется вся наиболее актуальная и имеющая ценность информация со ссылками на первоисточники. Вся информация должна оперативно обновляться после появления и обработки новых книг и статей.

  • Курсы. В рамках пространств, на основе общей методики, с привязкой к структурированной информации, пользователями, обладающими соответствующими ролями, создаются образовательные курсы. В пространстве может быть один или более курсов. Общая методика включает в себя формирование нескольких групп целевой аудитории - дети, подростки и молодежь, взрослые. Для каждой из групп должны быть единые стандарты оформления, проверки знаний, требований к стилистике и обучающим материалам. В каждом пространстве обязательно должен быть курс для взрослых, содержащий только сухую конкретную информацию, без упрощений. Присутствие курсов для подростков и молодежи тоже желательно в каждом пространстве, они должны содержать всю информацию из курсов для взрослых, но с дополнительными пояснениями, развлекательными и игровыми моментами, мультимедийным контентом, жизненными примерами, и содержать элементы, направленные на создание и поддержание интереса к изучаемой теме. Курсы для детей должны создаваться только в тех пространствах, где это имеет смысл, и давать упрощенную информацию, используя методы из курсов для подростков и молодежи, но с учетом детского уровня развития и психологии. По мере появления новой информации в пространстве, курсы должны обновляться.

  • Образовательные программы. Для каждого курса должны быть определены зависимости, то есть курсы, которые должны быть пройдены перед возможностью прохождения этого курса. Формируется набор общеобразовательных программ разных уровней, а также различных специальностей, после чего для каждой из них определяется набор курсов, которые необходимо успешно завершить для овладения программой. После выбора программы, пользователям показывается дерево зависимостей между курсами, предлагаются разные форматы прохождения (параллельно или последовательно) и расписания, влияющего на интенсивность занятий. Также должна быть возможность свободного прохождения курсов в своём темпе в любое время. Пройденные курсы взаимозачитываются между программами, что позволяет сменить программу во время ее освоения или освоить дополнительные программы без повторного прохождения курсов.

  • Проверка и обновление знаний. В рамках каждого курса могут применяться различные формы проверки знаний. После прохождения курса выдается электронный сертификат с ограниченным сроком действия. После истечения срока, пользователю будет предложено пройти повторную проверку знаний. В случае повторной успешной проверки, срок действия сертификата каждый раз может увеличиваться для некоторых курсов. Если содержание курса обновилось, пользователю, который до этого его проходил, будет предложено пройти ту его часть, которая претерпела изменения, после чего на выбор либо пройти проверку знаний по всему курсу с продлением срока действия сертификата, либо только по его изменившейся части, но уже без продления. Сроки действия сертификатов могут устанавливаться кураторами курсов и соответствующих пространств.

  • Единая информационная среда. Портал должен функционировать как в виде сайта в сети "Интернет", так и в виде приложения на всех доступных платформах, а также обеспечивать возможность непрерывного обучения и получения актуальной информации на протяжении всей жизни.

  • Идеи и предложения. Участники любых пространств могут предлагать идеи по улучшениям и новым функциями. В случае принятия положительного решения, реализация этих идей может быть протестирована в рамках одного или нескольких пространств, поддержавших инициативу, а впоследствии внедрена и глобально во всем проекте.

Данный проект может быть полностью реализован на общественных началах без помощи и поддержки от государства, а после того, как он начнёт работать и показывать результаты, можно уже выдвигать предложения по официальному использованию этого проекта в науке и образовании. Разработка такого портала технически не является особо сложной, а успешный запуск, привлечение пользователей и налаживание работы позволит решить многие проблемы, стоящие перед нашим обществом, и обеспечить развитие нашей страны во всех отраслях беспрецедентными темпами. Поэтому я приглашаю всех желающих, особенно тех, кто сейчас уже занят развитием и поддержкой Library Genesis, принять непосредственное участие в воплощении этой идеи в жизнь здесь.

Если кого-то заинтересовала эта идея, подписывайтесь на мой телеграм-канал, там будут публиковаться обновления, если проект будет развиваться. А еще, там есть остальные части прошлого варианта статьи.

Комментарии (47)


  1. PereslavlFoto
    26.03.2022 02:57
    +34

    Ваша превосходная и подробная статья содержит в себе ровно три противоречия, которые мы хотели бы обсудить.

    1) Вы снова придумали википедию. Конечно, это очень хорошо. Википедия сама по себе очень дельная штука, и поэтому каждое новое придумывание википедии — хороший поступок. Но, пожалуйста, задумайтесь о недостатках википедии, которые никуда не исчезнут из вашего проекта.

    Ваше предложение ближе всего к той части википедии, которая называется «Викиданные» и «Викиучебник».

    2) Главная преграда, которая стоит перед вами, это авторы книг и статей. Нет, причина вовсе не в «жадности издателей-монополистов». Причина в том, что ни сами авторы книг, ни их читатели не хотят становиться издателями. Им приятно, когда издателями трудятся другие люди, специально обученные. Им ещё приятнее, если эти специально обученные люди платят им за авторскую работу и за авторские права.

    Именно по этой причине Google придумал всё это чуть раньше вас, однако не сумел реализовать. У них было много денег, много сотрудников и много ресурсов. Но судья был против.

    3) Опыт множества российских граждан показал, что википедию невозможно реализовать «без помощи и поддержки от государства». В первую очередь потому, что без государства нельзя получить авторские права, а во вторую очередь потому, что без государства нельзя получить широкий доступ ко всем тем людям, о которых вы грезите.

    Поэтому, дорогой товарищ, я смело предлагаю вам начать с тренировки сотрудничества. Для такой тренировки лучше всего подходит та самая википедия, от образа которой вы отталкивались. Пожалуйста, примите участие в её наполнении. Это позволит вам увидеть множество проблем, которые до сих пор не удаётся решить. И будет очень здорово, если вы сумеете решить хотя бы часть этих проблем.

    Как учит нас поговорка — «сегодня здесь, а на будущий год в Иерусалиме!»


    1. Leonid_Makarov
      27.03.2022 14:32

      Википедия к сожалению показала свою полную неэффективность. За 20 лет её истории о ней позитивно отзываются лишь за ссылки по заданной теме, ну а это не то, что от неё ожидали. А вот национальный портал "Знания" намного ближе к решению заданной проблеме. Отсюда смысла наполнять Википедию абсолютно нет, тем более не понятно через сколько дней её заблокируют, а вот "Знания" - это будущее.


      1. unsignedchar
        27.03.2022 17:58
        +2

        С первым комментарием, да ещё и таким чотким :)


  1. ganqqwerty
    26.03.2022 03:19
    +3

    Мне видится, что это будет страшно полезный и хороший, но все же полностью пиратский ресурс.


    1. PereslavlFoto
      26.03.2022 03:28

      Киберленинка не пиратская.


    1. alt78
      26.03.2022 06:58
      +1

      ИМХО, он однозначно будет (и должен быть) пиратским. Иначе не взлетит. Это что-то типа Флибусты, а не Википедии.


  1. datacompboy
    26.03.2022 03:24
    +2

    Энциклонги одобряют.


  1. Black_Spirit
    26.03.2022 03:46

    Зашёл на хабр после долгого отсутствия. Причину, думаю, все понимают, не до айти. Кстати, сразу в глаза бросается количество просмотров статей и комментариев. Пусть меня извинит автор статьи, выскажусь здесь.

    Доневмешались же по полной. Да, это и вы, хозяева ресурса. И те, кто просто делал свою работу. И те, кому было фиолетово. Добро есть добро, а зло это зло, и искусственно себя отделять от этого вечного противостояния все равно что зонтиком укрываться от слепней. Уютно, да? Ничего не гложит, есть будущее?

    Мнимая беспринципность и беззубость, профессия вне морали, компьютеры не имеют эмоций... Ну подумаешь, 30 лет развития туда же, куда русский боевой корабль.

    Я говорил окружающим в течение многих лет, что поднимется эта тень непережитого прошлого и накроет всех. Да ну? Все путем? Вы серьезно!? И это вы, создатели алгоритмов, решальщики проблем на стыке человеческих знаний, умнейшие люди любого коллектива, как вы пропустили самое важное? Как вы смогли в течение многих лет игнорировать приближение краха нашей части цивилизации?


    1. smutek_blaznu
      26.03.2022 06:26
      -19

      И это вы, создатели алгоритмов, решальщики проблем на стыке человеческих знаний, умнейшие люди любого коллектива, как вы пропустили самое важное? Как вы смогли в течение многих лет игнорировать приближение краха нашей части цивилизации?

      Никто ничего не игнорировал. Как раз наоборот. Упомянутые вами «создатели алгоритмов», «умнейшие люди любого коллектива» осенью 2007 года запустили разработку ИИ по управлению политико-экономическими процессами в мире. Как вы думаете, почему российских топ-гроссмейстеров забанили от общения с остальными топами — из-за того, что не нравится нацистская символика нацбатов? — отнюдь, всем пофиг на символику, — из-за того, что могут в общении с остальными о чем-то таком догадаться, что как бы не должно быть широкоизвестно. Или вы думаете, что тот, кого вы не любите больше всех вот так вот сам по себе захотел и запустил все это, — отнюдь, опять же, ИИ работает, все под контролем, могут наверное и вас задействовать, если подойдете, никнейм у вас вполне.


      1. Syzd
        26.03.2022 14:14

        из-за того, что могут в общении с остальными о чем-то таком догадаться, что как бы не должно быть широкоизвестно.

        уточните что вы имеете ввиду, можно в личку


      1. leok
        26.03.2022 21:37

        Это очень большое заблуждение что гроссмейстер обязательно умен и что навык игры в шахматы прямо пропорционален интеллекту.


    1. Lizardinius
      26.03.2022 11:40
      +6

      Если вы знали, что ждёт нашу часть цивилизации, то почему не говорили громче? Кричать постфактум «а я же говорил» каждый может…
      Вы серьезно считаете что будь хабр «в политике», это что-то изменило бы? Неужели хабр был тем самым избранным, который должен был всё изменить, но мы так ине дали ему исполнить предназначение? Я считаю нет. Начиная от того, что аполитичные личности не запрыгнут в этот омут даже если политика польётся из каждого утюга и заканчивая тем, что те изменения которые требовались (и требуются) нельзя решить просто злой толпой, это должна быть толпа имеющая планы и цели, а лидеров которые это предоставят как-то не видно. Те кто могли бы стать лидерами и так знали всё что происходит, но как мы видим, желания что-то организовывать у них не было, а тех у кого было уже посадили. Да и это всё тоже ерунда, ведь толпа из гостки технарей ничто перед толпой всех возрастов, которые поддерживали и до сих пор поддерживают то, что происходит.
      Лично я считаю, что разрешив политику на хабре, он бы умер. Политика легко порождает срачи под каждым постом (потому что любую тему можно к политике свести), что повышает градус неадеквата, субъективщины и взаимной ненависти пользователей, что только распугает потенциальных специалистов, превратив хабр в ещё одну развлекательную площадку. Не просто же так каждое тематическое сообщество практически всегда запрещает политику, религию и прочие провокационные темы. У хабра в том числе из-за этого получилось создать такое уникальное сообщество специалистов, которое даже заменить нечем, на сколько я знаю.
      Предложение добавить на хабр политику сродни предложению добавить колонку анекдотов в журнал по ядерной физике. Если бы анекдоты как то влияли на распад частиц, их бы без проблем добавили, как и на хабре появлялись и появляются новости о действиях государства в IT сфере и этого был достаточно.

      Более того, многие люди не могут видеть будущее и такого, что происходит сейчас, не ждали, а тех кто ждали назвали бы конспирологами. Конечно выбранный курс страны был отвратительным и экономику часто встряхивало, но как говорил наш президент «всё стабильно», стабильно плохо, но стабильно. И раз провидцы не были так активны в своих предупреждениях, то и они не видели в будущем ничего плохого, ну а если даже провидцы не видели, то никто бы ничего радикального не сделал бы даже если бы хабр разрешил политику.
      Ну а ещё, ко всему что написано выше не нужно забывать о существовании всяких роскомнадзора и товарищей майоров, которые могли бы заинтересоваться сайтом, который выращивает слишком умных оппозиционеров…


      1. Black_Spirit
        28.03.2022 00:49
        +2

        А тут не политика. Здравый смысл, логика, элементарная порядочность, гражданская ответственность, эмпатия в конце концов. Это тоже запрещено в обществе и на Хабре? Совокупность принятия этих простых вещей ведёт к формированию гражданского консенсуса, который в итоге и влияет на политику. Ну и где это все? Чем руководствовалось большинство айтишников, а я это повторяю одни из самых умных людей, игнорируя наступающий конец отдельной цивилизации? Недоглядели или просто они ограничены в своем понимании. Мне, например, карму слили за верхний пост на -10. А в чем я не прав, что хочу разобраться в том, как люди неглупые специально ограничивают свое понимание исходя из чего?


        1. Lizardinius
          28.03.2022 06:16

          А тут не политика. Здравый смысл, логика, элементарная порядочность, гражданская ответственность, эмпатия в конце концов. Это тоже запрещено в обществе и на Хабре?

          А почему бы и да? Не является техническим или хотя бы гиковским. Просто поболтать за жизнь можно на любых других площадках и прочих соцсетях. Тематический ресурс должен быть чистым чтобы оставаться тематическим, если на него тащить всё подряд то есть всякие пикабу и дзены.
          Почему у меня складывается ощущение, что вы отождествляете хабр и всё общество? Будто хабр запретил что-то и это поместило людей в свой собственный мир где эти запреты существуют всегда и везде. Нет это не так. Кому это было нужно не ленились открыть другой сайт, кому было не нужно умели пользоваться кнопкой отписки от хабов. Вы же предлагаете превратить хабр в ещё один дзен или пикабу.
          Совокупность принятия этих простых вещей ведёт к формированию гражданского консенсуса, который в итоге и влияет на политику.

          Гражданский консенсус формирует пропаганда, телевизор и прочие «независимые» сми. То что группа элит между собой пообсуждает не влияет ни на что.
          Если вы хотите изменить что-то здесь, вы должны долго и упорно обрабатывать самый нижний класс и при этом иметь цель, ресурсы, чёткую программу и вот это всё. Невозможно такое делать без лидера и в целом организации и угадайте что? Всех кто пытался посадили или ещё как-то выдавили из страны.
          Чем руководствовалось большинство айтишников, а я это повторяю одни из самых умных людей, игнорируя наступающий конец отдельной цивилизации?

          Тем что они не пророки. Так же как не пророки и оппозиционные политические деятели которые существовали. Нет предпосылок «конца цивилизации» — нет активных действий предотвращающих «конец».
          А в чем я не прав, что хочу разобраться в том, как люди неглупые специально ограничивают свое понимание исходя из чего?

          Вы неправы в том, что предлагаете из условного научного журнала сделать жёлтую прессу. Профессионалам не нужна жёлтая пресса, им нужен научный журнал.
          Умные люди на то и умные что не распыляются на всё подряд и работают там, где они умны. Умные люди знают, что политика, экономика и прочее не менее обширная область знаний чем их специальность. Эти умные люди всё прекрасно понимают и видят, они выбрали свою позицию и придерживаются её. А на тематическом профессиональном ресурсе не должно быть проявлений этой позиции, любой позиции, будь то политической, религиозной или какой-нибудь гендерной как сейчас модно.
          Я сегодня увижу что условный Петя оказывается поддерживает X, завтра кину ему минус в карму и под всеми постами буду писать что он поддерживает X и какой он плохой. В итоге Петя утонет в минусах, а все его посты будут заняты срачами о X. А Петя, специалист в узкой области с интересными статьями, просто уйдёт с ресурса. Остальные специалисты посмотрят на такой беспредел и даже пытаться писать не будут, зато останется много интернет воинов, которые любят обсудить чужие взгляды и поболтать за жизнь, создать консенсус и вот это всё.


    1. ganqqwerty
      27.03.2022 03:52

      Вообще не понял о чем речь. Это про базу знаний или что-то другое?


  1. hstroker
    26.03.2022 03:57
    +1

    Отличное предложение. К сожалению начисто лишенное экономического обоснования. Где взять ресурсы на реализацию и поддержку такого масштабного проекта? Даже если предположить, что основой будет "уже готовый" LibGen, часть ваших пунктов подразумевает наличие бесплатного (?) экспертного сообщества, обладающего специализированными знаниями. Как полярные примеры можно вспомнить википедию с одной стороны и национальный энциклопедический портал "Знания" с другой. В первом случае, после лавинообразного развития в 2006-2011 годах, википедия серьезно буксует из-за непрерывно повышающихся требований к статьям. Во втором, в проект "Знания" влиты миллиарды, и до сих пор непонятно каков будет результат. А ведь по замыслу портал "Знания" гораздо ближе к тому, что вы описываете чем википедия.

    С другой стороны существует русскоязычный репозиторий с полнотекстовым поиском eLIBRARY.RU, почему он не "обеспечил развитие нашей страны во всех отраслях беспрецедентными темпами"?


    1. PereslavlFoto
      26.03.2022 14:09
      +1

      наличие бесплатного (?) экспертного сообщества, обладающего специализированными знаниями.

      Такое сообщество готово поддерживать википедию. Трудность, однако, в том, что википедия отторгает экспертов, потому что действует на другом уровне. Эксперты привыкли работать на уровне научного текста, а википедия работает на уровне научно-популярного. Поэтому эксперту неловко упрощать свои рассуждения. Эксперты привыкли уважать конкретного автора, а википедия уважает всех авторов. Поэтому эксперту неловко поддерживать своих оппонентов.

      национальный энциклопедический портал «Знания» с другой.

      Задача этого портала вполне понятная. Портал нужен для того, чтобы поддерживать работу издательства. Этот результат уже достигнут, влиты миллиарды.


  1. iingvaar
    26.03.2022 04:06
    +2

    В целом неплохая идея. Но, как известно, запоминается первое и последнее. Первое и последнее у вас одинаковое, и к самой идее отношения не имеет. Ну, то есть идея хороша и просто так, но вы зачем-то придумываете ей идеологическое обоснование. Мы загнали себя в изоляцию, и нам здесь нравится. Мы не хотим отсюда выходить, мы хотим снова сделать танк, ведь что бы мы не делали, у нас получается танк.


  1. zergon321
    26.03.2022 04:12
    +9

    База знаний. В России. Она либо закроется, либо будет нещадно цензурироваться государством


  1. Jury_78
    26.03.2022 08:51
    +1

    из-за жадности издателей-монополистов

    Это же бизнес - извлечение прибыли.

    Сейчас проталкивается идея, что за публикацию должен платить автор, тогда статья будет в открытом доступе.

    На данный момент второй заблокирован в России

    У меня открылся. (No VPN). Это оно?

    у россиян, в целом, очень низкий. В результате, возникает огромный
    разрыв между теми знаниями, которые доступны среднему россиянину и
    носителем английского языка.

    Это наверно все ж проблема "средних" россиян? Т.к. многие ученые из России публикуют свои работы на английском, китайцы публикуют, японцы, арабы и т.д.


  1. NAI
    26.03.2022 10:30
    +4

    Еще одной проблемой является то, что, если смотреть на ситуацию реально, уровень владения английским, достаточный для самостоятельного чтения и получения знаний из литературы, у россиян, в целом, очень низкий. В результате, возникает огромный разрыв между теми знаниями, которые доступны среднему россиянину и носителем английского языка. Английский на данный момент является языком международного общения и науки. Но в сегодняшних реалиях заставлять всё население учить английский, чтобы иметь доступ к современным знаниям, не является рациональным.

    Звучит довольно бредово.

    Во-первых, IT-отрасль прекрасно показала что носители русского языка вполне себе могут программировать и читать документацию на английском без всяких актуальных переводов. И самое главное - это носит массовый характер. Серьезно, есть ли кто-нибудь кроме 1C'ников кто пишет код на русском и читает только переведенные маны\доки?

    Во-вторых, в сегодняшних реалиях в школах, изучение иностранного языка является обязательным, т.е. да, все население пытаются заставить учить английский (по большей части). Вопрос качества этого образования надо задавать отдельно, профильным сообществам.

    Вывод, если людям чего-то надо, то они пойдут и прокачают скилл, если не надо, то никакой ресурс не поможет.


  1. Newm
    26.03.2022 10:35
    +3

    По мне, так надо смотреть вообще в другую сторону. Какой смысл переводить, хранить, работать с тучей дерьма, которое написали исключительно для получения ссылок, грантов и других ништяков. За исключением пары сотен Ученых, наилучшие из остальных за свою жизнь могут создать смыслов на пару монографий, большинство же уложит полезные для других мысли на пару листов.

    Когда я пролистывал литературу из списка использованной к диссертации у своей жены, я понял, что реально полезных классических источников там меньше 10. Порядка 10 содержали специфические мысли, относящиеся к ее теме. Все остальное было просто шлаком, переписыванием, да еще и часто с ошибками.

    Поэтому намного более полезным выглядит рекомендательный сервис, который имеет исключительно базу названий и с помощью коллаборативной фильтрации дает возможность сделать две вещи:

    • Найти список наиболее полезных научных публикаций по твоей теме с оценками, которые ты скорее всего им поставишь.

    • Найти список экспертов, которых могла бы заинтересовать твоя публикация, которым можно ее послать и которые могли бы поставить ей оценки в системе.

    В результате первого отпадает необходимость копаться в навозе, за тебя уже это сделали другие. Впрочем, ты можешь покопаться в каких-то узких направлениях и помочь тем, кто придется за тобой, поставив оценки. Уменьшаются потери времени на чтение, денег на получением доступа. С десятком книг можно напрячься и с помощью автоматических переводчиков прочитать их даже на вьетнамском, что очевидно невозможно, если кучу навоза надо полностью лопатить самому вручную.

    В результате второго пункта будет возможность у полезных публикаций обратить на себя внимание широкого круга ученых, если выбранные эксперты дадут высокую оценку (очевидно, если первая пара экспертов сразу поставит двойки, остальные даже смотреть не будут на этот опус).

    Отдельная база знаний необходима для баз первичной информации: необработанные результаты повторяемых экспериментов, статистическая информация и т.п.

    Пытаться же поиграть в том же поле, что и конторы, которые этим зарабатывают десятки лет с огромными вложениями, ну так себе идея на самом деле.

    При этом я понимаю, что моя идея не идеальна, так как не очень понятно, как зарабатывать владельцу; придется перестраивать всю научную деятельность, так как ожидать от начинающего аспиранта мыслей, которые будут РЕАЛЬНО полезны для других, как минимум наивно и там много еще других проблем вылезает.

    Но... С точки зрения движения вперед как науки, так и практических приложений этой науки, у коллаборативной фильтрации будущее. Мы никуда от этого не уйдем в перспективе 50-200 лет, ну при условии, что не скатимся в средние века на мускульную силу из-за отсутствия достаточных источников энергии.


    1. hstroker
      26.03.2022 14:43

      Любая фильтрация будет связана с попытками "повлиять" на фильтрующих или на сам сервис.


  1. Sarjin
    26.03.2022 10:38
    +1

    не рационально учить английский язык для студентов, инженеров и исследователей? согласен что инженеры могут подождать пока им ктото переведет статьи, если они не работают в новой быстроразвивающейся области техники. но исследователям нужны новейшие статьи. если они будут ждать пока перевод состоиться будет утеряно конкурентное преимущество.

    вне технических наук часть тематик будет под цензурой. что вызывает сомнения в необходимости этих разделов.

    Плюс есть ощущение что делая проект бесплатным возможно в какой то степени уменьшаете вероятность написания книг отечественными специалистами. поскольку они будут бесплатно добавлены в базу данных.

    есть сомнения что ктото будет править перевод за машиной в более менее сложных областях. время специалистов дорого стоит. а Ваша система параллельно уменьшит спустя время число этих специалистов.


  1. DrinkFromTheCup
    26.03.2022 10:57
    -1

    Мысль правильная, направление неверное.

    Зачем пытаться повторить ошибку "Википедии" и складывать все знания в один сервис?

    В повседневной жизни нужен один набор знаний. В одной профессии другой. В другой профессии третий. Какие-то экзотические знания нужны только отчаянным гикам. Какие-то - окончательно устарели и имеют ценность только для историков. Не говоря уже о том, что какие-то знания (по химии, по психологии, etc) обывателю не должны попадать никогда.

    Нет смысла смешивать. Это облегчает хранение - но совершенно не облегчает использование и порождает лишние проблемы.

    Если есть большая нужда попытаться таки создать "неприкосновенный запас знаний" на случай интеллектуальной изоляции - по-моему, стоит всё-таки начать с уже имеющихся профильных хранилищ знаний, которые уже рассортированы по сфере применения и доступности. Поскольку именно в межсферовой передаче знаний больше всего проблем с этим, если на стыке этих сфер не появилась какая-то популярная гибридная дисциплина, конечно.


    1. engine9
      26.03.2022 14:23
      +1

      Какие знания по психологии "не должны никогда попадать к обывателю"? Будьте добры, поясните мысль.


      1. DrinkFromTheCup
        26.03.2022 15:10

        Такие же, какие и по химии, для начала. Спектр, конечно, не такой полный, как у чистой химии, но кое-каких интересных, но однозначно вредоносных в руках непрофессионала, результатов - можно добиться и одной психологией, без медикаментозного вмешательства.

        Об остальном я даже заикаться не хочу, чтобы не будить нездоровый интерес у случайных людей.


        1. unsignedchar
          26.03.2022 15:21
          +3

          А потом обыватели (кому знать лишнего не положено) идут в секту (руководитель которой понимает в психологии). А никто из окружающих (которым тоже лишнего знать неположено) не понимает что собственно происходит.


          1. DrinkFromTheCup
            26.03.2022 15:30
            -1

            Вооооот, Вы почти всё поняли.

            Осталось сделать небольшой шажок. Для этого я предлагаю небольшое практическое упражнение. Мысленный эксперимент.

            Что будет, если знания такого рода, законсервированные в голове руководителя секты из Вашего примера, станут доступны каждому встречному - только руку протяни?


            1. unsignedchar
              26.03.2022 16:09
              +4

              Секту распознают сразу. И никто в нее не пойдет. Ибо незачем.


              1. DrinkFromTheCup
                27.03.2022 13:10

                Вы были так близки.

                Что ж, значит, на другом пути к Просветлению Вы добьётесь больших успехов, это наверняка!


  1. Zmiy666
    26.03.2022 10:59
    -6

    Идея конечно очень хорошая, но как по мне - это должна быть единая государственная база знаний. И государство должно, обязано поддерживать и расширять эту библиотеку. Это священный долг ЛЮБОГО нормального государства. Должен быть штат людей, которые занимаются профессиональным переводом статей с английского, должны быть специальные люди, выкупающие статьи в недружественных странах и передающие их в библиотеку. И разумеется доступ к ней разграничен по уровням и доступен только для граждан России. Авторские права на издания в недружественных странах не должны как либо влиять на доступность знаний для наших граждан. Так же статьи наших ученых должны в обязательном порядке выкупаться и сохраняться в библиотеке. В обязательном порядке должны быть оцифрованы и проиндексированы все библиотеки всех наших вузов, чтоб не было 100500 библиотек с разными наборами книг, учебников, методичек и тд - а была одна единственная и общедоступная. И честно, я сильно удивлен почему подобная база все еще не создана - от этого во многом зависит как развитие науки в государстве так и будущее этого государства.

    Аналог библиотеки, но для программного кода по типу гитхаба - так же нужен, мировые ресурсы могут быть отрезаны, ограничены или перестать существовать - нужно именно государственное объединение, которое сможет независимо содержать базу и предоставлять бесплатный доступ всем желающим.


    1. serginfo2009
      26.03.2022 11:30

      Александрийская библиотека 2.0.


    1. pewpew
      26.03.2022 12:49
      +1

      И будет цензура, передёргивание фактов и замалчивание неудобных фактов, и конечно трактовка фактов так, как идеологически надо на текущий момент.


    1. hstroker
      26.03.2022 14:46
      +2

      Государство всегда самый неэффективный администратор. Вы легко можете это понять сравнив базу бесплатных ГОСТов на сайте Росстандарта и того же Техэксперта.


  1. Zhuravell
    26.03.2022 11:00

    ...доступ к одной научной статье на Sciencedirect обходится в 30$

    Справедливости ради, на ScienceDirect есть много статей с бесплатным доступом.


  1. pohjalainen
    26.03.2022 11:02

    Все уже придумано до вас. В прекрасном ссср прошлого, в условиях изоляции, существовали реально толпы бездельников (ВИНИТИ, ИНИОН и пр), которые за неплохую зарплату занимались тупо индексированием и реферированием зарубежных материалов. Вопрос - какова была польза?

    Для того, чтобы в научных результатах отделить мух от котлет, нужно быть экспертом в предметной области, а ни один уважающий себя эксперт не станет тратить свое время на работу переписчика-каталогизатора.


    1. DrinkFromTheCup
      26.03.2022 12:59

      Ещё Станислав Лем где-то в восьмидесятых писал, что поток новой информации стал настолько сильным, что водиночку угнаться за ним стало крайне сложно.

      Эти, по Вашему выражению, "бездельники" облегчают работу с этим потоком для не-гениев.


  1. agent_0007
    26.03.2022 11:44
    +6

    Пост, который вы написали ранее успел разойтись по телеграм каналам, и на данный момент отлично читается через way back mashine:

    https://web.archive.org/web/20220325200629/https://habr.com/ru/post/657523/


    1. pohjalainen
      26.03.2022 15:26
      +6

      какой же лютый кринж


  1. NeoCode
    26.03.2022 11:54
    +5

    В условиях усиливающейся изоляции России

    Изоляция усилилась не просто так, а по вполне конкретной причине. Когда причина изоляции исчезнет - и изоляция исчезнет. Смягчать симптомы, игнорируя лечение болезни - плохое решение, болезнь от этого только усилится.

    А так - есть либген, и учите английский.

    И еще. Я бы лучше подумал об организации потока информации в другую сторону. Я уважаю Хабр и его сообщество, это в основном прекрасные, умные и светлые люди, но все-же решил для себя, что больше ни одной моей технической статьи на русском здесь не будет, только политические комментарии. По крайней мере пока ситуация кардинально не изменится. А вот если есть уникальная и интересная информация на русском (в том числе и здесь на Хабре), то перевести ее на английский и опубликовать - стоящее дело.


    1. noname2019
      26.03.2022 21:50
      -3

      но все-же решил для себя, что больше ни одной моей технической статьи на русском здесь не будет, только политические комментарии. По крайней мере пока ситуация кардинально не изменится. 

      Ну что ж. Мы смиренно примем это наказание.


  1. Jury_78
    26.03.2022 15:18

    На той стороне тоже беспокоятся...

    В журнале Science письмо, "Let’s not abandon Russian scientists".


  1. emaxx
    26.03.2022 17:22
    +2

    Непонятна целевая аудитория.

    Во-первых, думается, многие учёные владеют английским (ну, возможно, с помощью словарей и помощников).

    Во-вторых, если говорить не про учёных, а про обычных людей, то для абсолютного большинства чтение научных статей - неинтересно и нецелесообразно, потому что статьи обычно пишутся сухим языком, а без солидного бэкграунда в предметной области правильно интерпретировать смысл статьи очень сложно.

    Я сам не учёный, но неоднократно слышал такое утверждение от учёных: научные статьи пишутся учёными и для учёных. А обычному, неподготовленному человеку надо читать научпоп.


  1. AlexaBes
    27.03.2022 16:55

    Проблема есть, а вот её решение очень сомнительное и неясное. По поводу того, что вся литература на английском, согласна. Но вся ли литература нам нужна? Понравилась идея по классификации сфер и глубины их изучения. От себя добавлю, хотя это и очень амбициозно, что лучше было бы не книги классифицировать, а идеи, проекты и концепции, так как в книгах часто достаточно много лишнего и обрабатывать их приходится долго. В этом плане мне больше нравится система Zettelkasten и её воплощение в виде Obsidian или Notion. Только оба проекта снова нерусские.


    1. iingvaar
      27.03.2022 21:39

      Тут на Хабре про цетелькастен писали пару раз. Считается, что это инструмент для индивидуального применения. Я думаю, глобальный цетелькастен, которым могли бы пользоваться все как Википедией, был бы невероятно полезен. Но его нужно допилить до глобальности, прямо так не переносится.


  1. tasmevil
    28.03.2022 09:44

    Но в сегодняшних реалиях заставлять всё население учить английский, чтобы иметь доступ к современным знаниям, не является рациональным.

    У индусов есть любопытное слово: "артха", означающее выгоду или прибыль от чего-либо. В условиях, когда годы подряд планомерно выкашивалось всё российское IT, надеяться что в один момент всё поменяется -- эталон клинической дебильности. Проблема не в книгах или библиотеках: в рф хотят создать загон вроде северной кореи (с очень северным лисом в комплекте) или вьетнама. И, блин, таки сделают. Но помогать в этом... увольте.