Помните те времена, когда Интернет был маленьким, модемы — медленными, а провайдеры — жадными? Мы сохраняли всё полезное у себя на винчестерах, героически пытаясь вместить всё нужное в скромный объём дискового пространства. Раньше это был единственный способ обеспечить себе быстрый и эффективный доступ к информации.

А потом высокоскоростной Интернет нас избаловал — мы перестали скачивать файлы и формировать свои собственные локальные библиотеки знаний и контента. Теперь всё лежит на сайтах и в облаках. Зачем что-то скачивать, если всё это моментально доступно по одному клику?

Но, похоже, настало время вернуться к истокам. Всё чаще оказывается, что нужный контент становится недоступным или меняется до неузнаваемости.

Низкий порог, интересные перспективы

Самое замечательное в том, что для того, чтобы начать собирать свою локальную базу знаний, в общем-то, ничего специально настраивать не нужно. Достаточно создать специальный каталог на диске и начать сохранять туда нужные файлы. Главное — это самодисциплина. Никаких «Новых папок», набитых сотнями неразобранных файлов, которые «могут когда-нибудь пригодиться». По себе знаю, что очень сложно отказаться от такой вредной привычки. С самого начала нужно не просто бездумно набивать диск потенциально полезными файлами, а сразу организовывать их в систему. Да, тяжело, сложно, иногда просто лень. Но я периодически напоминаю себе, что все усилия не пропадут даром: в какой-то момент количество перейдёт в качество.

Знаете, как оно бывает: какие-то знания сами по себе ничего особенно ценного не представляют. Но объединённые в систему с продуманной структурой и перекрёстными связями они вдруг дают множество новых идей и становятся удобным и эффективным инструментом. Именно такой инструмент мне бы и хотелось получить.

Мои правила организации базы знаний

Чтобы процесс пополнения базы шёл как надо, я постепенно выработал свою систему правил, которым я стараюсь неукоснительно следовать:

  1. Сохранение. Если есть достаточно высокая вероятность того, что я захочу несколько раз воспользоваться каким-то источником информации, то я по возможности сохраняю его в мою базу. Примечание

  2. Очистка. При загрузке источника я стараюсь очистить его от мусора. Если я периодически загружаю источники с какого-то сайта, то этот процесс лучше автоматизировать. Я постоянно пополняю свою библиотеку скриптов для автоматической загрузки и очистки контента.

  3. Загрузка. Если сервис предоставляет альтернативу: обращаться к источнику онлайн или скачать его в виде файла, то я всегда выбираю второй вариант. Конечно, при этом обязательно соблюдать условия лицензии и авторские права.

  4. Упрощение. Я всегда стараюсь выбирать простейший формат хранения информации. Если источник без потерь можно сохранить в виде текстового или графического файла, то я использую этот простейший формат. Это моя личная информационная бритва Оккама.

  5. Нейминг. Я всегда даю осмысленные названия файлам и каталогам в моей базе. Никаких «Новый документ.txt».

  6. Фотографирование. Если нет другой возможности сохранить источник, то подойдут и скриншоты.

  7. Атрибутирование. По возможности я всегда стараюсь сохранять ссылку на сайт, с которого я загрузил информацию.

  8. Обеспечение. Приложения и скрипты — тоже часть моей базы. Я стараюсь использовать portable-версии приложений, в которых все настройки сохраняются в файлах рядом с приложением. Если такой возможности нет, то я сохраняю в базу дистрибутив приложения.

  9. Воспроизводимость. Если источник по каким-то причинам сохранён в нераспространённом формате, то я обязательно включаю в базу приложение для просмотра файлов этого формата. Например, так я поступаю со словарями.

  10. Индексирование. Я стараюсь дополнять базу индексными списками, а также страницами со ссылками на файлы по какой-то определённой теме и поддерживать их в актуальном состоянии.

  11. Рефакторинг. Я не жалею времени на то, чтобы довести до идеала самые востребованные источники в моей базе. Если я открываю какой-то справочник каждый день, то будет не лишним потратить время на его улучшение. Например, перенести в другой, более удобный формат.

  12. Резервирование. С самого начала я периодически выполняю резервное копирование базы.

Маленький пустой чердак

И ещё одно важное правило. При пополнении своей базы я вспоминаю слова Шерлока Холмса, произнесённые знакомым с детства, неподражаемым голосом моего любимого актёра Василия Ливанова:

— Ватсон, поймите, человеческий мозг похож на маленький пустой чердак, который вы можете обставить, как хотите. Дурак натащит туда всякой рухляди, какая попадётся под руку, и полезные, нужные вещи уже некуда будет всунуть, или в лучшем случае до них среди всей этой завали и не докопаешься. А человек толковый тщательно отбирает то, что он поместит в свой мозговой чердак. Он возьмёт лишь инструменты, которые понадобятся ему для работы, но зато их будет множество, и все он разложит в образцовом порядке. Напрасно люди думают, что у этой маленькой комнатки эластичные стены и их можно растягивать сколько угодно. Уверяю вас, придёт время, когда, приобретая новое, вы будете забывать что-то из прежнего. Поэтому страшно важно, чтобы ненужные сведения не вытесняли собой нужных.

Все эти правила строго индивидуальны. То, что они работают для меня, вовсе не означает, что они с такой же эффективностью будут работать для кого-то другого. У каждого свой путь, свои приложения, свои правила и предпочтения.

Сияние чистой информации

Моя база постепенно пополняется, я добавляю в неё файлы, пишу новые скрипты. И, конечно, постоянно использую её в повседневной работе. В ней всё красиво, аккуратно и разложено по полочкам. В ней не вылезают из каждого угла рекламные баннеры, нет пёстрого разнообразия шрифтов и буйства красок. Моя база — это строгое и аскетичное хранилище чистого знания и инструментов, организованное по моим собственным правилам. Я всё чаще предпочитаю её Интернету. Если же ответ на какой-то технический вопрос в ней найти не удалось, то только тогда я ищу ответ в сети. Когда я его нахожу, я добавляю новый файл в свою базу.

У знаменитого изречения Фрэнсиса Бэкона «Знание — сила» есть и менее известная первая часть: «Мы столько можем, сколько знаем». Хорошо продуманная и структурированная личная база знаний — это мощный инструмент решения задач. Я в этом уже не раз убедился на практике.

Ещё почитать:

Комментарии (121)


  1. evtomax
    12.10.2024 17:43

    Сейчас человечество вошло в интересный период. Информационные технологии стали настолько сложными, что без участия государства надёжное сохранение информации невозможно (сколько там потерялось картиночек на огромном количестве форумов из-за того, что закрылся один крупный сервис?). То, что отдельные энтузиасты дисциплинированно что-то у себя сохраняют, общую проблему не решает. Но при этом государства сейчас такие, что доверять им этот важный общественный вопрос невозможно. Противоречие.


    1. ru1z
      12.10.2024 17:43

      Не припомню чтобы хранением информации на длительном промежутке занималось именно государство. Обычно это как раз люди (для поддержки страны и общества), а государство - это что-то быстро сваять на коленке. Если у людей, которые интересуются сохранением информации есть ресурсы и влияние на государство, то может происходить улучшение процессов сохранения, а у государств нет такой сверхзадачи. Государства приходят и уходят, а информация сохраняется людьми. Государство может легко вам сказать что-то вроде "Незаменимой информации нет" или усложнить вам доступ, хотя для вас информация может быть важной.


      1. Areso
        12.10.2024 17:43

        А кто же еще?
        Архивы - государственные, либо аффилированные с государством.
        Библиотеки - аналогично.
        Да даже ЗАГС ой, церковные книги - аффилированы с государством.


        1. olku
          12.10.2024 17:43

          Начиналось с отдельных летописцев и монастырей как систем дублирования и холодного хранения. Но они не занимались всеми знаниями. Даже знаменитая библиотека Ватикана и его сеть разведки тоже преследовала в первую очередь свои, а не общечеловеческие интересы.


          1. jackchickadee
            12.10.2024 17:43

            Даже знаменитая библиотека Ватикана и его сеть разведки тоже преследовала
            в первую очередь свои, а не общечеловеческие интересы.

            все так делают. всегда так делают.
            а интерес летописца вести хронику непонятен и неправдоподобен.
            так же как интерес монастыря как хозяйственной единицы кормить этого грамотея-бездельника (притом что бизнес-процессы самого монастыря нуждаются в документировании и учете).

            также неправдоподобен интерес монастыря содержать какую-то там библиотеку. нужно выделять правильное помещение с правильным микроклиматом, спеца-библиотекаря, а если в библиотеке найдется какая-нибудь еретическая книжонка - мало не покажется никому.


            1. askharitonov
              12.10.2024 17:43

              а интерес летописца вести хронику непонятен и неправдоподобен.

              Но почему? Монастырь — это в первую очередь не хозяйственная единица, а центр духовной жизни, отсюда и библиотека (понятно, что в первую очередь с религиозными трудами). А зачем писать летописи — ну а зачем людям делать разные другие общественно-полезные вещи по своей инициативе? Но делают же.


        1. ru1z
          12.10.2024 17:43

          Архивы не обязательно долговременное, хватит нескольких поколений (государства обычно дольше и не существуют). Государству принципиально долговременное не нужно. ЗАГС и другие краткосрочные способы регулировать массы нужны, а долговременное сохранение - такую задачу решают энтузиасты. Там в примере вообще форумы с картинками - зачем государству это сохранять? Энтузиастам интересно, люди раньше и сайты копировали. Как пример - есть архив интернета.


          1. uuger
            12.10.2024 17:43

            Архивы не обязательно долговременное

            В формализованном архивном деле, долговременное - это попадающее в промежуток между "более 10 лет" и "постоянное (бессрочное)"


        1. marapper
          12.10.2024 17:43

          Как раз плохая идея - оставить на волю государства то, что должно решаться децентрализованными методами. Был такой общественный деятель, Иван Бегтин, последнее десятилетие он потратил много усилий, чтобы приложить концепции OpenData к данным государства, и, в целом, пока не свернули, много было сделано. Параллельно его АНО также бэкапило архивы информационных порталов, которые (сюрприз-сюрприз) местные власти часто просто закрывали и выкидывали, когда приходило время реорганизовать учреждение или закрыть очередной тендер по релизайну.

          С закрытыми или условно узявимыми данными, конечно, все посложнее.


      1. Didimus
        12.10.2024 17:43

        АНБ государственное? А там все есть. Даже ваш упавший бэкап.


        1. ru1z
          12.10.2024 17:43

          Сомнительно. У гугла редко, но что-нибудь падает, а тут какая-то заморская контора все сохранит? Да и зачем им все? Не знаю про абн, но если не так далеко, то сколько по Яровой нужно хранить? Там ведь наверняка хранят какое-то время, а дальше перезаписывают на те же носители, недолговечное это дело, хранят ровно столько времени, чтобы хватило вас поймать, согласно Яровой и другим близким к этому правилам хранения трафика, а хранить вот прямо все и надолго - не нужно.


    1. MikeLog
      12.10.2024 17:43

      как раз государства не заинтересованы в долгом хранении информации. Ведь лучше иметь законы забвения. У меня крякнул диск(моя беспечность меня подвела), но не это самое страшное, а то, что много интересных исторических фактов и свидетельств определенных событий была утеряна, а в интернет осталось либо совсем не то, либо ничего. Закон забвения работает хорошо.


      1. Mike-M
        12.10.2024 17:43

        как раз государства не заинтересованы в долгом хранении информации.

        Подтверждаю. Конкретный пример: на прошлой неделе понадобился эпикриз, который выдали матушке в 2022 году. Захожу в ЕМИАС — нет его. Как-будто маму вообще не госпитализировали по ОМС в 2022 году.

        Хорошо что при выписке сохранил эпикриз в недрах своего SSD, помня золотые слова Мюллера:

        «В наше смутное время, Штирлиц, никому нельзя доверять. Слышите? Никому!».

        Иначе важная информация, от которой зависит здоровье и жизнь родного человека, исчезла бы навсегда. Либо для ее восстановления потребовалось на несколько порядков больше времени по сравнению с поиском на собственном диске.


    1. askharitonov
      12.10.2024 17:43

      Возможно проблема в том, что мы недостаточно осознаём необходимость децентрализованных технологий. Информация в Интернете со временем исчезает, сохранение не всегда помогает - не все сайты легко сохранить так, чтобы они работали оффлайн, чтобы ссылки между страницами открывались, все скрипты загрузились и т.д. И у нас вроде бы нет стандартного решения, чтобы ресурсы загружались по некоему уникальному идентификатору (криптографическому хешу) из распределённой системы, причём напрямую через браузер, без использования каких-либо дополнительных средств, то есть, чтобы можно было вставить, например, изображение в HTML так: <img src="uid:2da3fb89a01721eb5" alt="Очень важная картинка">, и чтобы оно грузилось чисто по идентификатору. Конечно так большинство делать бы не стали, но во многих случаях эта возможность была бы очень полезна.


      1. ahabreader
        12.10.2024 17:43

        Или наоборот, слишком хорошо осознали, что централизация помогает дистанцироваться от лишних проблем: всякого сомнительного и потенциально незаконного (копии текстов без явного разрешения уже попадают в эту категорию).

        Есть ipfs и ipfs gateway, чтобы "через браузер, без дополнений", но... это скорее такая продвинутая чудаковатая CDN. Она решает одни проблемы торрентов (доступность из браузера, контентная адресация индивидуальных файлов, обновление файлов), но не призвана заменить их.

        Нафига она сделана файловой системой? (это прикольно). Почему не предусмотрено простое сидирование? (молодой человек, это не для вас делали!). Почему за почти 10 лет не сделали ограничение скорости (по техническим причинам, уходите говорят, закрыто!). И какой смысл ещё в... (я сейчас полицию вызову!).


    1. Swill
      12.10.2024 17:43

      При чем тут государство? Если у тебя нет информации локально, у тебя ее нет совсем - вот и весь принцип. Это дело личное и персональное. Статья об этом, а не о том, как стать вторым Мошковым или Третьяковым.
      Государство вообще не заинтересовано в сохранении всей подряд информации. Ни одно. Государству не может быть интересен альтернативный метод прочистки труб или апокрифические библиотеки JS, не говоря уже о том, что у каждой страны свой взгляд на исторические события


  1. Daddy_Cool
    12.10.2024 17:43

    Извините, выглядит как фантазия об идеальной базе.
    Где примеры э...единиц знания и объснения как это заносится в базу? Структура папок? Используемые скрипты? Используемый софт?
    ------------