Что-то остаётся всё меньше доверия ко всяким сетевым хранилищам и прочим «воздушным» технологиям накопления информации. Это, конечно, удобно — спору нет. Сохранил в облаке фотографию и она сразу доступна тебе на всех подключённых устройствах. При необходимости можно одним нажатием кнопки поделиться этим шедевром со всеми, у кого есть ссылка и желание с ним ознакомиться. Добавил в браузер закладку на онлайн-документацию по новой версии какой-нибудь библиотеки, и она всегда будет под рукой — да ещё и в самой актуальной версии.

Но в последнее время всё чаще случается, что сайты и хранилища переезжают, меняют условия доступа, закрываются. Даже если площадка остаётся незыблемой как скала, контент на ней зачастую клубится подобно облаку у вершины горы Фудзи.

Говорят: «То, что попадает в Интернет, остаётся там навсегда». Но, видимо, это правило действует только для мейнстрима. Тексты про «успешный успех» и забавные мемы неистребимы, а действительно полезный контент на поверку оказывается куда менее долговечным.

Сколько исторических текстов, книг, полотен в офлайновом мире считаются утерянными навсегда! А ведь намагниченные сектора на каком-нибудь сервере — это куда более хрупкая вещь. Нажал кнопку — и нет их, как не бывало. 

Зеркала, «машины времени» и всяческие архиваторы Интернета тоже, увы, не всегда помогают. Сохранить весь Интернет во всех его моментальных временных срезах не под силу никому. Кроме того, зеркало — это такой же сайт, который так же может исчезнуть как по мановению волшебной палочки. Да и для их нормального использования нужно точно знать, что именно вы ищете.

Вперёд, к истокам

Когда Интернет был маленьким, модемы медленными, а провайдеры жадными, мы сохраняли всё полезное у себя на винчестерах, героически пытаясь вместить всё нужное в скромный объём дискового пространства. В те времена это был единственный способ обеспечить себе быстрый и эффективный доступ к информации.

Если книга нужна постоянно, то легче купить её и поставить на полку, чем каждый день кататься за ней в библиотеку на другом конце города. Наше стремление к накоплению файлов ограничивал только объём винчестера. Когда появились записываемые компакт-диски, стало полегче — мы периодически скидывали всё накопленное на болванки и освобождали место для новых ценных и полезных файлов.

Иллюзия надёжности

Высокоскоростной Интернет нас избаловал — мы перестали скачивать файлы и формировать свои собственные локальные библиотеки знаний и контента. Книги, музыка, фильмы, дистрибутивы, документация, исходники — всё теперь лежит на сайтах и в облаках. Зачем что-то скачивать, если всё моментально доступно по одному клику?

Иногда даже кликать не нужно: достаточно сообщить название нужной записи умной колонке или продвинутому телевизору. Да и этого не нужно, можно сказать: «Хочу бодрящий утренний саундтрек», а колонка сама решит, что нас сегодня взбодрит. Таких интеллектуальных помощников вокруг развелось великое множество: алгоритмы оптимизации, алгоритмы рекомендации, алгоритмы геолокации.

Раньше мы покупали диск с книгой, программой, фильмом или музыкальным альбомом и могли использовать их в любой момент. Теперь за удовольствие чаще надо платить регулярно и за всё сразу: мы вынуждены приобретать желаемый нами спелый фрукт манго и несколько ящиков редьки в нагрузку. Да и прямая покупка какого-то произведения на стриминговом сервисе не гарантирует того, что оно будет доступно вам всегда.

Когда я в очередной раз не нашёл по привычной ссылке нужный мне онлайн-ресурс, я понял, что настала пора вернуться к истокам. Как известно, облаков на самом деле не существует — это всего лишь чужие компьютеры.

С тех пор у меня пропало всякое желание доверять хранение важной и нужной информации чужим компьютерам. Тем более, что технологических ограничений для накопления собственной базы знаний теперь нет. Локальную дисковую ёмкость можно неограниченно наращивать разными способами — место можно не экономить: дополнительные винчестеры, внешние диски, наконец, собственные домашние файловые серверы.

Конечно, нужно не забывать про резервирование. Оно может быть не только локальным: пусть облака поработают, но не в качестве основного (и единственного) хранилища данных, а как диски для резервного копирования.

Сияние чистой информации

Локальную базу знаний можно воспринимать как личный филиал Интернета, в котором можно устанавливать собственные правила. Благодаря этому она даёт своему владельцу несколько полезных бонусов. 

1. Очистка данных

При сохранении файлов в базу, их можно как угодно их преобразовывать. И, что самое главное, очищать их от ненужного мусора. Для этого можно написать свои программы или использовать готовые решения.

В сети уже есть множество приложений и скриптов, которые позволяют загружать очищенный и структурированный массив данных с конкретных сайтов.

2. Собственная система организации информации

Локальная база позволяет не зависеть от многочисленных вариантов группировки информации и навигации на разных сайтах. При желании можно объединить справочник по регулярным выражениям, например, с фантастическими рассказами. Если в личном цифровом мире это имеет смысл и удобно для работы, то почему бы и нет. Можно использовать любую структуру каталогов, придумать уникальную систему тегов.

3. Удобная система метаданных

Кстати, насчёт тегов. Локальная база знаний позволяет организовать любую удобную систему хранения дополнительных данных, связанных с файлами. Например, можно организовать удобную систему заметок.

4. Локальная поисковая система

Наконец-то можно организовать поиск по своим правилам. Никаких больше рекламных ссылок в выдаче результатов, никакой персонализации, никакой геолокации. Если мы ищем документацию по Beautiful Soup, то мы хотим получить именно её, а не ссылки на рецепты прекрасных вкусных супов.

Инструментов для поиска в локальных файлах сейчас множество. Можно выбирать на свой вкус, комбинировать, кастомизировать.

5. Единый формат хранения информации

В собственной базе знаний можно использовать любой удобный формат хранения информации. Преобразование можно выполнять сразу в момент пополнения базы. Например, можно хранить все тексты в виде простых текстовых файлов.


Для того, чтобы начать собирать свою локальную базу знаний, в общем-то, ничего специально настраивать не нужно. Достаточно создать отдельный каталог на диске и начать сохранять туда нужные файлы.

Главное — это самодисциплина. Никаких «Новых папок», набитых сотнями неразобранных файлов, которые «могут когда-нибудь пригодиться». По себе знаю, что сложно отказаться от этой вредной привычки. С самого начала нужно не просто бездумно набивать диск потенциально полезными файлами, а сразу организовывать их в систему. Все усилия не пропадут даром: в какой-то момент количество перейдёт в качество.

Бывает, что какие-то знания сами по себе ничего особенно ценного не представляют. Но, объединённые в систему с продуманной структурой и перекрёстными связями, они вдруг дают множество новых идей и становятся удобным и эффективным инструментом.

Локальная база знаний будет содержать тщательно отобранные и структурированные данные, организованные по вашим собственным принципам. Это прекрасный способ заставить информацию работать. А ещё личная библиотека знаний — это живое воплощение древнего принципа «Omnia mea mecum porto» — «Всё своё ношу с собой».

Комментарии (18)


  1. Javian
    22.04.2023 12:30
    +6

    Пока обхожусь ёмким названием каталога или файла, и программой Everything. Ничего лучше не придумал. К сожалению содержимое файлов программа не индексирует.


  1. mcdebugger
    22.04.2023 12:30
    +8

    Использую для хранения заметок, цитат из статей, информации по проектам и личной базы знаний связку из Obsidian и Git (для синхронизации соответственно между устройствами и версионирования).

    Даже если что-то случится с самим Obsidian и его перестанут поддерживать, запись в простые Markdown и собственная иерархия позволят получить доступ к текстам, пострадает разве что удобство или читаемость данных, записанных какими-то расширениями, не использующими Markdown формат, коих немного.

    При этом можно продумать собственную стратегию резервного копирования и т.д., поскольку в отличие от облачных сервисов данные предоставлены самому пользователю на его суд :)


    1. zaelcovsky
      22.04.2023 12:30

      а для чего базе знаний версионирование? она пополняется, зачем возвращаться к старой урезанной базе? только если что то удалить а потом это понадобиться?


  1. csharpreader
    22.04.2023 12:30
    +5

    объединённые в систему с продуманной структурой и перекрёстными связями, они вдруг дают множество новых идей и становятся удобным и эффективным инструментом

    Казалось бы простая, но очень хорошая мысль.

    Никаких «Новых папок», набитых сотнями неразобранных файлов, которые «могут когда-нибудь пригодиться»

    Откуда вы знаете, как я называю папки?! Вы хакер?

    А если серьёзно, считаю, можно жизнь потратить на систематизацию цифровых залежей, которые никому никогда не будут интересны. «Новая папка (156)», – конечно, тоже перебор, но «Слив фото с телефона май 2021» пусть останется сливом. Лучше я жену обниму и напою коня, чем две недели буду сидеть и раскидывать ЭТО на папки )


    1. dyadyaSerezha
      22.04.2023 12:30
      +2

      объединённые в систему с продуманной структурой и перекрёстными связями, они вдруг дают множество новых идей и становятся удобным и эффективным инструментом

      Вот все это, только в глобальных масштабах, и называется интернет (кстати, а откуда в личном архиве перекрёстные связи??). Да, туда же добавить резервное копирование, уже продуманное и прозрачное, плюс ИИ для умного поиска актуальной (подчёркиваю, актуальной) инфы.

      Ну а скромный личный архив редких документов можно хранить вообще в чем и как угодно.


      1. csharpreader
        22.04.2023 12:30
        +1

        откуда в личном архиве перекрёстные связи??

        Смешно. Хорошая шутка, добрая.
        Начиная от Excel и кончая хоть WikiPad'ом.


    1. timoxa_dev
      22.04.2023 12:30
      +1

      Вы знаете, я тоже думаю зачем мне тратить пару часов жизни на то, что бы раскидать по папкам терабайтное облако всяких фоток видео и документов, но иногда бывают моменты, что нужно срочно найти "фото меня на фоне БМ-21-1" или "фото как мой собакен пытается завалить кинолога" и тому подобное..

      До смешного доходит, мне проще найти диалог с человеком с которым я уже 5 лет на общаюсь и выдрать фото оттуда, чем найти это же фото в оригинале в груде папок из облако.

      Я все жду момента, когда ментально пойму, что навести порядок будет "дешевле" поиска.


  1. csharpreader
    22.04.2023 12:30
    +8

    А вообще, конечно, это скорее текстовая заметка, черновик, но не статья. Что-то вы немножко поленились добавить сюда хоть что-нибудь (методологию? конкретику по ПО? статистику? что-то ещё?).


    1. ArkadiyShuvaev
      22.04.2023 12:30
      +6

      Да-да, эта статья - отличная демонстрация сущности 'Пост' :)


  1. hierarchical
    22.04.2023 12:30

    А шифровать данные не пробовали перед заливом в облако?!


    1. MajorMotokoKusanagi
      22.04.2023 12:30
      +2

      Дело не только в приватности информации (а самое сокровенное вряд ли будешь заливать в облако). Блокировка с этой или той стороны границы страны, блокировка аккаунта, технические сбои...


      1. aborouhin
        22.04.2023 12:30

        Так в наши непростые времена облаков должно быть как минимум два. По разные стороны границы. Лучше оба частные (но это уже для домашнего пользователя не самое простое и дешёвое решение, да). Плюс локальная копия.


        1. Nansch
          22.04.2023 12:30
          +1

          Не не, наоборот, локальная копия и плюс облака. Тут уж какие приведутся, главное, чтоб при поломке локальной копии шанс восстановления был высок.


          1. aborouhin
            22.04.2023 12:30

            От перемены мест слагаемых сумма не изменяется :)


      1. hierarchical
        22.04.2023 12:30

        Как говорится у трейдеров, не надо держать все яйца в одной корзине. Сделайте себе несколько хранилищ у разных провайдеров.


    1. csharpreader
      22.04.2023 12:30

      Вы бы смотрели хоть немножко, кому пишете такие комментарии )
      Это всё равно, что Гейтсу писать: где в Винде кнопка «Пуск» знаешь вообще?


  1. arantar
    22.04.2023 12:30

    Кому интересно насчет управления личной информацией могут этот блог почитать https://karl-voit.at/tags/pim/


  1. vbcnthfkmnth123
    22.04.2023 12:30
    +3

    Я храню сайты, используя формат zim и просматривая их через программу kiwix-desktop. С форматом zim вы можете например иметь википедию на обычной флешке.

    А книги в fb2, в сжатых архивах.