Пожалуй, мало найдётся в вычислительной технике областей, привлекающих всеобщее внимание, и, вместе с тем, окружённых таким количеством мифов и недопонимания, как длительное архивное хранение данных. Как человек, сталкивавшийся в своей профессиональной практике с актуализацией данных многолетней давности и с организацией долговременных архивов, рискну также высказаться на этот счёт.

Краткое резюме для тех, кому лень читать всю статью: серебряной пули нет.

Для тех, кому интересно более детальное обсуждение вопроса, предназначен дальнейший текст.

Итак, переход к безбумажной информатике, о необходимости которого столько говорили большевики, свершился. Объём данных на цифровых носителях удваивается каждые два года. Мало кто из современной молодёжи заботится распечатывать интересные тексты или изображения (сам я, относясь к среднему возрасту, тоже пренебрегаю бумагой, уже практически разучился писать от руки, и предпочитаю скачать книгу из интернет-библиотеки на смартфон, нежели сходить за её бумажной версией к шкафу в соседней комнате). Но, к сожалению, цифровые удобства имеют и оборотную сторону, заключающуюся в проблеме долговременного хранения.

Говоря о долговременном хранении, я подразумеваю горизонт планирования от 25 до 100 лет, то есть такой временной период, который позволит современному человеку, сохранив какую-то частную информацию в молодости, затем иметь возможность вернуться к ней на протяжении своей жизни, а то и передать потомкам (к вопросу о вынесенном в заголовок примере с прабабушкиным селфи). Для бизнеса такое долговременное хранение имеет более узкоспециальное значение, поскольку очень немногие бизнес-процессы работают с данными на подобных временных периодах (хотя организации с такими процессами, безусловно, существуют и обычно отчётливо осознают свою специфику).

В первом приближении, можно выделить три уровня рассмотрения данной проблемы, внимание к которым широкой публики убывает от начала к концу списка.

1. Физическая сохранность носителей и удельная стоимость хранения.

Это наиболее широко известный уровень рассмотрения, которым и ограничиваются многие публикации. Не будем переливать из пустого в порожнее и повторять общеизвестные вещи, и вкратце резюмируем, что на сегодняшний день в повседневной пользовательской практике используются три категории архивных носителей:

– Оптические диски (CD, DVD, BD и т.п.) и флеш-накопители. Принято считать, что данные на таких носителях могут разрушаться через несколько лет, и, во всяком случае, через 25 лет её, скорее всего, вряд ли удастся прочитать.

– Магнитные носители (жёсткие диски и ленты). Тут имеется выход на большой флейм между сторонниками дисков и лент, в котором, вкратце говоря, дисковики упрекают ленточников в экзотичности, низкой скорости произвольного доступа и высокой стоимости устройств чтения-записи, а ленточники упрекают дисковиков в уязвимости носителей, высоком энергопотреблении и высокой удельной стоимости хранения для больших объёмов данных. Не вдаваясь в справедливость тех или иных аргументов и контраргументов в диско-ленточной войне, отметим, что архивные магнитные носители в настоящее время зачастую имеют заявленное время сохранности не менее 30 лет, хотя, конечно, это число получено путём экстраполяции результатов интенсивных тестов, а не путём натурного 30-летнего наблюдения.

– Сетевые архивы. Тут идея состоит в том, чтобы перепоручить хранение своих данных специально обученным людям в специально уполномоченных фирмах, а самому рассматривать такое сетевое хранилище как чёрный ящик с интерфейсом в виде интернет-сервиса. Плюсом данного решения является то, что, несомненно, профессионально предоставляющие подобные услуги фирмы способны гораздо лучше позаботиться о сохранности данных, чем рядовой пользователь (причём делать это потенциально неограниченно долго), а заодно и обеспечить низкую стоимость хранения за счёт масштабного эффекта. Минусом являются не зависящие от пользователя риски. Основным риском для долговременного хранения информации в сетевом архиве является внезапная ликвидация бизнеса предоставляющей услугу фирмы, от чего, к сожалению, никто не застрахован. Дополнительным риском является потенциально возможное в будущем установление органами различных государств и интернет-провайдерами пограничных, контентных, форматных или иных ограничений на передачу информации через сеть Интернет, которые могут сделать невозможным доступ к удалённому архиву.

Итак, рассуждая умеренно пессимистично, можно прийти к выводу, что физическая сохранность данных в настоящее время может быть обеспечена с контролируемыми рисками примерно на 30 лет вперёд.

2. Техническая совместимость носителей.

Этот вопрос рассматривается гораздо реже. Давайте, воспользовавшись полученной ранее оценкой физической сохранности, проведём мысленный эксперимент и прикинем, на какой носитель могла бы записать свои цифровые данные даже не моя прабабушка, а всего лишь моя мама 30 лет назад.

Итак, 30 лет назад шёл 1986 год. В зависимости от своих технических предпочтений, пользователь того времени мог бы счесть наиболее заслуживающим доверия носителем для сохранения данных: 9-дорожечную магнитную ленту большого компьютера; широко используемые на персоналках 5- или 8- дюймовые дискеты; или новейшую по тем временам 800-килобайтную 3-дюймовую дискету для дисковода фирмы Sony от компьютера Macintosh (несовместимую с более поздними 3-дюймовыми дисководами на 1.44 мегабайта). Даже предположив идеальную физическую сохранность носителей, чтение в наше время с любого из них, конечно, возможно, но обойдётся в значительные затраты времени и денег, с которыми вряд ли кто станет связываться ради маминого селфи. Ещё через 30 лет технологии чтения этих носителей, вероятно, будут окончательно утрачены.

Может быть, это только 30 лет назад из-за младенчества вычислительной техники всё было так плохо, а сегодня мы свободны от этой проблемы? Давайте посмотрим на современные носители информации.

В качестве долговременного архивного носителя информации в настоящее время чётко позиционируются магнитные ленты стандарта LTO. Мир LTO устроен таким образом, что каждые 2-3 года выпускается новое поколение стандарта, отличающееся примерно удвоенной ёмкостью, и выпускается оборудование под это поколение (сейчас действующим стандартом является LTO-7). Однако, стандарт LTO регламентирует (а общепринятая практика производителей обеспечивает) совместимость стримеров LTO с носителями для чтения только на два поколения назад, а для записи – на одно поколение. Это значит, что современный стример LTO-7 способен читать только кассеты LTO-7, LTO-6 или LTO-5, а современная кассета LTO-7, будучи записана сегодня, окажется несовместимой со стримерами LTO-10, появление которых можно прогнозировать примерно на 2022 год. Уже через 10 лет (в 2026 году) современная кассета не будет читаться ни одним имеющимся на рынке устройством. В этом плане, гарантии 30-летней сохранности самой кассеты носят несколько романтический характер.

Допустим, мы встанем на сторону дисковиков и запишем информацию на современный жёсткий диск SATA или SAS. Этим стандартам интерфейса и так уже более 10 лет, и крайне маловероятно, что они продержатся ещё хотя бы 10. То же самое относится к USB в современном виде. Отсутствие фактической почвы делает все рассуждения об отдалённом будущем физических интерфейсов крайне спекулятивными, но можно предположить, например, что через 10-20 лет интерфейсы дисковых устройств вполне могут стать оптическими, и в таком случае будут несовместимы с современными устройствами уже на уровне среды передачи данных.

Исходя из вышесказанного, крайне маловероятно, чтобы современный магнитный носитель мог быть распознан каким-либо штатным компьютерным устройством через 30 лет.

Хранение данных в сетевом архиве позволяет переложить указанные проблемы на специально обученных людей, но остаётся имеющим указанные в предыдущем разделе риски. Уместно напомнить, что большинство лидеров компьютерного рынка 30-летней давности к настоящему времени ликвидировалось, за несколькими исключениями вроде IBM, Apple и Microsoft, которые, однако, с тех пор очень значительно поменяли сферу деятельности.

3. Совместимость форматов данных.

Об этом вопросе пишут совсем редко.

Так как 30 лет назад всё-таки на самом деле не было цифровых селфи, то давайте представим, что нам из 1986 года попал простой текстовый электронный документ, и что нам удалось удалось решить все технические проблемы и его записать в файл современного компьютера.

Ввиду большого разнообразия компьютерного мира в 1986 году, вариантов тут может быть очень много, поэтому рассмотрим только некоторые:

– от пользователя мейнфрейма 1986 года нам на диск может попасть образ виртуальной колоды перфокарт с фиксированными 80-символьными записями в кодировке EBCDIC (ДКОИ);

– от пользователя Macintosh мы получим документ ClarisWorks;

– от пользователя PC мы получим, например, документ досовского текстового редактора ChiWriter или WordPerfect, хотя при удаче это может оказаться и обычный текстовый файл;

– и только с пользователем Unix нам практически точно повезёт, и мы, вероятно, получим от него обычный читаемый текстовый файл (в кодировке русского языка koi8-r или ещё похуже).

Это ситуация с наиболее банальным видом документа, простым текстом. Если же представить, что к нам попал, например, чертёж из 1986 года, можно практически со стопроцентной уверенностью утверждать, что никак интерпретировать этот файл мы сейчас не сможем.

На чём же базируется наша неявная уверенность, что мы сможем, вырвавшись на полчасика из обьятий Альцгеймера, показывать своим скучающим внукам невнятные фотки из отпуска 2016 года? Допустим, при известном оптимизме можно представить, что формат jpeg, ввиду его огромной распространённости в современной жизни, можно будет как-то отконвертировать в форматы изображений, которые будут приняты в светлом альцгеймеровом будущем (хотя исторических прецедентов такого длительного срока жизни формата не было). Но уж точно это не будет относиться ни к raw-форматам фотокамер, ни к форматам офисных документов вроде doc/docx, ни к электронным книгам fb2/epub и т.д., просто из-за того, что нет субъекта, имеющего цель и возможность обепечить неограниченную совместимость такого формата.

4. Что же делать?

Поддержание цифрового архива в актуальном состоянии является достаточно сложной и трудозатратной деятельностью, независимо от его назначения и используемых технических средств. Эта деятельность должна включать полный пересмотр архива каждые несколько лет, с переносом всего его содержимого на новые носители данных, а также, при необходимости, конвертированием каждого устаревающего по формату документа в новый, актуальный формат.

Можно допустить, что, поскольку мало кто как из частных пользователей, так и из юридических лиц возьмёт на себя труд заниматься такими вещами, то мы, в таком случае, находимся на пороге нового этапа развития человеческого общества, которое будет характеризоваться отдельными чертами возврата к дописьменному состоянию, когда достоверные данные о личном и общественном прошлом в большинстве своём станут утрачиваться за время жизни одного поколения, а оставшиеся немногие актуальные цифровые архивы станет достаточно легко фальсифицировать ввиду значительной степени их централизации.

На этом лирическое отступление можно закончить, а (банальным) практическим выводом может являться то, что ведение любого архива требует активных занятий по поддержанию актуальности составляющих его данных, а не только пассивного сбрасывания файлов в информационную кучу. Люди, которые занимаются таким осознанным ведением архивов, в том числе и в частной жизни, существуют и вполне известны, и ничто не мешает присоединиться к их практикам.

А селфи для правнуков лучше всё-таки на всякий случай напечатать на фотобумаге.

Комментарии (77)


  1. grishkaa
    21.04.2016 03:03
    +2

    Проблемы совместимости, имхо, надуманные по большей части.
    Старый софт всегда можно запустить на эмуляторе соответствующей ОС в случае несовместимости архитектуры процессора или поставив её в виртуалку в случае совместимости.
    Для старых разъёмов обычно всегда есть переходники для подключения к современным, например, с USB на последовательный порт или с SATA на IDE.


    1. vikarti
      21.04.2016 04:45
      +2

      на эмуляторе? это если к моменту появления эмулятора не утеряны носители с этим софтом.
      для примера автора с текстовым документом — когда появились эмуляторы на x86? 1998 год? ChiWriter с WordPerfect десятилетней давности на тот момент придется искать. А эмуляторы MacOS (для ClarisWorks) они вообще есть?

      но вообще проблему люди явно осознают — тот же стандарт PDF/A специально сделан для долговременного хранения данных.
      да и сейчас все же проще чем 30 лет — есть OpenSource ПО поддержки базовых форматов, которое можно адаптировать под новые платформы.


      1. vadimr
        21.04.2016 08:44
        +1

        По поводу эмуляции совершенно с Вами согласен.

        Что касается опенсорсного ПО, то, даже предполагая, что через 30 лет вы ещё где-то сможете скачать исходники этого ПО (что само по себе не факт), их компиляция станет непростым делом.

        Разумеется, есть отдельные люди и организации, которые осознают проблему, в том числе хранят свои данные в формате PDF/A. Но в широких кругах пользователей мало что делается.


      1. AdmAlexus
        21.04.2016 10:56
        +1

        А где гарантия, что тот же PDF/A будет читаться через 30 лет? Точнее, что будет софт, который его поддерживает?


      1. Merlok
        21.04.2016 12:47
        +1

        Был у меня когдато винт от IBM XT. Даже погуглил как называется формат ru.wikipedia.org/wiki/ST-506#ST-412.
        Сейчас стоит подпирает кровать)
        Чето мне кажется что сейчас его подключить никак) а было это не так давно…


        1. MinamotoSoft
          23.04.2016 14:50

          Отчего же — никак? Есть (пока) ОЕМ-мануал, паяльник в руки и…
          Было бы желание и деньги:
          bitsavers.trailing-edge.com/pdf/seagate/ST412_OEMmanual_Apr82.pdf
          А тут рекомендации как это сделать:
          books.google.com.ua/books?id=2JuZAgAAQBAJ&printsec=frontcover&hl=uk&source=gbs_ge_summary_r&cad=0#v=onepage&q&f=false


    1. vadimr
      21.04.2016 08:32
      +1

      Мне приходилось зарабатывать на хлеб с маслом, в то числе, и внедрением эмуляторов, и могу сказать, что это не такое простое дело на продолжительных временных интервалах. Например, я знаю ряд людей, способных запустить эмулятор типичной для 30-летней давности платформы OS/370 (возможно, я и сам по старой памяти способен его настроить и провести загрузку), но этот навык выходит за рамки общедоступного даже среди людей, лично в своё время работавших с этой системой. Что ещё хуже, программное обеспечение для такой эмулируемой среды может оказаться крайне сложно найти. Или адаптер для подключения какого-нибудь устройства 30-летней давности, той же ленты большой машины или 8-дюймового дисковода – как я написал в статье, пока ещё обеспечить можно, но долго, сложно и дорого.

      А адаптер с USB на IDE можно найти (хотя уже с некоторым трудом) просто потому, что времени мало прошло. И обычно, к сожалению, такие вещи не стекируются (то есть адаптер с USB на IDE, скорее всего, не будет работать с гипотетическим адаптером с IDE на MFM, так как в первом случае будет использоваться какой-нибудь поздний вариант IDE, а во втором – ранний).


    1. vadimr
      21.04.2016 09:15

      Проецируя на проблемы потомков из 2046 года, конечно, запустить Windows им будет проще, чем нам OS/370, но при попытке запустить под Windows конкретную нужную им программу они, скорее всего, столкнутся с несовместимостью версий библиотек, им будет предложено обновить систему с давно закрытого сервера windowsupdate (или, наоборот, скачать новую версию программы у давно забывшего о ней разработчика), и на этом археологический экскурс имеет неплохие шансы закончиться.


    1. tmk826
      21.04.2016 10:07
      +1

      Мы занимаемся xранением и архивацией данных уже много лет. Совместимость данных — это проблема номер один!.. Номер два — это юридический аспект, кому принадлежат права.


  1. maxpsyhos
    21.04.2016 08:20

    Частично проблему совместимости форматов можно решить «отуплением» данных. Например, картинки хранить в BMP. Формат настолько простой и примитивный, что любой студент-программист напишет абы-ка работающий просмотрщик за пару часов, а коммерческого уровня программу за неделю. Правда тогда архив «слегка» потяжелеет.


    1. Dioxin
      21.04.2016 08:44

      BMP кстати архиватором сожмется вполне здорово.


      1. dimykus
        21.04.2016 11:21

        Только вот архиватор приносит всё те же проблемы что и jpeg


        1. merlin-vrn
          21.04.2016 11:25
          +1

          zipу сколько лет? А на каком году жизни его наконец-то встроили в популярную ос?


  1. lATEuCTl
    21.04.2016 08:20
    -4

    предпочитаю скачать книгу из интернет-библиотеки на смартфон, нежели сходить за её бумажной версией к шкафу в соседней комнате
    Надеюсь, вы утрируете. С покупкой соглашусь — все-таки книга на бумажном носителе обычно дороже электронной (это если еще не учитывать пиратство), но я всегда предпочту бумажную, если будет возможность.


  1. cy_job
    21.04.2016 08:20
    -2

    Ни кто не мешает раз в 10 лет производить ревизию(уж за такой срок экстремальных непоправимых революций думаю не случится), переносить на новые носители. А про форматы и интерфейсы согласен с комментарием выше, переходники и эмуляторы никто не отменял. Есть куча примеров, как даже сейчас люди запускают железки и софт 30-40 летней давности.


    1. vadimr
      21.04.2016 08:36

      Никто не мешает, и именно так и надо делать. Но мало кто беспокоится так поступать.

      По поводу запуска эмулятора софта и железа 30-40 летней давности – см. мой комментарий выше. Это возможно, но непросто, если имеет конкретную прикладную цель, а не просто демонстрирует работоспособность эмулятора.


      1. DenimTornado
        21.04.2016 09:58

        Ну уж селфи-то сконвертируем и перенесём ;-)


    1. ivanych
      22.04.2016 00:22

      Для этого нужно много сил и времени. Сколько копий архива наберется за 10 лет? Допустим, вы делаете копию каждый месяц и она занимает 500 гигабайт. 120 штук 500-гигабайтных копий довольно заморочно переносить куда-либо, даже раз в 10 лет.

      У меня, к примеру, данные меняются часто, я делаю инкрементальные копии каждый час, так что у меня их тысячи. Разгребать всё это будет ох как лениво…


      1. teifo
        22.04.2016 11:38

        Это все надуманные проблемы. Что мешает создать ресурс, которые отслеживает устаревание данных и программку которая по сигналу с ресурса ваши данные переносит в актуальный формат ( о статусе формата данных «платный, бесплатный, ставший платным, ставшим бесплатным» вам сообщается и предлагается выбор). Все можно, вопрос только надо ли это кому бы то ни было.


        1. ivanych
          22.04.2016 11:45
          +1

          Кто будет поддерживать этот ресурс? В статье же приведены примеры — очень мало какие какие компании пережили испытание временем. Создатели такого ресурса сами через 30 лет исчезнут, а с ними и ресурс. В долгосрочной перспективе надеяться не на кого.

          Вон, давеча тут же, на Хабре, пробегала статья о Вояджере, который сейчас, спустя 30 лет полета, некому обслуживать — все разбирающиеся в буквальном смысле умерли, а документация потерялась. И это в NASA! Что уж говорить о домашнем пользователе…


          1. teifo
            23.04.2016 03:34

            Понятное дело что это никому не надо, как и разрабатывать технологии с учетом длительного времени поддержки. Я лишь о том, что люди сами создают себе проблемы, которые потом будут героически решать. Никто с небес не запрещает делать так или иначе.


            1. vadimr
              23.04.2016 14:42

              Никто с небес вообще не запрещает вести праведную жизнь :)


      1. cy_job
        26.04.2016 12:40

        500 гигов каждый месяц(50 000 фото отличного качества\ почти 2000 в день= 60 ежедневно) видимо этот основное и единственное занятие, на ПРОСМОТР 6 млн фото за 10 лет думаю уйдёт немало времени…
        п.с. если не устраивает чужой вариант, кроме как сказать — ваш метод дерьмо и меня не устраивает, правильно было бы предложить свой гениальный.


        1. ivanych
          26.04.2016 12:51

          Во-первых — почему фото? Видео (которое занимает горааааздо больше места) бекапить не надо? И это я еще не говорю о всех остальных файлах.

          Во-вторых — что за странный расчет? Это не 500 новых гигов за месяц, а 500 гигов всего на конец месяца, в числе которых новых, допустим, 10 гигов. Но для долгосрочного хранения бекапить только новые (читай — инкрементальный бекап) нельзя, высок риск сломать цепочку потерей промежуточного файла.


  1. Andrusha
    21.04.2016 08:54

    А что не так с USB в современном виде? Думаете, разъём USB Type A отомрёт или обратную совместимость в новых контроллерах 3+ уберут? Я бы не волновался насчёт его будущего, мне кажется, что он ещё всех нас переживёт — как RS-232.


    1. vadimr
      21.04.2016 09:04

      Думаю, сначала отомрёт разъём USB A, а в будущем и весь стандарт. Сейчас сложно судить, вытеснит ли USB A уже теперешний USB C, но такое тоже возможно.

      А RS-232 жив за счёт того, что в своём простейшем виде (RxD/TxD) это просто сырой поток битов, с которым не надо ничего делать, кроме старт-стопов. Но уже с какими-нибудь сигналами DCD или RI сейчас мало какое устройство сможет работать (а простые конвертеры RS-232 в USB часто не поддерживают даже DTR/DSR).


      1. gorbln
        21.04.2016 11:37

        а простые конвертеры RS-232 в USB часто не поддерживают даже DTR/DSR

        Во всех конвертерах это поддерживается. Просто китайцы, которые разводят переходники, на эти контакты забивают. Ну и, плюс, есть контрафакт, например, фейковые FTDI, в которых этот функционал выпилен.
        RS-232 жив не засчёт тупости, а засчёт широкой распространённости в индустриальной сфере. И никуда он в ближайшие лет 20 ещё не денется. Это простой интерфейс с высокой помехозащищённостью засчёт высокого напряжения в линии. Позволяет тянуть длинные линии без дополнительных затрат.
        А RS-485, как мне кажется, вообще будет вечно. Ибо он прекрасен.

        Ну и уж сюда напишу.
        Мне кажется — взгляд в статье как-то уж совсем категоричен. Всё можно будет открыть через 10-20-30 лет.
        И JPG никуда не денется, и уж точно будет поддерживаться смотрелками. И DOC, TXT, и прочее можно будет открыть.
        Ну например: был такой довольно популярный графический формат — PCX. Сейчас его открывают практически все смотрелки. Хотя я не припомню, чтобы в последние лет 15 я с ним сталкивался.
        BMP, TGA, всякая прочая некрографика — тоже открывается.

        Более того, формат Autocad 10 (не 2010, а просто 10) — можно открыть и сейчас, причём даже не думая. А это, помолясь, 1988 год (!). Скоро как раз 30 лет будет. Насчёт более ранних версий — утверждать не берусь (у меня нет документов, созданных в этих версиях) — но, почему-то мне кажется, что и с более ранними версиями проблем не будет.
        То же касается старого PDF-а, всяких там DJVU.


        1. vadimr
          21.04.2016 11:48

          Я не силён в САПР, но хотелось бы уточнить. У Вас есть опыт реального открытия документов 1988 года в Autocad, или Вы ориентируетесь просто на то, что формат значится в списке поддерживаемых? Как показывает практика, между этими вопросами обычно существует большая разница.


          1. gorbln
            21.04.2016 11:57

            Есть, конечно.
            Скажем так — документы, созданные в АС10, нормально открываются в АС2000. Это точно, ибо именно так я перетаскивал документы между институтом и домом в 2004 году. АС2000 сейчас можно установить.
            Я вечером посмотрю, если сохранились чертежи из института в формате R10 — попробую открыть в современном АС2012. Но шансов на то, что сохранились, мало.


      1. Andrusha
        21.04.2016 13:12

        Ну, пока на горизонте даже близкой альтернативы этому стандарту нету. Thunderbolt дороговат, да и избыточен для многих задач, а Firewire де-факто уже загнулся.
        Вытеснят Type-A? Ну и фиг с ним, даже если предположить, что китайцы дружно производство свернут, и даже на ebay не найти будет, то всё равно можно переходник на Type-C из подручных средств сваять.


        1. vadimr
          21.04.2016 13:18

          Пока альтернативы точно нету.


    1. Kedrovskiy
      21.04.2016 11:20

      придут к какому нибудь общему формату разьема-интерфейса для «всего» — уже давно делается такая попытка тем же эпплом — диплейпорты, фаирварь и прочее. на фоне развития технологий усб уже не так и нужно — да — в телефоне он есть, но я кроме зарядки ничего к нему не подключаю — трансляция на телек по wifi, данные в облаках. с тем же вифи тоже не все гладко — старая хр имеет ограниченную поддержку протоколов шифрования…


  1. merlin-vrn
    21.04.2016 10:05
    +2

    Проблема сохранности форматов существует только для проприетарного ПО, обвешанного всякими онлайн-фичами, менее актуальна для ПО, не требующего никакой активации или чего-то подобного для своей работы и может быть полностью устранена для FOSS. Объясняю.

    Архивировать нужно софт вместе с данными. Даже если вы сможете интерпретировать, к примеру, проект Ardour, в котором использовались фильтры Guitarix2, вы не получите то же самое звучание и эффект фильтров на новой версии Guitarix2. Они просто не гарантируют, что новая версия будет звучать так же, как предыдущая. Поэтому бекапим софт вместе с проектом. Если мы про опенсорс, то можно забекапить исходники, и мы совершенно точно сможем потом воспроизвести именно тот же самый софт.

    То же самое касается RAW-файлов цифровых камер. Я вот точно знаю, что формат CR2 моей камеры EOS650D понимает Darktable 2.0 (и более ранние версии), вместе со своими библиотеками. Я практически уверен, что смогу собрать Darktable на более новой системе, или хотя бы заказать кому-то портирование её (хотя бы частично, в достаточной степени) на новую платформу — поскольку исходники открыты, я могу увидеть логику обработки прямо в виде исходного кода на C или C++. Я просто храню исходники Darktable (и тематических библиотек, от которых он зависит) рядом с архивом

    Ну, и JPEG тоже никуда не денется. Даже если его сменят другие форматы в обиходе, он будет доступен. Кто-нибудь помнит сегодня PCX, или видео, закодированное Indeo? Всё это по-прежнему можно посмотреть, хотя первый формат уже отметил своё тридцатилие, второй — двадцатилетие.

    Куча проектов имеется в сети по воссозданию эмуляторов древних компьютеров. А это как раз именно то, что нужно, чтобы получить доступ к архиву тех времён (при наличии в архиве помимо данных собственно софта). И нет никаких оснований предполагать, что эти проекты не будут существовать — наоборот, этот подход только развивается.

    И вернусь к своему первому абзацу: архивировать MS Office довольно бесполезно — даже если вы запустите через 100 лет инсталлятор, сервис онлайн-активации по древнему протоколу IPv4 просто уже к тому времени не будет существовать, как и сам протокол. Свой DOCX вы не разберёте. То же самое касается Photoshop и кучи других программных продуктов. А вот архивировать LibreOffice, GIMP, LibreCad и KiCad разумно: активация не требуется. Архивируйте документы в ODF и других открытых (по-настоящему, а не как OOXML) форматах, для которых имеется свободное ПО для интерпретации — шансы прочитать такой архив через 100 лет будут гораздо выше!


    1. vadimr
      21.04.2016 10:50
      +2

      Думаю, что малой кровью собрать современные исходники через 30 лет можно будет, только если сейчас приложить к ним дистрибутив операционной системы, в котором они собираются без необходимости что-то докачивать, и в будущем запустить этот дистрибутив на эмуляторе.


      1. merlin-vrn
        21.04.2016 11:26

        именно так и надо бекапить. И время от времени ревизировать носители.


    1. gorbln
      21.04.2016 11:43

      Кто-нибудь помнит сегодня PCX

      Судя по практически идентичным комментариям — я помню =)


    1. gorbln
      21.04.2016 11:48

      даже если вы запустите через 100 лет инсталлятор, сервис онлайн-активации по древнему протоколу IPv4 просто уже к тому времени не будет существовать, как и сам протокол.

      Понимаю, что все здесь такие мегаправильные и фу-фу-фу, но всё-таки:
      Бекапить софт, который требует онлайн-активации, надо с креком. Да, не очень прилично. Зато работать будет.


  1. Ogra
    21.04.2016 10:07

    Так если почитать: о ужас, мы все потеряем. Но нет.

    20 лет назад, в 1996 году уже были jpeg, txt, doc, pdf, zip, rar и сейчас нет никаких проблем прочитать файлы, созданные тогда, и через 10 лет не будет. И через 20. И через 40.


    1. vadimr
      21.04.2016 10:42
      +1

      На мой взгляд, в этом рассуждении содержатся две методические ошибки.

      Во-первых, почему Вы выбрали именно 1996 год? Вы просто взяли удобный промежуток времени, когда платформа PC, которая сейчас находится вблизи окончания своего жизненного цикла, ещё только начинала распространяться. Поэтому, в рамках одной этой платформы, за 20 лет многие программы выжили. Но это не даёт никаких оснований надеяться на их выживание ещё через 20 лет, после выхода PC из употребления. Впрочем, можно попробовать уже и сейчас открыть rar архив на iPad.

      Во-вторых, Вы задним числом выбрали выжившие форматы того времени. Напомню, что одним из стандартных форматов для распространения текстов в 1996 году (в частности, единственным разрешённым в фидошной файлэхе, через которую распространялись книги) являлся HA, как наиболее эффективный для текстов архиватор того времени. Уже сейчас не так просто открыть такой архив. Jpeg в 1996 году тоже был не бог весть каким популярным форматом, так как он проигрывал в качестве изображения и времени обработки и не давал значительных преимуществ в объёме на тогдашних низких разрешениях.


      1. Ogra
        21.04.2016 11:14
        +1

        платформа PC, которая сейчас находится вблизи окончания своего жизненного цикла


        Ой, правда? Надо выбросить свой комп и купить срочно айпадик.


        1. vadimr
          21.04.2016 12:51

          Выбрасывать не обязательно, но мировой рынок PC сокращается с 2011 года.


          1. quwy
            22.04.2016 09:11
            +1

            Это говорит лишь о том, что хипстеры и блондинки перешли на технику, соответствующую их потребностям (делать селфи и лайкать котиков).


            1. vadimr
              22.04.2016 09:17

              Ну, это вообще естественное направление прогресса. 30 лет назад значительная часть программистского сообщества считала недокомпьютерами всё, что потребляет меньше ста киловатт, а в одной из имеющихся у меня книг начала 1980-х годов Unix названа “системой для домохозяек” (буквальная цитата), так как не заставляет заботиться о расположении элементов языка управления заданиями в колонках виртуальной перфокарты. С годами всё упрощается.


      1. Areso
        21.04.2016 11:15
        +1

        iPad, прекрасный сад, огороженный высокими стенами. Или не сад, но стены там точно есть. Rar архив отлично откроется на android-устройствах.


      1. merlin-vrn
        21.04.2016 11:30

        iPad? Пожалуй, не сущестует устройства более защищённого от любой возможности создания и воспроизведения любых мало-мальски надёжных долговременно восстановимых архивов.


  1. DnAp
    21.04.2016 10:26
    +1

    Я не так давно думал как бы мне собрать и сохранить генеалогическое дерево своей семьи. Застрял на уровне софта. Онлай сервисы и проприетарные программы я не рассматривал по понятным причинам. Опенсорсное если и есть, то либо совсем сырое, либо отвратительного качества и все не особо поддерживаемое.
    В итоге экселевская таблица в которой не так просто разобраться как хотелось:(


    1. Andrusha
      21.04.2016 12:41

      И чем же вам проприетарные программы и онлайн-сервисы не угодили? Многие из них поддерживают формат GEDCOM, которому уже больше 30 лет.


      1. DnAp
        21.04.2016 17:28

        Спасибо, был уверен что каждый пилит свой несовместимый формат и о GEDCOM не слышал.


        1. Andrusha
          21.04.2016 19:42

          Все действительно пилят свои проприетарные форматы, так как они позволяют юникодом писать, фотки цеплять и многое другое, но импорт/экспорт в GEDCOM у большинства присутствует.


    1. Mr_Destiny
      21.04.2016 15:22

      Plain-text база данных с обвязкой на питоне? Даже если питон умрет, текст можно прочитать самостоятельно, когда появится необходимость. Как заметил (но не отметил) автор, текстовые файлы сохранились с давнего прошлого. И мне не верится что поддержка ASCII выпилится в обозримом будущем. По крайней мере, не внезапно, т.е. пройдет больше 10 лет чтобы совсем пропало


  1. prostofilya
    21.04.2016 10:52

    По поводу универсальных интерфейсов и эмуляторов, имхо, не стоит париться, этим просто однажды займутся нейросети…


  1. sapl
    21.04.2016 10:58
    +1

    Банальная задача — сохранить свои фото для своих внуков практически не решаема для обычного человека. С каждым обновлением/потерей телефонов, планшетов, ноутбуков что-то по чуть-чуть теряется.
    hd, флешки, диски — все ломается рано или поздно. Облачные хранилища сменяют друг друга (сегодня есть Picassa — завтра нет)

    Единственный вариант — распечатывать и хранить фото-альбомы.
    Они пролежат и 50 и 100 лет при должном хранении (проверено на бабушках)


    1. amarao
      21.04.2016 11:07

      Ошибка выжившего. Сколько фотографий было профукано и мы про это не знаем?


      1. Areso
        21.04.2016 11:21

        Можно делать по 2-3 принта каждой важной фотографии, и хранить один экземпляр у владельца, остальные у ближайших друзей. Можно ламинировать их.
        Бэкапы никто не отменял, вне зависимости от типа носителя.


        1. amarao
          21.04.2016 11:26

          Мне проще иметь rsync всего важного. В то, что rsync не протухнет в течение ста лет я уверен (с поправкой на термоядерную войну и обяъвления программирования формой экстримизма). Просто иметь rsync всего важного на всех доступных машинах — и оно всегда будет «свежим». Старые форматы отлично читаются новым софтом (это заметно по тому, как хорошо сейчас играются viv'ы и rm'ы — много лучше, чем игралось во времена, когда они были актуальны).


        1. wladyspb
          21.04.2016 12:13

          Вот сейчас у меня около 40 гигов фотоархив. Я не хочу знать, сколько стоит распечатать его ВЕСЬ, и сколько он будет весить в килограммах. А если печатать только избранное — тогда и смысла нет, это не сохранение всей информации, это сохранение кусочка.


          1. Areso
            22.04.2016 07:53

            Знаете, чем отличаются сегодняшние цифровые фотоальбомы (фотоархивы) от ранних? К примеру, раньше была 1 фотография в 3 года, 1 фотография на школьный выпускной общая, 1 фотография личная (на выпускной же), возможно, пара таких же фоток по выпуску из ВУЗа, две-три фотографии со свадьбы, 2-3 фотографии с детьми, 2-3 фотографии с внуками. Итого — дюжина-две фотографий за всю жизнь.
            Сейчас люди столько нащелкивают фотоаппаратами (мобильными или не оч) буквально зайдя покушать пиццы после работы. И ценности 100500 фотографий не имеют.
            И да, я Вас отлично понимаю. У меня тоже накопилось приличное число фотографий, по большей части сделанных не мной, но надо заставить себя взять и выбрать из каждого альбома одну-две наиболее удачные (что довольно сложно), а остальные отправить в dev/null


            1. merlin-vrn
              22.04.2016 10:07

              Знаете, чем отличаются сегодняшние цифровые фотоальбомы (фотоархивы) от ранних? К примеру, раньше была 1 фотография в 3 года, 1 фотография на школьный выпускной общая, 1 фотография личная (на выпускной же), возможно, пара таких же фоток по выпуску из ВУЗа, две-три фотографии со свадьбы, 2-3 фотографии с детьми, 2-3 фотографии с внуками. Итого — дюжина-две фотографий за всю жизнь.

              Это может в начале прошлого века так было, а у моих мамы и папы уже сотни фотографий.
              И да, я Вас отлично понимаю. У меня тоже накопилось приличное число фотографий, по большей части сделанных не мной, но надо заставить себя взять и выбрать из каждого альбома одну-две наиболее удачные (что довольно сложно), а остальные отправить в dev/null

              «Посмотри соседний кадр.»


            1. wladyspb
              22.04.2016 11:56

              Знаете, всё относительно. Когда у меня был плёночный фотоаппарат, у меня накапливалось 1-2 плёнки за год, которые я потом оцифровал. потом, уже на цифровую мыльницу, было сделано намного большее количество фоток. И просматривая фото 20-ти и 10-ти летней давности, я жалею что 20 лет назад многие события которые я вспоминаю с теплом запечатлены всего на паре фоток. В более поздних альбомах конечно бывает избыточность — один день рождения моей хорошей подруги был заснят на три или четыре фотика, от каждого по 50-200 фоток) Но и от этих фотографий я бы не стал избавляться, хотя похожие кадры проредить можно.


              1. merlin-vrn
                22.04.2016 12:50

                У меня иногда 1-2 плёнки в месяц выходит, не считая цифровой зеркалки -_-


    1. Kedrovskiy
      21.04.2016 11:20
      +1

      ага, а пожар — у меня такое было на памяти, когда погибли и пленки и фото разом. современные фотолабы тоже гонят еще ту фигню, которые выцветают очень быстро


    1. wladyspb
      21.04.2016 12:13

      Фотки лежат, да. Портятся понемногу. Но не быстро. Однако я лучше залью их в облако, а если у меня возникнут сомнения в облаке — ещё в одно) + архив на компе мигрирующий с винта на винт.


      1. rvt
        21.04.2016 18:28

        Согласен. У меня примерно такой же объем. Все оно сейчас на моем винчестере + две копии на ноутбуках жены и дочери (бэкап-программа сама мониторит изменения и делает зеркалирование). И в двух бесплатных облаках это все еще лежит. Авось не пропадет!
        А насчет форматов… Что ж, JPEG, думаю, не вечен или, там, AVI с DivX. Но появится что-то новое и появятся конвертеры в это новое из старого. И конвертируем тогда с тем же битрейтом…


    1. Irgen
      21.04.2016 12:22

      А как вам вариант взять свой старый ноутбук, положить его в герметичный металлический ящик, заполненный нейтральным газом, туда же положить запасной винт с копией того, что в самом ноуте? Если его хранить достаточно аккуратно, то мне кажется он будет более защищен по сравнению с бумажным фотоархивом, посмотреть фотки можно будет прямо на нем.


      1. sapl
        21.04.2016 12:28
        +1

        Т.е после каждого отпуска мне надо откапывать ящик, разрезать болгаркой и добавлять туда еще пару Гб фоток? Или закапывать раз в 5 лет по новому ноутбуку?


        1. Irgen
          21.04.2016 13:28

          Я размышлял с точки зрения возможности просмотра этих фоток в будущем, когда в ходу будут другие архитектуры компьютеров, форматы и интерфейсы. Если заморочиться — можно приделать к этому ящику внешнее питание и сетевой кабель и обновлять архив раз в год, например.


  1. Error_403_Forbidden
    21.04.2016 11:13

    Можно хранить в нескольких облаках одновременно. Если одно облако вдруг закрылось, тут же заливаем копию в новое облако.
    Минус — сложность в синхронизации.


  1. Iremel
    21.04.2016 11:33

    Нужно создать облачный сервис, где эмулируется устаревший софт любых платформ и ОС. Т.е некие готовые виртуальные машины. Если сделать к ним подключение облачных дисков, куда заранее можно залить файлы из своих коллекций и сделать «монтирование» их к этим виртуалкам (взятым напрокат).
    Ну а там уже готовыми средствами можно распаковать, почитать, посмотреть и послушать. А также и конвертировать в более современный формат и забрать потом из облака себе.
    Проблему с устаревшими физическими носителями тоже можно решить. Предприниматели могут предоставить такие услуги, имея у себя устаревшую технику и считыватели. Могут сами переписать на современный носитель, или записать клиенту на диск в интернете. Можно даже не разбираться с форматом данных, а просто скопировать дамп носителя, а уже позже попробовать из этого дампа что-то вытащить специально разработанными средствами.
    Думаю, такие услуги могут быть востребованы.


    1. vadimr
      21.04.2016 11:39

      Такие услуги (по физическим носителям) востребованы и предоставляются, но стоят дороже, чем готов заплатить обычный пользователь. Там много подводных камней, из которых самым очевидным является обычная для устаревших носителей неполная физическая сохранность.


  1. Scf
    21.04.2016 12:11
    +2

    Селфи мамы гораздо проще сохранить через десятилетия, чем чертежи или корпоративные данные. Как? Очень просто. Нужно их держать в папочке на домашнем компьютере + регулярно бэкапить. Когда обновляется железо, папка копируется на новый комп. Когда старый формат данных устаревает, файлы перегоняются в новый формат. Никто же не будет переходить на какой-нибудь jpegV2, не дав доступ пользователям к конвертору данных?

    Мораль — данные живут, только пока ими пользуются. Неиспользующиеся данные деградируют, как и неиспользующиеся программы.


    1. merlin-vrn
      21.04.2016 12:15
      +2

      Педанты скажут: конвертировать в форматы с потерей нельзя, т.к. искажения будут накапливаться. Этакая цифровая деградация архива со временем.

      JPEGv2 уже давным-давно есть, и вы сами догадаетесь, насколько давно, поскольку называется он JPEG2000. И что, заменил он JPEG? Фиг там.


  1. merlin-vrn
    21.04.2016 19:01

    В Cowboy Bebop есть такой момент: Фей Валентайн получает посылку с видеокассетой бетакам. (Дело происходит в далёком будущем, где-то в космосе.) Пока все думают, куда бы кассету вставить, приходит вторая посылка — с плейером и телевизором.

    А на кассете было послание «будущей себе». Оно очень актуально на фоне полной амнезии героини, и видеоролик позволяет вспомнить крупицу той жизни.


  1. Arxitektor
    21.04.2016 19:20
    +1

    Статья понравилась.
    Если поступить просто взять HDD sata3
    На него накидать файлов разных форматов фото, видео, документы.
    И дать вылежаться лет 50-60. Предположим диск успешно пережил анабиоз.
    А теперь попробовать хотя бы подключить к пк 2076 года. Проблемы с совместимостью точно будут.
    Я бы поступил так HDD оставляем к нему переходник на RS-485
    Переходник поднимает собственный сервер с которого можно скачать файлы.
    Проживут ли протоколы передачи столько лет?
    На диске все файлы одного типа привести к единому простейшему формату чтобы смотрелку / конвертиклу можно было написать самому.
    По документации. Документацию распечатать и заламинировать и приложить к диску.
    Хотя ее можно будет найти в интернете.
    Думаю во втором варианте будет проще прочитать файлы спустя 60 лет.

    Можно даже сделать капсулу времени на 50 лет и туда положить различные носители информации а потом откопать и попробовать прочитать что сохранилось.


  1. Vjatcheslav3345
    21.04.2016 22:24

    «организации с такими процессами, безусловно, существуют и обычно отчётливо осознают свою специфику» — я правильно подумал о гидростроителях?, — ведь им нужно хранить чертежи своих шлюзов, плотин и каналов чуть ли не с петровских времен.

    А по поводу нечитабельности — нужно вместе с данными хранить и сведения об их формате или так проектировать форматы, чтобы их устройство легко и без потерь реконструировалось с использованием знания основных законов физики и математики. Для этого нужно договориться и внести эти положения в специальные документы для разработчиков — на манер того, как машиностроители свою продукцию проектируют с учётом требований анатомии человека.
    Ну а бумажные документы мы легко читаем потому что практически не поменялся их стабилизированный формат (язык и алфавит), устройство чтения данных — глазки, исполнитель команд — человек и носитель — бамажка. Грубо говоря мы живём в мире Unix — где всё более или менее унифицированное и меняется медленно, — потому что столкнувшись столетия назад с этими проблемами, наши предки их решили методами унификации, стандартизации. Но вот с древнерусскими летописями такой номер уже не пройдет так легко, не говоря уже о клинописи. А если мы научимся менять и свои устройства чтения данных — всё станет ещё более интереснее


    1. vadimr
      21.04.2016 22:27

      Да много кто. Чертежи-то, собственно, хранятся и в бумажном виде. А вот, например, у современных астрономов весь их материал – это, по сути, электронные видеоролики.


    1. Scf
      22.04.2016 10:56

      Я думаю, что рано или поздно к ГОСТ-ам на чертежи просто добавят еще один — на формат хранения этих чертежей в ЭВМ.


      1. gorbln
        22.04.2016 14:10

        Не дай БоХ!!! Тогда мы все дружно начнём париться «Как бы так нарисовать в том, что удобно, а потом сконвертировать в это ГОСТовское убожество?».
        Никаких гостов. Это реально атавизм. Точнее, не так. ГОСТы должны носить рекомендательный характер — типа, если не хочешь париться — ну вот тебе готовое решение болта, применяй. Хочешь свой винт с ключом в виде сердечка (кстати, мысль) — пожалуйста.
        А то сейчас, чтобы сделать заземление на корпусе устройства, мне приходится применять БОЛТ М4. Болт! Не винт, не с внутренним шестигранником — болт! А всё потому, что кому-то в 75 году было впадлу придумывать, какой должен быть винт заземления, а понятия, что техника может занимать не только шкаф — ещё не пришло. И вот, 2016 год, всё на нержавеющем крепеже, и посреди этого великолепия на корпусе торчит БОЛТ.