Генеалогия существует давно независимо от того, знаем мы о ней или нет.

Впервые генеалогия как наука появилась в Древней Греции. В России термин «генеалогия» в значении «учение о роде» появился в XI веке.

В современной России часть архивов оцифрована, но еще многое предстоит оцифровать. В оцифровке есть свои преимущества и недостатки, с которыми мне лично пришлось столкнуться.

Попытка разобраться в госархивах, картинка из Интернета
Попытка разобраться в госархивах, картинка из Интернета

Достоинства

В удобной домашней обстановке за чашкой чая можно безмятежно анализировать оцифрованные дела, выискивать в рукописном тексте знакомые имена, звания, награды, даты рождения, смерти, женитьбы...

Обмениваться ссылками на дела с родственниками в 5+ колене и такими же участниками этого увлекательного мира познания истории через познание быта своих предков.

Недостатки

Здесь можно сказать только об одном большом недостатке - органы управления архивным делом в субъектах России подчиняются администрациям своих субъектов федерации. И у каждой администрации свой вкус и мнение.

Разберем по порядку

Если запланируете поездку в Рязанский архив, вас ждет увлекательный аттракцион. Запись на следующий месяц открывается каждый 15 день месяца ровно в 9:00. Тут же сайт падает, страница записи может не отвечать до 20 минут и места достаются самым настойчивым или счастливым (здесь есть свой механизм быть в первых рядах). Как повезет.

Но и здесь приключения не заканчиваются. Попав в сам архив, вас мило встречают охранники, все расскажут и объяснят, что нельзя сказать про работников самого читального зала. Наберитесь терпения, наденьте шоры и идите к своей цели, не обращая внимания на эту извращённую "клиентоориентированность". Там не будет жалости к вам. Второй раз приезжать не хочется, но второй и последующие разы не будет такого внимания, будет легче.

После таких увеселительных аттракционов с нетерпением ждешь, когда же Рязанский архив перейдет на ИС и выложит дела в оцифрованном виде.

Каждый архив самостоятельно выбирает ИС, на базе которой будет предоставлять доступ к оцифрованным делам. Это последствия того самого единственного, на мой взгляд, недостатка.

Можно также отметить и следующие последствия:

  • не все архивы спешат переходить на цифру

  • цену доступа к оцифрованным документам регламентирует администрация субъекта

Есть архивы, где час стоит как час парковки в Москве. Удивительно, во Владимирском архиве час стоит 33 рубля (номер региона). Вот такие патриоты трудятся во Владимирской администрации.

Самый дорогой час, по моим сведениям, в РГАДА. На ноябрь 2025 года составляет 90 рублей.

Кто-то скажет, что это несоизмеримо дешевле, чем стоимость поездки в архив и заказ фотографий выбранных листов или целого дела. Соглашусь, но в любом случае это ощутимо для искателей своих корней, кто не зарабатывает на генеалогии, а таковых большинство.

Да, генеалогия всегда была делом, требующим вложений.

Вступление закончилось, приступаем к делу

Если на оцифровку дел и переход архивов на ИС мы повлиять не можем, то с оцифрованными делами надо что-то делать. Невозможно работать с делом, когда страница открывается до 3 минут.

Здесь тоже есть свои исключения, например, Ивановский архив. По моим личным наблюдениям это самый быстрый архив на сегодняшний день. Но он и самый пустой. Есть несколько дел, оцифрованных более 50%. Цена доступа равна 55 рублей/час. Почему не 37?

Рейтинг архивов, с которыми мне пришлось поработать, по убыванию скорости:

  1. Ивановский архив (летает, но мало дел)

  2. Владимирский и Тамбовский архивы (KAISA)

  3. Воронежский и Курский архивы (ARSVO)

  4. Костромской архив (NIOSOFT). Самый медленный (на то есть причина, ниже).

Владимирский и Тамбовский архивы базируются на KAISA. Скорость передачи сносная, если не сказать шустрая. Но цена доступа почасовая. За час в лучшем случае можно успеть просмотреть 3-4 дела. Оплата производится поэтапно, сначала вносятся средства на абонемент, а потом можно эти средства активировать. С момента оплаты до момента, когда можно будет активировать, может пройти до 4 суток, так как сотрудники перепроверяют "вручную". Нужно учесть эту особенность.

Воронежский и Курский архивы базируются на другом движке ARSVO. Раз в сутки (примерно в 23:45) происходит обрыв связи со стороны сервера, днем в рабочие дни с 9:00 до 18:00 скорость отдачи самая низкая, такая же скорость в рабочие дни с 20:00 до 23:00. Ориентируйтесь на менее загруженное время. К слову, сервер здесь не виноват, по прямым ссылкам дела качаются куда быстрее, чем при использовании JS, которым окутан весь движок сайта. Самое удобное время для работы с этими архивами - выходные и праздничные дни, а также с 18:00 до 20:00 и ночью до 9:00 утра в рабочие дни.

Костромской архив базируется на каком-то отдельном движке от ИП Герасимов Олег Николаевич, о чем можно найти запись в разделе "О программе"

Костромской архив
Костромской архив
Костромской архив. Картинка представляется частями в base64
Костромской архив. Картинка представляется частями в base64

Самый медленный. Порой скорость показа падает до одной картинки в 20 секунд, но есть приятный сюрприз по оплате. На данный момент Костромской архив заслуживает звание "Самый нежадный архив года". Оплата активируется только в момент открытия листов в режиме просмотра. Если открывать дело в режиме миниатюрок, то деньги не списываются. Плюс, бывают бесплатные доступы в праздничные и выходные дни. Ближайшая дата бесплатного доступа - 04.11.25.

Бесплатный доступ в Костромской архив выглядит так
Бесплатный доступ в Костромской архив выглядит так

Статья выйдет в эфир после этой даты, но посчитал, что информацию стоит отметить.

И что теперь?

Работая с медленно отдающим архивом, невольно возникает желание найти способ обойти этот медленный JS скрипт и получить прямые ссылки к листам дела. Возникает желание автоматизировать процесс загрузки.

А еще загрузка может просто зависнуть
А еще загрузка может просто зависнуть

Здесь стоит отметить важность прочтения публичного соглашения на сайтах архивов.

Пользовательское соглашение

Пользователь обязан использовать электронные копии архивных документов, право доступа к которым ему предоставлено, исключительно в личных целях, для просмотра, прослушивания и иного изучения.

Пользователь не имеет права:

переделывать, изменять или прочим образом электронные копии архивных документов; передавать либо рассылать электронные копии архивных документов третьим лицам как полностью, так и частично;

изготавливать другие копии архивных документов, на основе электронных копий архивных документов, право доступа к которым он получил, то есть изготавливать экземпляры документов или их частей в любой материальной форме, если этот экземпляр имеет цель дальнейшего распространения.

В одном из архивов написано, что нельзя скачивать картинки. Но когда в браузере открывается картинка, будьте уверены, что она уже на компьютере, компьютер уже загрузил еe. Загрузка происходит независимо от вашей воли или воли работников архива.

С запретами определились. Соблюдаем правила работы с архивами, уважаем столь важный труд.
А что хотели авторы сказать фразой: «или прочим образом электронные копии архивных документов», мне не известно. Обязуюсь прочим образом ни‑ни.

На других сайтах информация немного другая, но суть остается такой же — запрещается копировать и передавать третьим лицам.

Clickermann + архив

В 2006 году Джонни Челленджер представил миру помогающий решать множество задач Clickermann, программу, эмулирующую манипуляторы (клавиатура и мышь), будто их нажимает пользователь. Кто-то с помощью кликера даже маджонги решает.

Мне не удалось победить JS и написать обработчик на python, который смог бы авторизовываться в браузере, а в случае Курского архива через Госуслуги, и работать с JS скриптами, которые у каждого движка свои.

Но с помощью Clickermann написал задания, эмулирующие работу пользователя, использование которых сэкономили в общей сложности не менее 3 недель за несколько месяцев.

Делюсь наработками со всеми, кто уже столкнулся с трудностями работы с цифровыми архивами, когда важно сосредоточиться на главном, а не смотреть на крутящийся прогресс бар (троббер) минутами.

Главный плюс от такой работы - к обработанным кликером делам появляется локальный доступ, ведь за доступ уже заплатили.

Здесь помним про передачу третьим лицам и используем только в личных целях.

Снова приведу сравнение, но уже по возрастанию сложности:

  1. Ивановский архив. Самый простой скрипт и логика. Все настолько просто, что скрипт получился на 144 строки с комментариями.

  2. Воронежский и Курский архивы. Логика сложнее, но можно скачивать дела, размером до 2000 листов (мне и такие попадались), в течение оплаченных суток, скрипт более сложный. Скорость загрузки примерно 200 листов в час.

  3. Владимирский и Тамбовский архивы. Вынужденной мерой стал отдельный скрипт для сбора ссылок листов, логика менее сложная, чем у ARSVO. Здесь потребовались более сильные навыки программирования.

  4. Костромской архив. На данный момент имеет самую стойкую логику и метод сокрытия картинок. За счет этого, работать с делами данного архива без магния очень трудно. Наберитесь терпения, скрипт загрузит и оповестит по окончанию.

Если более распространенные движки архивов стараются спрятать прямую ссылки картинки, то движок Костромского архива разбивает картинку на тоненькие полоски и представляет их в виде base64. Логика такой схемы требует более продуманного алгоритма. Сбор таких отрезков тоже осуществим, но после сбора эти отрезки потребуется раскодировать и представить в виде jpeg.

Для декодирования приложен файл base64_p.py

# Декодируем base64 
image_data = base64.b64decode(strip)
image = Image.open(io.BytesIO(image_data))
images.append(image)

Не забываем открыть режим Разработчика SHIFT + CTRL + i.
В режиме разработчика переходим в раздел Network (Сеть), включаем фильтр и в строке фильтра добавляем :image

Браузер нужно настроить примерно так:

Костромской архив
Костромской архив

Особенности

Отмечу важную особенность - все скрипты привязаны к одной и той же настройке браузера и зкрана компьютера. Планируется уйти от этого хардкода, отвязаться от жестких координат, но для этого придется переделать скрипты и добавить функционал поиска координат кнопок или точек, что достаточно сложно при изменяющемся масштабе кнопок.

Хардкод - наше всё
Хардкод - наше всё
  • Разрешение экрана 1920x1080

  • Яндекс браузер с масштабом в 80%

Еще момент. При обновлении приложения Яндекс Браузера обновляется дизайн кнопок. В скриптах добавлен поиск необходимых кнопок. Если кнопка отображается на экране, а скрипт ее не определяет, просто пересохраните bmp файл кнопки. Более подробная информация записывается в лог приложения.

Кнопка Сохранить
Кнопка Сохранить

В Тамбовском и Владимирском архивах потребуется открыть меню Разработчика SHIFT + CTRL + i до запуска скрипта, если планируется сбор ссылок. В режиме разработчика переходим в раздел Network (Сеть), включаем фильтр и в строке фильтра добавляем image?

Открываем режим Разработчика
Открываем режим Разработчика

Попроще с ARVO - ссылки показывает Яндекс Браузер. Скрипт услужливо сохраняет их в файл link.txt. Вы не только собираете дело, но и получаете ссылки на листы. Настолько все просто, что 2 файла подпрограмм, формирующих ссылку, пришлось исключить из репозитория, чтобы не провоцировать авторов ИС на доработки. Скажу сразу, никаких sql инъекций не используется.

#include "change_link.cms"
#include "white_list.cms"

Синтаксис Clickermann своеобразный:

  1. # - означает вызов подпрограммы, а не комментарий.

  2. Комментарий начинается с //

  3. $S_CORR = 0 - анахронизм из предыдущих версий, но решил оставить.

  4. Если будете дорабатывать задания Clickermann, обязательно ознакомьтесь с синтаксисом.

  5. WHILE закрывается не END_WHILE, а END_CYC,

  6. Пауза - не PAUSE, а WAIT или WAITMS

Продолжение будет?

После публикации статьи ожидаю реакцию создателей движков, либо смену движков архивами, что обязательно даст дополнительную возможность сильнее развить навыки по работе с архивами. Будем развиваться вместе.

Что могу посоветовать архивам?

Не плодить сущности. Разные движки - разные ошибки, разные бюджеты, разные скорости перехода к цифре. Все это негативно влияет на развитие российских государственных услуг.

Понизить стоимость, привести все архивы к посуточному абонементу или посекундной оплате.

Периодически предоставлять бесплатный доступ, как это делает Костромской архив.

Понизить сложность сокрытия ссылок на картинки, а лучше вообще убрать, оставить только платный доступ к этому контенту (KAISA).

Дать возможность быстро получать необходимую информацию, ведь именно медленная работа архивов заставляет искать пути экономии времени.

Комментарии (5)


  1. BackDoorMan
    05.11.2025 14:26

    Я пошёл немного другим путем и написал расширение для браузера. 3 часа работы с дипсиком. Пока рязанский архив работал (и даже был бесплатным) выкачал значительную часть нужных дел. У них вообще оцифровано очень много, а в читальный зал действительно не попасть. Жаль, сейчас доступа нет вообще.

    По удобству реализации и скорости в моем топе Тверской архив


    1. Adjuster2004 Автор
      05.11.2025 14:26

      С Тверским архивом пока не довелось работать. Электронный читальный зал Рязанского архива обещали запустить этой осенью, но перенесли на следующий год. Приходится ездить, либо заказывать дела через знакомых.


      1. BackDoorMan
        05.11.2025 14:26

        Я работал с garo62.ru. У них доступ открылся ещё года два назад (egis.garo62.ru), правда всегда работал с перебоями, но с мая даже был бесплатным. Последние 2 месяца egis отключен совсем


  1. materiatura
    05.11.2025 14:26

    "Доступ к электронным архивам должен быть свободным и бесплатным, а использование полученной информации не ограничиваться." В.И.Ленин "Об организации архивного дела".


  1. PereslavlFoto
    05.11.2025 14:26

    Понизить стоимость

    Давайте представим, что стоимость уже понижена, введёт суточный абонемент, ссылки на картинки даются в простом и открытом виде.

    Как это позволит увеличить выручку архивов хотя бы в два-три раза?

    Спасибо.