Сегодня мы расскажем вам, как помогали оцифровывать Сахалинскую областную универсальную научную библиотеку. Переводить библиотеки в электронный вид мы начали довольно давно. Постоянные читатели блога наверняка помнят обзорный пост по нашим библиотечным проектам, а также топики, посвященные оцифровке библиотеки Хартли и созданию каталога Королевского ботанического сада Эдинбурга. Итак, поехали.

Сахалинская областная универсальная научная библиотека существует уже 67 лет и остается одним из основных информационных, культурных и научно-исследовательских центров Дальнего Востока. Сегодня в библиотеке хранится около 617 тысяч различных изданий.

Одна из самых ценных коллекций – редкие краеведческие издания о Сахалине и Курилах, в том числе местная периодика. Редкие издания на дом не выдают – они могут испортиться или потеряться – поэтому посмотреть их можно только в читальном зале. Если вы с какими-то своими целями изучаете Сахалин, а живете, например, в Москве, до последнего времени библиотека ничем не могла вас порадовать. Книги из депозитарного фонда не выдаются — часть из них вот в таком состоянии (фото ниже) и давать их на руки просто нельзя:





Нужно сказать, в Сахалинской областной универсальной научной библиотеке уже давно стараются сделать различные издания доступнее, например, с 1994 года формируется электронный каталог. Фонд краеведческой литературы представлен в электронном каталоге – 98 187 библиографических записей. Сейчас сотрудники библиотеки участвуют в программе создания полнотекстовой базы краеведческих информационных ресурсов – предоставляют периодические издания и документы из фонда для создания электронных копий. Уже отсканировано более 7 тысяч книг и более 30 тысяч периодических изданий. Библиотекари также анализируют содержимое фонда: раскрывают содержание изданий, аналитически расписывают сборники, дополняют записи электронного каталога предметными рубриками, ключевыми словами и аннотируют их.

Процесс оцифровки издания состоит из сканирования на сетевых сканерах и обработки полученного изображения с помощью программ Scan Tailor (обрезка страниц, выравнивание текста) и Photoshop (обработка засветов, теней, настройка яркости, контрастности изображения). Сначала библиотекари пробовали работать на сканере с перелистыванием страниц, но он испортил несколько книг, и эту функцию перестали использовать.

После обработки изображения прогоняют через ABBYY Recognition Server, решение для распознавания текста и преобразования документов в электронные редактируемые форматы. Решение создает PDF файлы газет и книжных изданий с распознанным текстом, затем файлы поступают в систему хранения. На готовые документы создаются записи с описанием ресурса и поисковыми атрибутами. С помощью Recognition Server ежегодно обрабатывается 2000 изданий, или около 200 тысяч страниц.

Электронная библиотека состоит из трёх частей: «Сахалин и Курилы: острова утренней зари», «Публичная электронная библиотека» и «Национальная электронная библиотека». Для пользователей разработан навигатор на всех сайтах электронных библиотек. Можно сузить поиск нужной информации по теме статьи, автору, а также рубрике, коллекции и тексту документа.

Библиотека периодики


Эта электронная библиотека формируется с 2009 года, с 2012 года для удаленных пользователей открылся сайт «Сахалин и Курилы – острова утренней зари»). Специалисты сектора оцифровки отбирают образы газет и помещают их в систему «КАИСА-Краеведение», предназначенную для формирования полнотекстовой электронной библиотеки. Сегодня в электронном виде доступны более 9 тысяч номеров региональных изданий и более 10 тысяч статей из газет, среди них известные газеты «Советский Сахалин» (выходит с 1933 года) и «Губернские ведомости».







Книжный фонд


В настоящее время оцифровано 7221 книжных изданий из редкого краеведческого фонда, например, особо ценные книги: «Десятиверстная карта Русского Сахалина, составленная по съемкам экспедиций геологического комитета 1907-1910 гг. и другим источникам» 1914 г., «Первая всеобщая перепись населения Российской империи» 1897 г. под редакцией Н.А. Тройницкого, «Остров Сахалин и экспедиция 1853-54 гг.» 1872 г. Н.В. Буссе. Оцифрованные книжные издания частично размещаются на страничке библиотеки на портале Национальной Электронной Библиотеки (НЭБ) и в Публичной электронной библиотеке в книжных тематических коллекциях.

Периодические издания и особо ценные книги после сканирования не возвращаются в отдел краеведения, а передаются в специальный фонд для консервации и постоянного хранения.



Работы по оцифровке фонда продолжаются. Если вы для каких-то своих целей исследуете Сахалин или просто собираетесь в гости, интернет-версия Сахалинской библиотеки — вам в помощь.

Комментарии (12)


  1. Layan
    17.09.2015 01:10
    +9

    Вот когда вижу книги, как на первых фотографий, нагло испорченные простыми печатями, которые ставились без всяких сомнений — как-то не по себе.


    1. dShell
      17.09.2015 02:06
      +3

      Да, бросьте, потом оно все равно случайно сгорит.


    1. nitro80
      17.09.2015 03:58
      -4

      Видимо без этих печатей никак, учёт и всё такое.
      Наверняка библиотекарям не в радость «портить» эти книги.


      1. Moskus
        17.09.2015 06:45

        Такие книги все равно не выдаются на руки просто так, потому для учета достаточно было все печати поставить на коробку, в которой эта книга хранится. Так что это простое пренебрежение.
        И что за вечная манера его оправдывать?


        1. nitro80
          17.09.2015 06:53
          -3

          И что за вечная манера его оправдывать?
          Мы знакомы? Или как понять ваш комментарий?


        1. nerudo
          17.09.2015 10:48
          +1

          Недавно был минискандальчик с эрмитажем что ли. Когда букинистические издания из фондов хранения не были никак промаркированы и совершенно внезапно (и почти случайно) обнаружились в антикварном магазине. Тоже в коробке на полке стояли, видимо.


          1. Moskus
            17.09.2015 10:52

            Вы хотите сказать, что печать — защита от кражи, учитывая, что сводится она минут за двадцать работы? Не смешите.


            1. nerudo
              17.09.2015 11:01

              Я хочу сказать ровно то, что сказал. Про 20 минут — ну может вам виднее.


    1. bolk
      17.09.2015 08:00

      В чём же заключается порча печатями? Какой критерий такой порчи?


      1. quartz64
        17.09.2015 10:28
        +6

        Всё это, конечно, субъективно, но вот моя логика:

        • Очень старая, пусть и не рукописная книга, сохранившаяся в единичных экземплярах — это не просто печатное издание, не набор листов бумаги с буквами, а ценный артефакт, произведение искусства.
        • Зачем вносить в такой объект необратимые изменения? Единственная причина — «так положено по инструкции, у нас тут государственное учреждение».
        • Представьте себе выгравированный инвентарный номер на античной скульптуре.


        1. bolk
          17.09.2015 10:32
          +2

          Не всё, что старое — произведение искусства. На большинстве архивных книг есть куча пометок, оставленных в разные времена. Такова жизнь.

          Ребята минусующие, чувствуется, вы никогда в жизни не работали в архивными документами.


        1. lowride
          20.09.2015 14:56

          Все равно как собаки метят дерево.