Сегодня мы расскажем вам, как помогали оцифровывать Сахалинскую областную универсальную научную библиотеку. Переводить библиотеки в электронный вид мы начали довольно давно. Постоянные читатели блога наверняка помнят обзорный пост по нашим библиотечным проектам, а также топики, посвященные оцифровке библиотеки Хартли и созданию каталога Королевского ботанического сада Эдинбурга. Итак, поехали.
Сахалинская областная универсальная научная библиотека существует уже 67 лет и остается одним из основных информационных, культурных и научно-исследовательских центров Дальнего Востока. Сегодня в библиотеке хранится около 617 тысяч различных изданий.
Одна из самых ценных коллекций – редкие краеведческие издания о Сахалине и Курилах, в том числе местная периодика. Редкие издания на дом не выдают – они могут испортиться или потеряться – поэтому посмотреть их можно только в читальном зале. Если вы с какими-то своими целями изучаете Сахалин, а живете, например, в Москве, до последнего времени библиотека ничем не могла вас порадовать. Книги из депозитарного фонда не выдаются — часть из них вот в таком состоянии (фото ниже) и давать их на руки просто нельзя:
Нужно сказать, в Сахалинской областной универсальной научной библиотеке уже давно стараются сделать различные издания доступнее, например, с 1994 года формируется электронный каталог. Фонд краеведческой литературы представлен в электронном каталоге – 98 187 библиографических записей. Сейчас сотрудники библиотеки участвуют в программе создания полнотекстовой базы краеведческих информационных ресурсов – предоставляют периодические издания и документы из фонда для создания электронных копий. Уже отсканировано более 7 тысяч книг и более 30 тысяч периодических изданий. Библиотекари также анализируют содержимое фонда: раскрывают содержание изданий, аналитически расписывают сборники, дополняют записи электронного каталога предметными рубриками, ключевыми словами и аннотируют их.
Процесс оцифровки издания состоит из сканирования на сетевых сканерах и обработки полученного изображения с помощью программ Scan Tailor (обрезка страниц, выравнивание текста) и Photoshop (обработка засветов, теней, настройка яркости, контрастности изображения). Сначала библиотекари пробовали работать на сканере с перелистыванием страниц, но он испортил несколько книг, и эту функцию перестали использовать.
После обработки изображения прогоняют через ABBYY Recognition Server, решение для распознавания текста и преобразования документов в электронные редактируемые форматы. Решение создает PDF файлы газет и книжных изданий с распознанным текстом, затем файлы поступают в систему хранения. На готовые документы создаются записи с описанием ресурса и поисковыми атрибутами. С помощью Recognition Server ежегодно обрабатывается 2000 изданий, или около 200 тысяч страниц.
Электронная библиотека состоит из трёх частей: «Сахалин и Курилы: острова утренней зари», «Публичная электронная библиотека» и «Национальная электронная библиотека». Для пользователей разработан навигатор на всех сайтах электронных библиотек. Можно сузить поиск нужной информации по теме статьи, автору, а также рубрике, коллекции и тексту документа.
Эта электронная библиотека формируется с 2009 года, с 2012 года для удаленных пользователей открылся сайт «Сахалин и Курилы – острова утренней зари»). Специалисты сектора оцифровки отбирают образы газет и помещают их в систему «КАИСА-Краеведение», предназначенную для формирования полнотекстовой электронной библиотеки. Сегодня в электронном виде доступны более 9 тысяч номеров региональных изданий и более 10 тысяч статей из газет, среди них известные газеты «Советский Сахалин» (выходит с 1933 года) и «Губернские ведомости».
В настоящее время оцифровано 7221 книжных изданий из редкого краеведческого фонда, например, особо ценные книги: «Десятиверстная карта Русского Сахалина, составленная по съемкам экспедиций геологического комитета 1907-1910 гг. и другим источникам» 1914 г., «Первая всеобщая перепись населения Российской империи» 1897 г. под редакцией Н.А. Тройницкого, «Остров Сахалин и экспедиция 1853-54 гг.» 1872 г. Н.В. Буссе. Оцифрованные книжные издания частично размещаются на страничке библиотеки на портале Национальной Электронной Библиотеки (НЭБ) и в Публичной электронной библиотеке в книжных тематических коллекциях.
Периодические издания и особо ценные книги после сканирования не возвращаются в отдел краеведения, а передаются в специальный фонд для консервации и постоянного хранения.
Работы по оцифровке фонда продолжаются. Если вы для каких-то своих целей исследуете Сахалин или просто собираетесь в гости, интернет-версия Сахалинской библиотеки — вам в помощь.
Сахалинская областная универсальная научная библиотека существует уже 67 лет и остается одним из основных информационных, культурных и научно-исследовательских центров Дальнего Востока. Сегодня в библиотеке хранится около 617 тысяч различных изданий.
Одна из самых ценных коллекций – редкие краеведческие издания о Сахалине и Курилах, в том числе местная периодика. Редкие издания на дом не выдают – они могут испортиться или потеряться – поэтому посмотреть их можно только в читальном зале. Если вы с какими-то своими целями изучаете Сахалин, а живете, например, в Москве, до последнего времени библиотека ничем не могла вас порадовать. Книги из депозитарного фонда не выдаются — часть из них вот в таком состоянии (фото ниже) и давать их на руки просто нельзя:
Нужно сказать, в Сахалинской областной универсальной научной библиотеке уже давно стараются сделать различные издания доступнее, например, с 1994 года формируется электронный каталог. Фонд краеведческой литературы представлен в электронном каталоге – 98 187 библиографических записей. Сейчас сотрудники библиотеки участвуют в программе создания полнотекстовой базы краеведческих информационных ресурсов – предоставляют периодические издания и документы из фонда для создания электронных копий. Уже отсканировано более 7 тысяч книг и более 30 тысяч периодических изданий. Библиотекари также анализируют содержимое фонда: раскрывают содержание изданий, аналитически расписывают сборники, дополняют записи электронного каталога предметными рубриками, ключевыми словами и аннотируют их.
Процесс оцифровки издания состоит из сканирования на сетевых сканерах и обработки полученного изображения с помощью программ Scan Tailor (обрезка страниц, выравнивание текста) и Photoshop (обработка засветов, теней, настройка яркости, контрастности изображения). Сначала библиотекари пробовали работать на сканере с перелистыванием страниц, но он испортил несколько книг, и эту функцию перестали использовать.
После обработки изображения прогоняют через ABBYY Recognition Server, решение для распознавания текста и преобразования документов в электронные редактируемые форматы. Решение создает PDF файлы газет и книжных изданий с распознанным текстом, затем файлы поступают в систему хранения. На готовые документы создаются записи с описанием ресурса и поисковыми атрибутами. С помощью Recognition Server ежегодно обрабатывается 2000 изданий, или около 200 тысяч страниц.
Электронная библиотека состоит из трёх частей: «Сахалин и Курилы: острова утренней зари», «Публичная электронная библиотека» и «Национальная электронная библиотека». Для пользователей разработан навигатор на всех сайтах электронных библиотек. Можно сузить поиск нужной информации по теме статьи, автору, а также рубрике, коллекции и тексту документа.
Библиотека периодики
Эта электронная библиотека формируется с 2009 года, с 2012 года для удаленных пользователей открылся сайт «Сахалин и Курилы – острова утренней зари»). Специалисты сектора оцифровки отбирают образы газет и помещают их в систему «КАИСА-Краеведение», предназначенную для формирования полнотекстовой электронной библиотеки. Сегодня в электронном виде доступны более 9 тысяч номеров региональных изданий и более 10 тысяч статей из газет, среди них известные газеты «Советский Сахалин» (выходит с 1933 года) и «Губернские ведомости».
Книжный фонд
В настоящее время оцифровано 7221 книжных изданий из редкого краеведческого фонда, например, особо ценные книги: «Десятиверстная карта Русского Сахалина, составленная по съемкам экспедиций геологического комитета 1907-1910 гг. и другим источникам» 1914 г., «Первая всеобщая перепись населения Российской империи» 1897 г. под редакцией Н.А. Тройницкого, «Остров Сахалин и экспедиция 1853-54 гг.» 1872 г. Н.В. Буссе. Оцифрованные книжные издания частично размещаются на страничке библиотеки на портале Национальной Электронной Библиотеки (НЭБ) и в Публичной электронной библиотеке в книжных тематических коллекциях.
Периодические издания и особо ценные книги после сканирования не возвращаются в отдел краеведения, а передаются в специальный фонд для консервации и постоянного хранения.
Работы по оцифровке фонда продолжаются. Если вы для каких-то своих целей исследуете Сахалин или просто собираетесь в гости, интернет-версия Сахалинской библиотеки — вам в помощь.
Layan
Вот когда вижу книги, как на первых фотографий, нагло испорченные простыми печатями, которые ставились без всяких сомнений — как-то не по себе.
dShell
Да, бросьте, потом оно все равно случайно сгорит.
nitro80
Видимо без этих печатей никак, учёт и всё такое.
Наверняка библиотекарям не в радость «портить» эти книги.
Moskus
Такие книги все равно не выдаются на руки просто так, потому для учета достаточно было все печати поставить на коробку, в которой эта книга хранится. Так что это простое пренебрежение.
И что за вечная манера его оправдывать?
nitro80
nerudo
Недавно был минискандальчик с эрмитажем что ли. Когда букинистические издания из фондов хранения не были никак промаркированы и совершенно внезапно (и почти случайно) обнаружились в антикварном магазине. Тоже в коробке на полке стояли, видимо.
Moskus
Вы хотите сказать, что печать — защита от кражи, учитывая, что сводится она минут за двадцать работы? Не смешите.
nerudo
Я хочу сказать ровно то, что сказал. Про 20 минут — ну может вам виднее.
bolk
В чём же заключается порча печатями? Какой критерий такой порчи?
quartz64
Всё это, конечно, субъективно, но вот моя логика:
bolk
Не всё, что старое — произведение искусства. На большинстве архивных книг есть куча пометок, оставленных в разные времена. Такова жизнь.
Ребята минусующие, чувствуется, вы никогда в жизни не работали в архивными документами.
lowride
Все равно как собаки метят дерево.