Несмотря на то, что многие книги доступны в электронном виде в Сети, огромное их количество существует только в бумаге. Поэтому у многих из нас иногда возникает необходимость сканировать книги. А это не так просто, поскольку сама книга далеко не плоская, и чем толще книга, тем сложнее бывает ее отсканировать (хотя и не всегда, иногда сложнее отсканировать как раз брошюру).

Обычный сканер для этой цели подходит слабо, поэтому энтузиасты создают собственные проекты сканеров для книг. Один такой проект, Archivist, разрабатывался автором около шести лет, прежде, чем появилась финальная версия. Все это время автор вел о своей работе блог. По словам разработчика, Archivist — проект, на 50% состоящий из аппаратного обеспечения и на 50% — из программного.

Общее описание

Archivist — простая система. Основная работа велась в направлении подбора удачного освещения, положения книги и камер. Верхняя часть оснащена световыми элементами, камерами и стеклом. Нижняя часть предназначена для размещения книги. Стекло позволяет уплощать развернутые страницы книг, а обе камеры делают качественные снимки, каждая — своей страницы. Поскольку фотографируются две страницы одновременно, за час можно сфотографировать около 1000 страниц, при условии начальной тренировки.


Видео от автора (выложено на YouTube 2 года назад)

Крэдл

Это место, куда вкладывается книга. Спроектирована платформа таким образом, что толщина книги не имеет значения. По мере пролистывания страниц центр крэдла изменяет свое положение, чтобы книгу можно было развернуть как можно лучше.



Крэдл съемный, его можно вынуть из системы, настроить, и вставить обратно. Все сделано для того, чтобы оператору было максимально комфортно работать.



Крэдл оснащен системой противовесов, что делает работу с системой еще более комфортной.

Стекло

Эта часть конструкции размещается между камерами и книгой, так что значение стекла весьма велико — от его размещения и прозрачности зависит качество самой работы.



По мнению автора проекта, лучшим стеклом является закаленное, толщиной 3 мм. Остальные виды стекол, включая Gorilla Glass, «музейное стекло», пластик с антибликовым покрытием, акрил и т.п. либо дороги, либо портятся в процессе эксплуатации (стирается то самое покрытие, царапается поверхность и т.п.).

Поэтому автор и рекомендует взять обычное закаленное стекло, которое и недорогое, и практически не изнашивается при таком типе работы с ним.

Тем не менее, если есть деньги и желание попробовать что-то еще, можно это сделать.

Пресс/камеры

Для того, чтобы улучшить качество получаемых изображений убрав всякие тени и т.п., автор ипользует v-образный стекляннный пресс, сжимающий корешок книги определенным образом. Вот так это выглядит.

output_VZ77Uh

Камеры же прикреплены к верхней части модуля. Естественно, должно быть хорошим и освещение. Здесь используется специальная оптика, которая равномерно распределяет свет по всей сканируемой поверхности.

Освещение оптимально для съемки. По словам автора, в Archivist используется одна из наиболее продвинутых LED технологий. Это позволяет выполнить условие качественного освещения и получить цветовую гамму без искажений.



Что касается самой системы, она способна сканировать книги размером вплоть до 12?15? (30x38cm). При этом камера с матрицей 16MP обеспечивает разрешение около 300 DPI, чего вполне достаточно для книги. Можно подобрать и другое разрешение, проблемы в этом нет. В качестве примера автор приводит Canon Powershot A1400IS.

Что касается других подробностей, а также аппаратного обеспечения для создания аналогичной системы, все это можно посмотреть на сайте Archivist.

Конечно, есть и более продвинутые системы, некоторые из которых даже переворачивают странички автоматически. Тем не менее, предложенная конструкция является одной из наиболее недорогих и доступных для реализации. На Geektimes совсем недавно была показана схожая система.

Комментарии (14)


  1. Sun-ami
    02.05.2016 01:42

    Всё же ни из статьи, ни из сайта по ссылке не понятно, как устроено освещение. Сделать так, чтобы стекло не бликовало, довольно непросто. И обеспечить равномерность освещения при боковом свете (а иначе бликует не только стекло, но и глянцевые страницы) тоже не очень просто.


    1. igruh
      02.05.2016 08:02

      Полагаю это десяток светодиодов вокруг объектива, вокруг внешней линзы рассеиватель (бумага, неплотная белая ткань) и белый отражатель на внутренней поверхности призмы-кожуха.
      К слову, ресурс затвора составляет в среднем 20000 кадров. Возьмём среднее количество страниц в книге 200 и получим 100 книг. Стоимость мыльницы ~300уе. Т.е. 3 уе за книгу.


      1. DrPass
        02.05.2016 10:14

        300уе — это уже не мыльница, это зеркалка начального уровня а-ля Canon EOS 1200D. Там и ресурс затвора намного выше.


      1. DarkMax
        02.05.2016 10:37

        Варианты с электронным затвором не рассматриваются?


    1. FForth
      02.05.2016 11:33

      А в чём сложности переделки обычного планшетного сканера под сканирование книг «уголком»?
      Кто нибудь делал такую конструкцию?


      1. DarkMax
        02.05.2016 12:08

        Планшетным сканером очень долго.


        1. bopoh13
          02.05.2016 18:21

          Конечно, есть определённые неудобства. Но если приноровиться и немного автоматизировать процесс — вполне можно работать. Конечно, на планшетном сканере не достичь результата оцифровки 1 страницы за 8 секунд, но всё же более дешёвый вариант.


        1. Tsvetik
          03.05.2016 13:54

          Зато качественно


          1. NiGMa4Habr
            03.05.2016 14:57

            Сначала давайте уточним, что значит «качественно». Да, планшетный сканер может обеспечить разрешение 2400 dpi (и даже более); впрочем, для сканирования печатной продукции так много вряд ли надо. Но вот глубина резкости у массовых CIS-сканеров — не более 3 мм; результат — внутренняя часть книжного блока будет отсканирована с искажениями (проще говоря, размыта). Можно попробовать сильнее прижать книгу к стеклу, чтобы получить прилегание корешка лучше 2-3 мм — но это, скорее всего, серьёзно повредит книгу.

            За последние годы стандартное разрешение массовых «мыльниц» достигло уже 20 мегапикселей. При фотографировании листа А4 (при соотношении сторон кадра 3: 4 это 9" * 12") получается разрешение 430 dpi, для листа А5 (6" * 8") — уже 640 dpi. И то, и другое вполне достаточно для оцифровки книг. Да, и уже может начинать конкурировать с планшетными сканерами — это привело к появлению на рынке первых моделей нового класса сканеров, «фото-сканеров»; собственно, именно такой сканер (только DIY) в этой статье и представлен.


            1. Tsvetik
              03.05.2016 18:44

              Нормальным считается разрешение 300 dpi.
              Не всякая мыльница имеет 20 мегапикселей, а если и имеет, то кадр будет сильно зашумлен или будут всякие искажения по краям кадра, например, может поплывет резкость или строки изогнутся.
              Для более-менее приемлемого фотосканирования нужна как минимум зеркалка начального уровня.

              А порою в книгах попадаются и штриховые рисунки, вклейки с картами, схемами, графиками. Такие вещи зачастую исполняются тонкими линями и текст на них в два раза мельче основного текста в книге. Эти страницы следует сканировать в разрешении 600 dpi, что не под силу фотоаппаратам.


              1. NiGMa4Habr
                03.05.2016 20:00

                При сканировании книг такой фото-сканер как раз 600 dpi и даст (даже чуть больше).
                Наиболее распространённый книжный формат — «84 * 108 1/32», то есть 21 * 13,5 см (до обрезки блока), это даже чуть меньше А5, с матрицей 20 Мп получится 650 dpi.
                Шум матрицы, как правило, проявляется ближе к пределу светочувствительности — но объект съёмки статичный, и можно просто дать выдержку побольше.
                Вот аберрации — согласен, они могут мешать. Значит, не стоит хватать первую попавшуюся камеру, надо выбрать с более-менее приличным объективом (может быть, и не «мыльницу», а что-то посерьёзнее). Впрочем, если искажения не фатальны, результат сканирования можно улучшить программно (есть готовые фильтры).

                И — да, сканирование качественных (или, наоборот, повреждённых) иллюстраций не самого мелкого формата фото-сканер «не тянет». Уточню: пока не тянет.

                P.S. Через поиск приличного планшетного сканера я уже прошёл (правда, цель была немного другая: требовалось оцифровать несколько сотен семейных фотографий, в том числе и старинных). И вот к чему пришёл: современная фотокамера делает это и быстрее, и качественнее. Сопоставимый по возможностям сканер — в разы дороже.


                1. Tsvetik
                  03.05.2016 20:10

                  По поводу планшетного сканера.
                  Когда-то давным-давно купил Epson V33 и до сих пор им пользуюсь при оцифровке книг. У него CCD сенсор. При сканировании средний темп — два разворота в минуту (если книга помещается разворотом на стекло).

                  Большой, конечно, в рюкзак плохо помещается. Недавно для поездок купил первую попавшуюся компактную дешевку — Lide 220

                  Сейчас V33 нет, зато есть V370, он тоже с CCD сенсором и стоит 100$. Так что не так уж сложно найти «нормальный» книжный сканер.


          1. nafikovr
            04.05.2016 14:21

            Не каждую книгу можно полностью развернуть на планшете. Разве что делать аналогичную приспособу, но уже со сканером. Но тогда уже получится долго, дорого и качественно.


      1. NiGMa4Habr
        03.05.2016 13:56

        Увы, планшетные CCD-сканеры сейчас практически не продаются (или продаются по нереальным ценам).
        Что касается массовых (технология CIS) планшетных сканеров — в борьбе за дешевизну их технические характеристики опустились «ниже плинтуса»: они имеют небольшой динамический диапазон и весьма требовательны к плоскостности оригинала, к тому же отнюдь не быстры. Как следствие, их стоит использовать только для оцифровки текстов (для последующего хранения / передачи / распознавания).
        Изображения, имеющие художественную ценность (например, старые книги), им не под силу — причём даже дешёвая «мыльница» с ними справится лучше (и гораздо быстрее).