Началось всё с того, что однажды мы увидели гигантскую хреновину (иначе не скажешь), которая выглядела один в один, как гидравлический пресс какого-нибудь завода. Она скрипела, шипела и давила книгу. Вокруг бегали специально обученные операторы и шарахались от каждого её движения.

Выяснилось, что разные архивы, библиотеки, суды и другие структуры закупают сканеры, или, скажем так, классические решения, которые по уровню начинки очень напоминают 90-е годы. Потому что тогда были разработаны первые сканеры для библиотек, и их с тех пор не особо модифицировали.

Задачей сканера было механически выровнять сканируемый материал на плоскости, а потом отсканировать.

С тех пор поменялись две вещи:
— Подходы к конструированию электроники.
— Подходы к машинному зрению.

Первый опыт: датчики давления


Гипотеза: надо прижать книгу к стеклу не со всей дури, сколько есть, а до безопасного давления для руки. Поставить датчики и просто снимать с них показания для подъёмного стола. Это снизит страхи операторов и травматизм.

Второй опыт: выравнивание изображения


С этим результатом мы пришли к одному из заказчиков из судебной сферы. Сшитые документы в судах (чаще всего судебные дела) очень толстые. Такие же кипы документов бывают у инженеров-строителей и в разных архивах.

Гипотеза: можно выравнивать очень многое не вручную, а с помощью машинного зрения. В конце концов, даже с обычного планшета можно сегодня сфотографировать документ и сразу получить его в виде почти что ксерокопии. Чем сканер хуже?

Мы дописали софт, и там появились всякие повороты и наклоны автоматом и с подсказки оператора.

Вот что вышло:


Потом ещё игрались с настройкой предельного значения силы прижима:

Третий опыт: не надо прижимать


У нас на входе в офис стоит 3D-сканер лица, который умеет строить 3D-модель лица по одной фотографии. Делает он это с помощью проектора сетки: сравнивая наложение сетки на лицо, он вычисляет геометрию этого лица. Следующая гипотеза была логична: а зачем прижимать документ, если достаточно спроецировать на него лазерные метки?



Оказалось, достаточно лазерных полосок — вот таких:



Сверху стоит камера, которая снимает.

По ТЗ: сканеры чёрно-белые, поэтому можно просто отсечь длину волны лазера и получить отдельно канал с геометрией и канал с информацией из сканируемого документа.

Затем можно выполнить «восстановление» геометрии до того уровня, когда лазерные линии в результате снова будут прямыми. Вот что получается:



Вот, собственно, конец истории.

Задача, кстати, оказалась очень актуальной для случаев, когда приходится сканировать очень ветхие и разноформатные сшитые документы, чертежи, книги. Когда страница сыплется в труху от неаккуратного прикосновения пальцами, прижать её к плоской поверхности — это всё равно что сразу уничтожить.

Результат


У нас получилось сделать нужное решение и пустить его в серию просто потому, что, видимо, прочим игрокам рынка было неинтересно или не очень выгодно, чтобы сканеры были дешёвыми и работали быстро. Наши сканеры по сочетанию цена–эффект и цена–качество вышли очень и очень хороши.

Откуда растут ноги? Опыт работы с похожими изображениями мы получили, когда распознавали по стране данные сельскохозяйственной переписи. Тогда надо было разбирать рукописный шрифт: планшеты обходчикам дали только на следующей переписи. Плюс у нас есть лаборатория робототехники, где можно быстро собрать прототип любого устройства, которое только возникнет в наших воспалённых мозгах. Собственно, так и произошло. Мы загубили некоторое количество материалов, пока не подобрали правильную модель подъёма стола, долго ковырялись с лазерами, но нашли то что нужно.

Ну и мы — интегратор большого размера, поэтому, когда пришли к одному из заказчиков и показали наш результат, к нам прислушались. И сэкономили.

Вот три поколения наших сканеров и принципы работы:

Сканер с верхним прижимом:

Сканер с прижимом снизу:

Сканер без прижима:


Ссылки


Комментарии (42)


  1. ggo
    29.11.2018 10:59

    Наши сканеры по сочетанию цена–эффект и цена–качество вышли очень и очень хороши.

    Ориентировочные цены?

    А сканеры, которые работают по принципу фотоаппарата, и умеют исправлять искажения, даже без лазерных меток, были уже 10 лет назад. И цена измерялась в десятках тысяч. Для больших объемов, это обычно проценты от общего бюджета.


    1. TGrigorenko Автор
      29.11.2018 12:09

      Подход к выравниванию без лазеров мы тоже рассматривали. Но он хорошо работает, когда необходимо сканировать небольшие книги с четкими контурами: использование лазеров/дальномеров улучшает качество выравнивания и переводит наше решение в статус промышленного устройства. Мы не говорим, что наши сканеры какие-то уникальные и ничего подобного раньше не было, просто мы создали свое, качественное и сбалансированное. Цены выгодно отличаются от конкурентов – это факт. Но на каждый случай требуется свой расчет стоимости, в зависимости от задач, которые сканер должен решать.


      1. geisha
        30.11.2018 01:22
        +1

        Цены выгодно отличаются от конкурентов – это факт. Но на каждый случай требуется свой расчет стоимости, в зависимости от задач, которые сканер должен решать.
        Ну порядок-то можно озвучить? А то беглое гугление изобилует весьма бюджетными предложениями 1, 2, 3, которые умеют A3 и которые можно купить прям щас.

        Кроме того, в конечном варианте сканирование такое же медленное, как на видео? Там секунд 5 проходит, прежде чем можно переворачивать страницу. Я пользовал сканер в университетской библиотеке (понятия не имею, откуда он и сколько стоит) года 4 назад и он работал со скоростью фотоаппарата.


        1. geisha
          01.12.2018 05:00

          Уточняю: сканер из библиотеки, о котором я упомянул, стоит 10к EUR в рознице. Сканер автора, если верить комментарию стоил заказчикам не меньше 5k EUR.


      1. krab90
        30.11.2018 06:51

        Но на каждый случай требуется свой расчет стоимости, в зависимости от задач, которые сканер должен решать.


        Вся суть бизнеса в России. Расчет варьируется от толщины кошелька заказчика.


        1. radonit
          30.11.2018 07:38

          Это вы видимо инженерное программное ПО не покупали, узнайте например стоимость Ansys или Siemens nx


    1. AVI-crak
      29.11.2018 15:49

      Такая функция сейчас есть практически во всех фотоаппаратах среднего уровня. И она неплохо справляется с текстом. Но рисунки, графики и чертежи — глюкавит со страшной силой.
      Собственно в этом сама суть алгоритма — для распознавания ему необходимы символы одинаковых пропорций по всей площади документа.

      Чертёж может быть от сканирован фотиком с такой функцией, но прямых линий на нём не останется.
      /// ветхая документация — наше всё.


  1. Londoner
    29.11.2018 11:22
    +1

    А почему не класть книгу страницами вниз на два стёкла, стоящие под углом 45 градусов к горизонту и 90 градусов друг к другу (как два ската крыши деревенского дома)? А снизу фотографировать двумя камерами. Таким образом удастся получить максимум текста в районе переплёта.


    1. Nikeware
      29.11.2018 11:48

      Книгу придётся каждый раз поднимать, чтобы перевернуть очередную страницу.


    1. TGrigorenko Автор
      29.11.2018 12:09

      При таком подходе неудобно переворачивать страницы, для этого необходимо поднимать книгу, будет теряться драгоценное время и книга трепется куда больше от постоянного вращения. А заказчик борется за доли секунды на сканирование разворота. Существуют похожие варианты, когда есть колыбель, расположенная так, как Вы описали, а сверху на нее ложится книга страницами вверх, и уже затем сверху опускается прижимное стекло. Эта конструкция предназначена, прежде всего, для оцифровывания плохо раскрывающихся книг. По желанию заказчика можем реализовать и такой вариант.


      1. Londoner
        29.11.2018 12:53

        Да, соглашусь, такой вариант намного лучше.
        Я так понимаю борьба за доли секунды идёт из-за присутствия человека-листальщика, нельзя ли сделать листание тоже автоматическим?


        1. BoyanBr
          29.11.2018 13:53

          Возможно сделать, есть такие решения. Книга кладется открытой под 90 градусов, страницами вверх. Не помню, прижимаются ли страницы. Потом фотографируются. Потом манипулятор переворачивает страницу, захвачивая ее присосками. Поищите www.google.com/search?q=book%20scanneer%20page%20turning — некоторые результаты довольно любопитны. Хотя для некоторых показаных решениях в наших реалиях дешевле и быстрее будет поставить человека переворачивать страниц.


        1. TGrigorenko Автор
          29.11.2018 13:55

          Стоимость решений с автоматическим переворачиванием страниц сразу уходит в горные выси. При этом, как правило, они малоприменимы к ситуации с ветхими книгами, которым требуется бережное отношение


      1. Arson
        29.11.2018 13:36

        del


      1. Nick_Shl
        29.11.2018 21:39
        +1

        А зачем вообще страницы переворачивать? Даёшь томографию и сканирование всей книги за раз в закрытом состоянии!


    1. Ramzzes
      29.11.2018 12:13

      Было что то такое
      habr.com/post/158457


    1. MrPurrPurr
      29.11.2018 12:13

      Возможно потому что бОльше операций пользователю такой конструкции провести придётся.


  1. prs123
    29.11.2018 12:15
    -3

    Но… зачем сканировать отдельные страницы? Сейчас же уже применяют сканеры, сканирующие книгу в закрытом состоянии, явно быстрее и проще


    1. googhalava
      29.11.2018 13:28

      Да и наличие книги таким сакнерам не обязательно.


    1. Alexufo
      29.11.2018 18:53

      Университетские прототипы сохраняющие разборчивость символов до 20стр


    1. HiTechSpoon
      01.12.2018 07:36

      Вы наверное про эту статью? Но такой сканер, насколько я понял, неспособен, по крайней мере пока, отсканировать закрытую книгу в надлежащем качестве. Или эта технология шагнула вперед?


  1. spidgorny
    29.11.2018 13:55

    Очень не плохо. Особенно последний вариант. Но требует оператора для переворачивания страниц. Не пробовали переворачивать страницы манипулятором? Или вакуумной присоской?


    1. TGrigorenko Автор
      29.11.2018 13:56

      Ответил на это чуть выше


  1. HiTechSpoon
    29.11.2018 13:56

    Вы наверное про эту статью? Но такой сканер, насколько я понял, неспособен, по крайней мере пока, отсканировать закрытую книгу в надлежащем качестве. Или эта технология шагнула вперед?


  1. ClearAirTurbulence
    29.11.2018 14:23

    Видел как-то в сети сканер, который и листал сам (
    Не этот, но похожий, и принцип действия тот же:
    www.youtube.com/watch?v=gjm6dBNlPug

    Годится только для книг в хорошем качестве, но таких большинство, а экономия времени — существенная.

    По ТЗ: сканеры чёрно-белые, поэтому можно просто отсечь длину волны лазера и получить отдельно канал с геометрией и канал с информацией из сканируемого документа.

    Цветные тоже можно сканировать, но придется делать два снимка — один страниц, один — сетки


  1. fndrey357
    29.11.2018 15:30

    Зазывалка в заголовке была про суды.
    Как пару раз отснявший арбитраж (томов по 12-15) скажу, что технических подходов как книге тем не действуют. Реально — места в комнате нет, идеально — 2 руки держат-листают-выпрямляют папки, две руки фоткают. с удовольствием еще бы две руки задействовали — пот стирать :).
    ИМХО то, что не учли авторы — это освещение. такие тени-контрасты бывают, что вообще нечитаемо.


  1. TimsTims
    29.11.2018 15:57

    Начал читать, не смотрел кто автор. Но как дошло до «мы предложили сами сделать сканер с блекджеком и лазером» — сразу понял, что пишет Крок)


  1. MrBotik
    29.11.2018 16:02

    Насколько я помню, в 2016г в суды были поставлены сканеры Optima-V. Насколько цена Оптимы отличается от вашей?


    1. TGrigorenko Автор
      29.11.2018 16:02

      Наше решение стоит примерно на процентов 20-30 дешевле. Опять же все зависит от объема закупки, от необходимости доработок под какие-то специфичные запросы и других нюансов. Допускаю, что при каких-то раскладах стоимость может выровняться, только функционал у аппаратов будет разный. К примеру, ключевым отличием нашего сканера от Оптимы является не столько цена, сколько удобство использования (нет больших движущихся механизмов, интеллектуальное выравнивание и т.д.). Мы сразу понимаем, что и как можно доработать под проект, и обычно сразу обговариваем с заказчиком в том числе и нужные доработки. То есть как таковую просто коробку спрашивают крайне редко. Потому сравнивать цены за аппараты как на прилавке магазина немного неверно. Если есть интерес к конкретному расчету, под проект, пишите на почту (в конце поста есть), посчитаем.


  1. amarao
    29.11.2018 17:03

    Я не хочу портить вам настроение…

    … Нет, я хочу.



    64 евро, весь Али завален. Версии как для A4, так и больше.


    1. balexa
      29.11.2018 18:07
      +1

      Нее, такое вы в «архивы, библиотеки, суды и другие структуры» не продадите.


      1. Rusheff
        29.11.2018 23:01

        Года два назад у меня в Росреестре сканили доки примерно таким сканером. Паспорт, выписки, договор… Быстро и нормально по качеству. Они загоняли в свою базу, мне на руки сканы не выдавали и не печатали. Но на экране вроде было норм.


    1. minusnaminus
      29.11.2018 19:33

      Попал мне такой в руки пару лет назад, когда только появились. Вернул, сказав что даже самый дешевый сканер (стоит столько же, примерно) функциональнее. Лист проще центрируется, не врет по цветам (а у меня все лампочки «теплые»), не дает искажений перспективы, занимает меньше места. И ПО было так себе. По цене выигрывает только в формате А3 и более.

      P.S: Как же разочаровался, когда понял что сканер для корабликов, как мне сначала подумалось :)


    1. Alexufo
      29.11.2018 20:59

      Никогда, никогда не покупайте это. Поверьте, потраитившему 64 бакса. Начиная от уникального драйвера который идёт только на CD, заканчивая отвратительным софтом и дико убогим шумодавом при любом освещении.


      1. amarao
        30.11.2018 12:33

        Спасибо.


  1. ilyakos
    29.11.2018 19:10

    Сканеры BookEye с вашим не пробовали сравнить? У нас на работе стоит, очень доволен и качеством и скоростью. Еще и пальцы удаляет, без которых «серединку» в толстой книге не распознать. Кстати говорят об этой пресловутой серединке, почему несколько камер под разными угламы не сделать? Тогда поидее будет еще проще выравнивание делать, так как сразу 3Д модель строится и мертвых зон нет.

    П.С. Мне всетаки кажется, что дешевле и быстрее расшить книгу и прогнать обычным проточным сканером при таких огромных размерах тома. Да и сшить по новой тоже по-идее несложно и недорого.


  1. Canapsis
    29.11.2018 20:57

    Надо чтобы рука-робот переворачивала страницы. пока что уровень автоматизации меньше 50%


  1. glagola
    29.11.2018 21:40
    +1

    Хм, я сейчас наверно глупый вопрос задам, но есть ли деструктивные сканеры? я имею ввиду что в процессе сканирования экземпляр книги просто разрушается (не до конца). Например, разбираем книгу на страницы и дальше уже в автоматическом режиме сканируем страницы залпом. можно даже организовать конвейер, человек разбирает переплет, а робот потом сканирует, по аналогии со счетными машинками в банкоматах. Мне кажется что у такого сканера скорость будет сильно выше.

    P.S. на редких/ветких экземплярах явно не прокатит, но есть же и не редкие экземпляры.


    1. VolodjaT
      29.11.2018 23:00

      так почти во всех больших офисных МФУ есть автоподача на сканер из пачки листов


  1. DmitrySpb79
    29.11.2018 23:55
    +1

    Прочитал «Сканер для судов», сначала не понял зачем на судне книжный сканер :)


  1. Plazmoid
    30.11.2018 08:06

    какие преймущества это сканера над сканером от ATIZ? Я вижу, что ATIZ бережней работает с разворотами книг, и имеет приличную скорость со встроенной автоматической фокусировкой.


  1. kgbplus
    30.11.2018 10:21

    Linear Book Scanner
    Потомок Гугловского проекта по сканированию книг.
    Делается из куска пластика, бытового пылесоса и простого планшетного сканера. Сам листает и сканирует книгу. Их есть довольно много версий, последние довольно быстрые и надежные