Началось всё с того, что однажды мы увидели гигантскую хреновину (иначе не скажешь), которая выглядела один в один, как гидравлический пресс какого-нибудь завода. Она скрипела, шипела и давила книгу. Вокруг бегали специально обученные операторы и шарахались от каждого её движения.
Выяснилось, что разные архивы, библиотеки, суды и другие структуры закупают сканеры, или, скажем так, классические решения, которые по уровню начинки очень напоминают 90-е годы. Потому что тогда были разработаны первые сканеры для библиотек, и их с тех пор не особо модифицировали.
Задачей сканера было механически выровнять сканируемый материал на плоскости, а потом отсканировать.
С тех пор поменялись две вещи:
— Подходы к конструированию электроники.
— Подходы к машинному зрению.
Первый опыт: датчики давления
Гипотеза: надо прижать книгу к стеклу не со всей дури, сколько есть, а до безопасного давления для руки. Поставить датчики и просто снимать с них показания для подъёмного стола. Это снизит страхи операторов и травматизм.
Второй опыт: выравнивание изображения
С этим результатом мы пришли к одному из заказчиков из судебной сферы. Сшитые документы в судах (чаще всего судебные дела) очень толстые. Такие же кипы документов бывают у инженеров-строителей и в разных архивах.
Гипотеза: можно выравнивать очень многое не вручную, а с помощью машинного зрения. В конце концов, даже с обычного планшета можно сегодня сфотографировать документ и сразу получить его в виде почти что ксерокопии. Чем сканер хуже?
Мы дописали софт, и там появились всякие повороты и наклоны автоматом и с подсказки оператора.
Вот что вышло:
Потом ещё игрались с настройкой предельного значения силы прижима:
Третий опыт: не надо прижимать
У нас на входе в офис стоит 3D-сканер лица, который умеет строить 3D-модель лица по одной фотографии. Делает он это с помощью проектора сетки: сравнивая наложение сетки на лицо, он вычисляет геометрию этого лица. Следующая гипотеза была логична: а зачем прижимать документ, если достаточно спроецировать на него лазерные метки?
Оказалось, достаточно лазерных полосок — вот таких:
Сверху стоит камера, которая снимает.
По ТЗ: сканеры чёрно-белые, поэтому можно просто отсечь длину волны лазера и получить отдельно канал с геометрией и канал с информацией из сканируемого документа.
Затем можно выполнить «восстановление» геометрии до того уровня, когда лазерные линии в результате снова будут прямыми. Вот что получается:
Вот, собственно, конец истории.
Задача, кстати, оказалась очень актуальной для случаев, когда приходится сканировать очень ветхие и разноформатные сшитые документы, чертежи, книги. Когда страница сыплется в труху от неаккуратного прикосновения пальцами, прижать её к плоской поверхности — это всё равно что сразу уничтожить.
Результат
У нас получилось сделать нужное решение и пустить его в серию просто потому, что, видимо, прочим игрокам рынка было неинтересно или не очень выгодно, чтобы сканеры были дешёвыми и работали быстро. Наши сканеры по сочетанию цена–эффект и цена–качество вышли очень и очень хороши.
Откуда растут ноги? Опыт работы с похожими изображениями мы получили, когда распознавали по стране данные сельскохозяйственной переписи. Тогда надо было разбирать рукописный шрифт: планшеты обходчикам дали только на следующей переписи. Плюс у нас есть лаборатория робототехники, где можно быстро собрать прототип любого устройства, которое только возникнет в наших воспалённых мозгах. Собственно, так и произошло. Мы загубили некоторое количество материалов, пока не подобрали правильную модель подъёма стола, долго ковырялись с лазерами, но нашли то что нужно.
Ну и мы — интегратор большого размера, поэтому, когда пришли к одному из заказчиков и показали наш результат, к нам прислушались. И сэкономили.
Вот три поколения наших сканеров и принципы работы:
Сканер с верхним прижимом:
Сканер с прижимом снизу:
Сканер без прижима:
Ссылки
- Сельхозперепись
- Промышленное зрение и мишки-токсикоманы
- Моя почта — bookscan@croc.ru
Комментарии (42)
Londoner
29.11.2018 11:22+1А почему не класть книгу страницами вниз на два стёкла, стоящие под углом 45 градусов к горизонту и 90 градусов друг к другу (как два ската крыши деревенского дома)? А снизу фотографировать двумя камерами. Таким образом удастся получить максимум текста в районе переплёта.
TGrigorenko Автор
29.11.2018 12:09При таком подходе неудобно переворачивать страницы, для этого необходимо поднимать книгу, будет теряться драгоценное время и книга трепется куда больше от постоянного вращения. А заказчик борется за доли секунды на сканирование разворота. Существуют похожие варианты, когда есть колыбель, расположенная так, как Вы описали, а сверху на нее ложится книга страницами вверх, и уже затем сверху опускается прижимное стекло. Эта конструкция предназначена, прежде всего, для оцифровывания плохо раскрывающихся книг. По желанию заказчика можем реализовать и такой вариант.
Londoner
29.11.2018 12:53Да, соглашусь, такой вариант намного лучше.
Я так понимаю борьба за доли секунды идёт из-за присутствия человека-листальщика, нельзя ли сделать листание тоже автоматическим?BoyanBr
29.11.2018 13:53Возможно сделать, есть такие решения. Книга кладется открытой под 90 градусов, страницами вверх. Не помню, прижимаются ли страницы. Потом фотографируются. Потом манипулятор переворачивает страницу, захвачивая ее присосками. Поищите www.google.com/search?q=book%20scanneer%20page%20turning — некоторые результаты довольно любопитны. Хотя для некоторых показаных решениях в наших реалиях дешевле и быстрее будет поставить человека переворачивать страниц.
TGrigorenko Автор
29.11.2018 13:55Стоимость решений с автоматическим переворачиванием страниц сразу уходит в горные выси. При этом, как правило, они малоприменимы к ситуации с ветхими книгами, которым требуется бережное отношение
Nick_Shl
29.11.2018 21:39+1А зачем вообще страницы переворачивать? Даёшь томографию и сканирование всей книги за раз в закрытом состоянии!
MrPurrPurr
29.11.2018 12:13Возможно потому что бОльше операций пользователю такой конструкции провести придётся.
prs123
29.11.2018 12:15-3Но… зачем сканировать отдельные страницы? Сейчас же уже применяют сканеры, сканирующие книгу в закрытом состоянии, явно быстрее и проще
HiTechSpoon
01.12.2018 07:36Вы наверное про эту статью? Но такой сканер, насколько я понял, неспособен, по крайней мере пока, отсканировать закрытую книгу в надлежащем качестве. Или эта технология шагнула вперед?
spidgorny
29.11.2018 13:55Очень не плохо. Особенно последний вариант. Но требует оператора для переворачивания страниц. Не пробовали переворачивать страницы манипулятором? Или вакуумной присоской?
HiTechSpoon
29.11.2018 13:56Вы наверное про эту статью? Но такой сканер, насколько я понял, неспособен, по крайней мере пока, отсканировать закрытую книгу в надлежащем качестве. Или эта технология шагнула вперед?
ClearAirTurbulence
29.11.2018 14:23Видел как-то в сети сканер, который и листал сам (
Не этот, но похожий, и принцип действия тот же:
www.youtube.com/watch?v=gjm6dBNlPug
Годится только для книг в хорошем качестве, но таких большинство, а экономия времени — существенная.
По ТЗ: сканеры чёрно-белые, поэтому можно просто отсечь длину волны лазера и получить отдельно канал с геометрией и канал с информацией из сканируемого документа.
Цветные тоже можно сканировать, но придется делать два снимка — один страниц, один — сетки
fndrey357
29.11.2018 15:30Зазывалка в заголовке была про суды.
Как пару раз отснявший арбитраж (томов по 12-15) скажу, что технических подходов как книге тем не действуют. Реально — места в комнате нет, идеально — 2 руки держат-листают-выпрямляют папки, две руки фоткают. с удовольствием еще бы две руки задействовали — пот стирать :).
ИМХО то, что не учли авторы — это освещение. такие тени-контрасты бывают, что вообще нечитаемо.
TimsTims
29.11.2018 15:57Начал читать, не смотрел кто автор. Но как дошло до «мы предложили сами сделать сканер с блекджеком и лазером» — сразу понял, что пишет Крок)
MrBotik
29.11.2018 16:02Насколько я помню, в 2016г в суды были поставлены сканеры Optima-V. Насколько цена Оптимы отличается от вашей?
TGrigorenko Автор
29.11.2018 16:02Наше решение стоит примерно на процентов 20-30 дешевле. Опять же все зависит от объема закупки, от необходимости доработок под какие-то специфичные запросы и других нюансов. Допускаю, что при каких-то раскладах стоимость может выровняться, только функционал у аппаратов будет разный. К примеру, ключевым отличием нашего сканера от Оптимы является не столько цена, сколько удобство использования (нет больших движущихся механизмов, интеллектуальное выравнивание и т.д.). Мы сразу понимаем, что и как можно доработать под проект, и обычно сразу обговариваем с заказчиком в том числе и нужные доработки. То есть как таковую просто коробку спрашивают крайне редко. Потому сравнивать цены за аппараты как на прилавке магазина немного неверно. Если есть интерес к конкретному расчету, под проект, пишите на почту (в конце поста есть), посчитаем.
amarao
29.11.2018 17:03Я не хочу портить вам настроение…
… Нет, я хочу.
64 евро, весь Али завален. Версии как для A4, так и больше.balexa
29.11.2018 18:07+1Нее, такое вы в «архивы, библиотеки, суды и другие структуры» не продадите.
Rusheff
29.11.2018 23:01Года два назад у меня в Росреестре сканили доки примерно таким сканером. Паспорт, выписки, договор… Быстро и нормально по качеству. Они загоняли в свою базу, мне на руки сканы не выдавали и не печатали. Но на экране вроде было норм.
minusnaminus
29.11.2018 19:33Попал мне такой в руки пару лет назад, когда только появились. Вернул, сказав что даже самый дешевый сканер (стоит столько же, примерно) функциональнее. Лист проще центрируется, не врет по цветам (а у меня все лампочки «теплые»), не дает искажений перспективы, занимает меньше места. И ПО было так себе. По цене выигрывает только в формате А3 и более.
P.S: Как же разочаровался, когда понял что сканер для корабликов, как мне сначала подумалось :)
ilyakos
29.11.2018 19:10Сканеры BookEye с вашим не пробовали сравнить? У нас на работе стоит, очень доволен и качеством и скоростью. Еще и пальцы удаляет, без которых «серединку» в толстой книге не распознать. Кстати говорят об этой пресловутой серединке, почему несколько камер под разными угламы не сделать? Тогда поидее будет еще проще выравнивание делать, так как сразу 3Д модель строится и мертвых зон нет.
П.С. Мне всетаки кажется, что дешевле и быстрее расшить книгу и прогнать обычным проточным сканером при таких огромных размерах тома. Да и сшить по новой тоже по-идее несложно и недорого.
Canapsis
29.11.2018 20:57Надо чтобы рука-робот переворачивала страницы. пока что уровень автоматизации меньше 50%
glagola
29.11.2018 21:40+1Хм, я сейчас наверно глупый вопрос задам, но есть ли деструктивные сканеры? я имею ввиду что в процессе сканирования экземпляр книги просто разрушается (не до конца). Например, разбираем книгу на страницы и дальше уже в автоматическом режиме сканируем страницы залпом. можно даже организовать конвейер, человек разбирает переплет, а робот потом сканирует, по аналогии со счетными машинками в банкоматах. Мне кажется что у такого сканера скорость будет сильно выше.
P.S. на редких/ветких экземплярах явно не прокатит, но есть же и не редкие экземпляры.VolodjaT
29.11.2018 23:00так почти во всех больших офисных МФУ есть автоподача на сканер из пачки листов
DmitrySpb79
29.11.2018 23:55+1Прочитал «Сканер для судов», сначала не понял зачем на судне книжный сканер :)
Plazmoid
30.11.2018 08:06какие преймущества это сканера над сканером от ATIZ? Я вижу, что ATIZ бережней работает с разворотами книг, и имеет приличную скорость со встроенной автоматической фокусировкой.
kgbplus
30.11.2018 10:21Linear Book Scanner
Потомок Гугловского проекта по сканированию книг.
Делается из куска пластика, бытового пылесоса и простого планшетного сканера. Сам листает и сканирует книгу. Их есть довольно много версий, последние довольно быстрые и надежные
ggo
Ориентировочные цены?
А сканеры, которые работают по принципу фотоаппарата, и умеют исправлять искажения, даже без лазерных меток, были уже 10 лет назад. И цена измерялась в десятках тысяч. Для больших объемов, это обычно проценты от общего бюджета.
TGrigorenko Автор
Подход к выравниванию без лазеров мы тоже рассматривали. Но он хорошо работает, когда необходимо сканировать небольшие книги с четкими контурами: использование лазеров/дальномеров улучшает качество выравнивания и переводит наше решение в статус промышленного устройства. Мы не говорим, что наши сканеры какие-то уникальные и ничего подобного раньше не было, просто мы создали свое, качественное и сбалансированное. Цены выгодно отличаются от конкурентов – это факт. Но на каждый случай требуется свой расчет стоимости, в зависимости от задач, которые сканер должен решать.
geisha
Кроме того, в конечном варианте сканирование такое же медленное, как на видео? Там секунд 5 проходит, прежде чем можно переворачивать страницу. Я пользовал сканер в университетской библиотеке (понятия не имею, откуда он и сколько стоит) года 4 назад и он работал со скоростью фотоаппарата.
geisha
Уточняю: сканер из библиотеки, о котором я упомянул, стоит 10к EUR в рознице. Сканер автора, если верить комментарию стоил заказчикам не меньше 5k EUR.
krab90
Вся суть бизнеса в России. Расчет варьируется от толщины кошелька заказчика.
radonit
Это вы видимо инженерное программное ПО не покупали, узнайте например стоимость Ansys или Siemens nx
AVI-crak
Такая функция сейчас есть практически во всех фотоаппаратах среднего уровня. И она неплохо справляется с текстом. Но рисунки, графики и чертежи — глюкавит со страшной силой.
Собственно в этом сама суть алгоритма — для распознавания ему необходимы символы одинаковых пропорций по всей площади документа.
Чертёж может быть от сканирован фотиком с такой функцией, но прямых линий на нём не останется.
/// ветхая документация — наше всё.