Ушедший 2022 год стал для многих компаний в некотором смысле испытанием: после успешной «перестройки» бизнес-процессов, спровоцированной COVID-19, пришлось экстренно адаптироваться к новой реальности. Несмотря на возникшую турбулентность, мы в Smart Engines хорошо поработали и достигли отличных результатов как в технологиях и науке, так и в бизнесе. Даже об экологии не забыли. За деталями - заглядывайте под кат.
Сегодняшнюю статью мы решили разбить на несколько частей. Сначала мы вкратце расскажем про новые фичи и технологические достижения (естественно, ведь Хабр - это прежде всего технологическая площадка), которые удалось реализовать в ушедшем году. Далее - бегло коснемся научной составляющей, качественно и количественно поделимся нашими результатам в этой области. Третья часть настоящей статьи - совсем короткая, сухая, про бизнес и цифры. А в заключение расскажем про наш вклад в борьбу с глобальным потеплением!
Новые за 2022 год фичи в продуктах
Начнем мы с раздела, который нам особенно приятно писать! Ведь помимо общего развития системы и повышения качества распознавания (на минуточку, за 2022 год количество допускаемых ошибок системы Smart Engines при распознавании ID документов сократились на четверть, было добавлено 566 новых документов и 1160 новых шаблонов, доведя тем самым число поддерживаемых документов до солидных 2427 с 3703 шаблонами) мы разработали немало уникальных технологий, которые уже сегодня доступны в наших продуктах!
Полнотекстовое распознавание
В 2022 году Smart Engines, в рамках Smart Document Engine, представила систему распознавания текста нового поколения, которая умеет находить документ на фотографии или скане и распознавать все текстовые данные на 102 языках. Решение получилось чрезвычайно быстрым: система распознает 15 страниц в секунду и полностью обрабатывает фотографию листа А4 за 3-4 секунды (внимание!) на смартфоне! В серверных решениях на 32-ядерном HPC без применения GPU скорость полнотекстового распознавания достигает 15 страниц в секунду.
Созданная технология способна распознать текст, даже если оригинальный бумажный документ до этого был сложен. Другими словами, она превращает обычный смартфон в мгновенный сканер, делая при этом традиционные планшетные сканеры попросту ненужными. Smart Document Engine позволяет даже создавать PDF/A, если требуется отправить отсканированный образ в стандартизованном виде.
Полнотекстовое распознавание является ключевым элементом ввода документов в системах электронного документооборота, управления бизнес-процессами, электронных архивах и RPA-системах. От скорости и точности извлечения данных напрямую зависит трудоемкость и возможная глубина автоматизации процесса обработки документов. Все это позволяет нам уверенно говорить, что Smart Document Engine на сегодняшний день является мощным инструментом, готовым с легкостью заместить соответствующие программные продукты ABBYY и созданные на их основе решения, а также другое иностранное ПО в корпоративном и государственном секторах. При этом технология создания компактной PDF/A-версии документа с текстовым слоем нативно поддерживается всеми современными архивными системами.
Распознавание первичных документов
В 2022 году Smart Engines выпустила систему распознавания первичной бухгалтерской и финансовой документации, которая работает не только на серверах для обработки документов с потоковых сканеров, но и на мобильных телефонах. Система автоматически классифицирует и распознает счета-фактуры, ТОРГ-12, УПД, товарно-транспортные накладные, акты и счета на оплату и др. На сегодняшний день Smart Document Engine поддерживает 57 различных первичных, кадровых и регистрационных документов, детализированный список поддерживаемых документов в спойлере.
Список поддерживаемых документов Smart Document Engine
АДИ-РЕГ
Акт
Акт по форме 1с
Акт МХ-1 (приема-передачи товарно-материальных ценностей на хранение)
Акт МХ-3 (о возврате товарно-материальных ценностей, сданных на хранение)
Акт ОС-1а (о приеме-передачи здания (сооружения))
Акт ОС-1 (о приеме-передачи объекта основных средств (кроме зданий, сооружений))
Акт КС-2 (о приемке выполненных работ)
Акт ОС-4 (о списании объекта основных средств (кроме автотранспортных средств))
Акт сверки
Бухгалтерский баланс
Выписка из Единого Государственного Реестра Индивидуальных Предпринимателей
Выписка из Единого Государственного Реестра Недвижимости
Выписка из Единого Государственного Реестра Юридических Лиц
График отпусков
Диплом
Договор
Дополнительное соглашение к договору
Инвентаризационная опись основных средств
Корректировочный счет-фактура
Накладная на передачу готовой продукции в места хранения
Отчет о финансовых результатах
Платежное поручение
Платежное требование
Приказ (распоряжение) о приеме работника на работу (Форма Т-1)
Личная карточка работника (Форма Т-2)
Приказ (распоряжение) о предоставлении отпуска работнику (Форма Т-6)
Приказ (распоряжение) о прекращении (расторжении) трудового договора с работником (увольнении) (Форма Т-8)
Приказ (распоряжение) о прекращении (расторжении) трудового договора с работниками (увольнении) (Форма Т-8а)
Протокол согласования цен поставки лекарственных препаратов
Реестр сертификатов и деклараций (приложение к накладной)
Сведения о трудовой деятельности по форме СТД-Р
Свидетельство ИНН
Свидетельство о внесении записи в Единый государственный реестр юридических лиц о юридическом лице, зарегистрированном до 1 июля 2002 года, Форма №P57001
Свидетельство о внесении записи в Единый государственный реестр юридических лиц, Форма №P50003
Свидетельство о государственной регистрации юридического лица, Форма №P51001
Свидетельство о государственной регистрации юридического лица, Форма №P51003
Свидетельство о постановке на учет организации в налоговом органе по месту ее нахождения, Форма №1-1-Учет
Свидетельство о постановке на учет юридического лица в налоговом органе по месту нахождения на территории Российской Федерации, Форма №09-1-2
Сличительная ведомость результатов инвентаризации товарно-материальных ценностей
Справка 182н с предыдущего места работы
Справка о доходах физ. лица
Справка о постановке на учет (снятии с учета) физического лица в качестве налогоплательщика налога на профессиональный доход
Справка о стоимости выполненных работ и затрат
Счет на оплату
Счет на оплату по форме 1С
Счет-фактура
Тест ПЦР
Тест ПЦР на английском языке
Титульный лист Устава
Товарная накладная ТОРГ-12
Товарно-транспортная накладная
Транспортная накладная
Требование-накладная
Универсальный корректировочный документ
Универсальный передаточный документ
Штатное расписание
Высокое качество и уникальные скоростные характеристики продукта позволяют реализовать концепцию мобильного бэк-офиса, когда сотрудники сканируют и вводят данные первичных документов при помощи смартфона или планшета. Использовать решение можно не только в единых центрах ввода, куда централизованно поступают на обработку бумажные документы, но и непосредственно при приеме документов от контрагентов.
Сканер номера
Команда Smart Engines обучила нейронные сети сканировать и распознавать не только печатные номера телефонов, но и написанные от руки. Для того чтобы отсканировать номер в режиме реального времени, пользователю достаточно показать его камере телефона.
Эта технология уже позволила некоторым банкам (МКБ, Альфа-Банк) сделать переводы для клиентов значительно удобнее: в случаях, когда номер телефона получателя платежа написан от руки (например, на ярмарках, рынках и других объектах мелкой розницы), можно больше не вводить номер вручную.
Улучшение клиентского пути и совершенствование качества сервиса невозможно без применения новейших технологических продуктов. Это особенно важно сегодня, когда конкуренция за клиента выросла. Решение наших партнеров из Smart Engines сократило время и повысило удобство пользователей «МКБ Онлайн» на совершение денежных переводов через СБП.
Владислав Ермаков
Начальник управления развития дистанционного
банковского обслуживания МКБ
Любые платежи прямо в браузере
В 2022 году крупнейшие российские банки оказались в сложном положении: их мобильные приложения были удалены из App Store и Google Play, а пользователи лишились привычного и удобного способа оплаты.
Smart Engines предложила банкам собственное инновационное решение, способное считывать разные данные – например, QR-коды или банковские карты – с камеры смартфона непосредственно в браузере с помощью WebAssembly (WASM).
Как это работает? Решение Smart Engines на основе WASM интегрируется в PWA банка (progressive web app — технология в веб-разработке, которая визуально и функционально трансформирует сайт в мобильное приложение), сохраняя функционал для клиента. WASM позволяет запускать программы непосредственно на веб-странице интернет-банка на смартфоне. Таким образом, этот способ дает возможность использовать версию, более близкую к нативному мобильному приложению, в обход привычных магазинов на iOS и Android
Forbes.ru, статья "Распознавание доходов: как AI-компания заработала на попавших под санкции банках" от 23.01.2023 г.
Опрошенные Forbes эксперты назвали решение Smart Engines уникальным, безопасным и востребованным среди компаний российского финансового сектора.
Действительно, внедрение этой технологии дало возможность владельцам смартфонов совершать ежедневные платежи в интернет-версиях банков с таким же уровнем комфорта, как в мобильном приложении. Теперь ею ежедневно пользуются миллионы клиентов ВТБ, банка “РОССИЯ” и Альфа-Банка.
Кстати, про эту технологию, на примере внедрения в бизнес-процесс Альфа-Банка, мы уже писали на Хабре во всех красках.
Мобильное приложение Альфа-Банка высоко оценили независимые аналитики: оно заняло первую строчку в рейтинге агентства Markswebb. Альфа-Онлайн лидерует во всех номинациях – ежедневный банкинг (daily banking) и цифровой офис (digital office) со значительным отрывом от всех конкурентов.
Качественный скачок в распознавании паспорта РФ
В ушедшем году мы полностью переработали все компоненты технологии обработки российского паспорта. Это позволило улучшить качество распознавания всего документа, снизив число ошибок в 3,2 раза при сохранении скоростных характеристик системы. Время распознавания данных основного разворота паспорта на 1 кадре на мобильном телефоне составляет 0,15 секунды, а на сервере – 55 изображений в секунду без применения GPU.
Достигнутый уровень качества распознавания позволяет заявить о переходе процесса сканирования, извлечения и последующего введения данных в корпоративные системы в автоматический режим. С помощью решения Smart Engines компании, отказавшись от ручного ввода паспортных данных, смогут переориентировать операторов на более важные задачи, а заодно снизить риски – вызванные человеческим фактором ошибки, утечки данных через операторов и мошеннические действия сотрудников.
Сейчас наша система в реальном времени распознает все страницы и данные паспорта РФ, в том числе рукописные поля, а также проверяет его подлинность. Выпустив новую версию, мы сделали процесс распознавания и ввода паспортных данных автоматическим. Качество распознавания паспорта РФ, которого мы достигли в 2022 году, существенно превосходит качество ручного ввода операторами. Это позволяет поднять уровень клиентского обслуживания в отделениях и в дистанционных каналах.
канд. тех. наук Владимир Арлазаров
Генеральный директор Smart Engines
Технологии определения фальсификаций документов
Продукты Smart Engines теперь позволяют не только распознать данные, но и проверить предъявляемый документ на предмет наличия признаков фальсификации. Разработанная нашей командой в 2022 году комплексная система искусственного интеллекта решит задачи обнаружения цифровой и физической подделки документов и предупредит факт мошенничества.
За счет использования последних достижений в области ИИ система обнаруживает и предотвращает широкий спектр атак на предъявление фальсифицированных документов, включая предъявление ксерокопии документа или даже изображения документа на мониторе или планшете.
За счет реализации принципа “Fraud Detection via Recognition”, в рамках которого ИИ использует все данные и признаки, выявленные на всех этапах распознавания документов, система позволяет выявлять множество способов подделки документов как на обычных сканах, фотографиях и видео, так и на мультиспектральных изображениях, полученных с помощью специальных устройств.
Подход Science First
Несмотря ни на какие разговоры (где-то беспочвенные, а где-то, к сожалению, реальные) о притеснении ученых из России, в 2022 году нам удалось достигнуть грандиозных научных результатов:
Опубликовано 32 научных статьи в ведущих международных и российских рецензируемых журналах, 19 из которых индексируется Web of Science (WoS) и Scopus, причем 10 из них - в журналах из Q1
Опубликовано 20 докладов в сборниках конференций, 11 из которых индексируются Web of Science (WoS) и Scopus
Представлено 13 докладов на международных конференциях, включая ICPR, ICMV, Synchrotron and Free electron laser Radiation: generation and application (SFR-22), Современная рентгеновская оптика - 2022, ИТИС и другие
За минувший год в сумме сотрудники Smart Engines представили 65 научных работ.
Помимо научных публикаций мы совместно с французскими коллегами из университета La Rochelle выпустили два новых датасета в области распознавания и проверки подлинности документов:
MIDV-2020: A Comprehensive Benchmark Dataset for Identity Document Analysis [ссылка]
Document Liveness Challenge Dataset (DLC-2021) [ссылка]
Мы продолжили работу по изучению возможностей предложенной нами в 2020 году новой технологии “Томография под контролем реконструкции”. Она позволяет сократить лучевую нагрузку, получаемую в ходе томографического исследования, до 30%. В 2023 году в журнал "Kомпьютерная оптика" принята к печати наша новая научная работа, выполненная совместно с немецкими коллегами, в которой проанализированы результаты реконструкции в случае использования алгоритмов разного типа.
Кроме того, в работе “Reprojection-based numerical measure of robustness for CT reconstruction neural networks algorithms” [ссылка], опубликованной в журнале Mathematics, мы представили результаты исследования устойчивости нейросетевых моделей, используемых в томографической реконструкции, к возможным атакам.
Мы гордимся тем, что наши показатели — относящиеся как к коммерческой, так и научной деятельности — продолжают неуклонно расти. Это свидетельствует о том, что бизнес и наука в нашей компании гармонично сосуществуют и стимулируют взаимное развитие.
канд. тех. наук Владимир Арлазаров
Генеральный директор Smart Engines
Эти и другие прикладные и фундаментальные исследования мы ведем совместно с учеными из ведущих институтов РАН в области ИИ и Компьютерной томографии – ФИЦ ИУ РАН, ИППИ РАН, ФНИЦ “Кристаллография и фотоника” ИК РАН.
В этом году мы сместили фокус по стажировкам студентов с МФТИ на Мехмат и ВМК МГУ. И не пожалели! Как и предполагалось, МГУ готовит отличные кадры с фундаментальным математическим образованием, что как раз и требуется для исследований в области ИИ, компьютерного зрения и компьютерной томографии.
Кстати, в 2023 году мы планируем расширять программы стажировки для студентов МГУ (факультеты Мехмат, ВМК, Физфак) и Физтеха, начиная с 4 курса. Если заинтересовала стажировка у нас в команде – присылайте резюме по адресу job@smartengines.ru.
Сильные бизнес-результаты
Все проделанное закономерно принесло свои бизнес-плоды. Несмотря на сильную турбулентность рынка сбыта высоких технологий нам удалось практически вдвое увеличить количество проданных распознаваний документов и, естественно, размер выручки.
Таким образом, наши значимые бизнес-достижения в 2022 году тезисно можно сформулировать следующим образом:
Количество проданных распознаваний для безопасного извлечения данных в мобильных приложениях, интернет-решениях и других информационных системах составило 216 млн - это на 91% больше, чем в 2021 году;
Выручка компании в 2022 году превысила 400 млн рублей, что на 43% больше, чем в 2021 году;
Использовать программные продукты Smart Engines начали ВТБ, Банк Открытие, Банк Россия, Банк Точка, ювелирная сеть SOKOLOV;
МТС на основе решения Smart Engines выстроила собственный сервис, позволяющий распознавать документы и верифицировать данные пользователей;
Активное развитие получили проекты в Альфа-Банке, Газпромбанке, ОТП Банке, Райффайзенбанке, НСПК, ЕАБР, в компании “АльфаСтрахование” и других.
Наш вклад в борьбу с глобальным потеплением
Как мы уже несколько раз писали на Хабре, алгоритмы Smart Engines с применением фирменной природосберегающей технологии GreenOCR® на смартфоне позволяют распознать паспорт РФ за 0,15 секунды. На каждое распознавание выделяется 0,0001432891146 грамм СО2. Мы подсчитали, что высадка 1 гектара дубового леса компенсирует ~3,8 миллиарда распознаваний.
В октябре 2022 года в национальном парке “Угра” в Калужской области – на участке площадью 1 гектар – мы высадили 4000 сеянцев дуба черешчатого. Этот дубовый лес способен поглотить 556,7 тонн углерода за 50 лет.
Важный момент - компания Smart Engines не просто “скинулась” деньгами ради получения заветного сертификата. От Smart Engines в Калужскую область была направлена делегация во главе с PR-директором, лично участвовавшем в посадке деревьев.
Мы – компания, разрабатывающая программное обеспечение для распознавания изображений, основанных на многолетних фундаментальных трудах российских учёных в области искусственного интеллекта и машинного зрения. Используем в своей работе мощные компьютеры, потребляющие электроэнергию и выбрасывающие в воздух углерод. И чтобы компенсировать этот вред на десять лет вперёд, мы решили посадить в “Угре” четыре тысячи молодых дубов. Это наш первый, но не последний шаг
Владислав Новый
PR-директор Smart Engines
А что в заключении? Прогноз на 2023 год!
Самое логичное, что может быть в заключении в сегодняшней статье - это представить нашему читателю планы Smart Engines на 2023 год. Пожалуй, сформулировать это лучше генерального директора Владимира Арлазарова никто не сможет:
В 2023 году с технологической точки зрения мы собираемся расти по трем направлениям. Кроме томографии, которую мы в 2023 году намерены обозначить как бизнес-направление, мы планируем расширить область распознавания во всех обычных отраслях. Сделать так, чтобы для бизнес-сообщества именно обработка фотографий документов на мобильных телефонах и серверах стала стандартом.
канд. тех. наук Владимир Арлазаров
Генеральный директор Smart Engines
В интервью CNews 23.12.2022 г.
Желаем в наступившем году всем читателям Хабра, и себе, конечно, же тоже, достижения всех поставленных целей, продуктивной работы, успехов на творческом пути!
Комментарии (16)
heiheshang
25.01.2023 17:25Пробовали мы это решение. Фигня, оказалось что быстро распознается MRZ на паспорте, а паспорт уже за 10-12 сек, человек всяко быстрее забивает данные. А MRZ обычным китайским сканером ручным за 50$ сканируется.
SmartEngines Автор
25.01.2023 17:49За 10 секунд на 32-х ядерном сервере, без использования GPU мы распознаем примерно 550 изображений разворотов паспортов РФ. Это совсем не коррелирует с Вашими "замерами". Возможно, Вы все-таки тестировали не наше ПО?
heiheshang
26.01.2023 03:41-1нет, на обычном компе, нет у нас 32-х ядерного сервера. Эфективные менеджеры купили библиотеку не для серверного распазнования, а второй раз тратить деньги уже ни кто не был готов.
Alexufo
26.01.2023 09:37Скорее всего под сервер и десктоп либа будет одна. 12 секунд может быть при неправильном использовании. Например, вы каждый раз инициализируете ее и после распознавания убиваете инстанс. Это не вариант php, отработал и умри, это вариант демона.
Для десктопов/серверов выключена ленивая инициализация, разогрев при старте дольше, но последующие вызовы в библиотеку идут без каких либо затрат на инициализацию. Вы можете, наоборот, ее включить, чтобы не переписывать решение.( это не оптимально) В моем случае на двуядерном не больше 2,3,4 (когда скан с а4, когда с ватсапа) секунд вместе с запросом на сервер и это не mrz, а весь документ заграна.
heiheshang
26.01.2023 11:39ну мне сами ребята со smart engines сказали что 10 секунд на паспорт нормально после чего мы отстали.
Alexufo
26.01.2023 11:45Ну может вы описали свое внедрение, тогда это ожидаемо, нормально, но не оптимально. Яж не знаю, что и как у вас. Когда я тестировал несколько лет назад при выборе решения, у меня была распознавалка от аби, вот она работала ~7-12 cекунд но она просто не умела работать ни с чем, кроме идеальных сканов, а пошли уже фотки с мобилок и тут считай без альтернатив...
SmartEngines Автор
27.01.2023 21:41Это очень странное заявление. Мы уже неоднократно заявляли скоростные характеристики: распознавание скана одной страницы паспорта на персональном компьютере с конфигурацией Intel(R) Core(™) i7-2600 CPU @ 3,40 GHz, 8 Гб ОЗУ, Windows 7 SP1 64bit занимает в среднем 0,087 сек.
Кстати, если Вы вспомните, кто Вам из наших сотрудников заявлял такую производительность - мы были бы крайне благодарны!
evoq
26.01.2023 01:12Первую страницу за 12 секунд переносят? Че-то вы чешете
SmartEngines Автор
27.01.2023 21:42Возможно, уважаемый читатель @heiheshang просто что-то путает, мы постараемся разобраться и внести ясность
heiheshang
28.01.2023 06:58Ничего я не путаю. Купили сканеры ваши в которых китайская камера стоит и светодиоды с поддсветкой, кассиры отказались с ними работать потому-что в глаза свет бьет. В сканерах настраивали фокус сами потому-что оказалось что расфокусировка идет, как вы сказали так и сделали, разобрали сканер камеру подкрутили. Обучали программу вы сами мы вам сканц поспортов скинули, вы нам файлик с настройками. Тестили утилитой вашей же, которая со сканером идет. MRZ распознавалась за 1-2 сек на наших компах, а сам паспорт главная страница там где все по русски за 10-12 сек. Если бы у нас были мощные компы наверное быстрее было, но имеем что имеем. У меня сканер до сих пор дома лежит. 5 лет прошло, сейчас картина может быть другая, я не спорю.
Alexufo
26.01.2023 01:51А когда я тестировал, оказалась не фигня. Особенно с mrz, присланными в ватсап с "утюга" где то из деревень на кавказских горах. Криво косо, но распознавать надо.
heiheshang
26.01.2023 05:12MRZ я и не говорил что долго, но и смысла нет, обычный китайский ручной сканер делает это на ура.
Alexufo
26.01.2023 09:39А нет в горах Кавказа сканера китайского, там телефон с камерой редкость, а договора заключать надо.
Вообще, когда паспорт где то физически, это да, можно и железками, а если все удаленно по ватсапам...то без софта никак.
vdp
А сливаете всё, что сканируете сразу в КГБ ? А кто имеет доступ к серверам ?
Как узнать, кто ещё читает, то, что я сканирую ?
Да и насмешили Вы про беспочвенные притеснения ученых из России.
SmartEngines Автор
Мы несколько раз уже писали в наших публикациях на Хабре, и готовы еще раз пояснить:
Программное обеспечение Smart Engines НЕ передает личные данные на обработку в сторонние сервисы и/или третьим лицам для ручного ввода, НЕ сохраняет данные — все обработка ведется в локальной оперативной памяти устройства, НЕ требует сетевого соединения.
Alexufo
Если коммерческий ocr то сразу облака мерещатся?)) Нет, это все оффлайн движки под кучу платформ.