Ушедший 2022 год стал для многих компаний в некотором смысле испытанием: после успешной «перестройки» бизнес-процессов, спровоцированной COVID-19, пришлось экстренно адаптироваться к новой реальности. Несмотря на возникшую турбулентность, мы в Smart Engines хорошо поработали и достигли отличных результатов как в технологиях и науке, так и в бизнесе. Даже об экологии не забыли. За деталями - заглядывайте под кат.

Сегодняшнюю статью мы решили разбить на несколько частей. Сначала мы вкратце расскажем про новые фичи и технологические достижения (естественно, ведь Хабр - это прежде всего технологическая площадка), которые удалось реализовать в ушедшем году. Далее - бегло коснемся научной составляющей, качественно и количественно поделимся нашими результатам в этой области. Третья часть настоящей статьи - совсем короткая, сухая, про бизнес и цифры. А в заключение расскажем про наш вклад в борьбу с глобальным потеплением!

Новые за 2022 год фичи в продуктах

Начнем мы с раздела, который нам особенно приятно писать! Ведь помимо общего развития системы и повышения качества распознавания (на минуточку, за 2022 год количество допускаемых ошибок системы Smart Engines при распознавании ID документов сократились на четверть, было добавлено 566 новых документов и 1160 новых шаблонов, доведя тем самым число поддерживаемых документов до солидных 2427 с 3703 шаблонами) мы разработали немало уникальных технологий, которые уже сегодня доступны в наших продуктах!

Полнотекстовое распознавание

В 2022 году Smart Engines, в рамках Smart Document Engine, представила систему распознавания текста нового поколения, которая умеет находить документ на фотографии или скане и распознавать все текстовые данные на 102 языках. Решение получилось чрезвычайно быстрым: система распознает 15 страниц в секунду и полностью обрабатывает фотографию листа А4 за 3-4 секунды (внимание!) на смартфоне! В серверных решениях на 32-ядерном HPC без применения GPU скорость полнотекстового распознавания достигает 15 страниц в секунду.

Созданная технология способна распознать текст, даже если оригинальный бумажный документ до этого был сложен. Другими словами, она превращает обычный смартфон в мгновенный сканер, делая при этом традиционные планшетные сканеры попросту ненужными. Smart Document Engine позволяет даже создавать PDF/A, если требуется отправить отсканированный образ в стандартизованном виде.

Полнотекстовое распознавание является ключевым элементом ввода документов в системах электронного документооборота, управления бизнес-процессами, электронных архивах и RPA-системах. От скорости и точности извлечения данных напрямую зависит трудоемкость и возможная глубина автоматизации процесса обработки документов. Все это позволяет нам уверенно говорить, что Smart Document Engine на сегодняшний день является мощным инструментом, готовым с легкостью заместить соответствующие программные продукты ABBYY и созданные на их основе решения, а также другое иностранное ПО в корпоративном и государственном секторах. При этом технология создания компактной PDF/A-версии документа с текстовым слоем нативно поддерживается всеми современными архивными системами.

Распознавание первичных документов

В 2022 году Smart Engines выпустила систему распознавания первичной бухгалтерской и финансовой документации, которая работает не только на серверах для обработки документов с потоковых сканеров, но и на мобильных телефонах. Система автоматически классифицирует и распознает счета-фактуры, ТОРГ-12, УПД, товарно-транспортные накладные, акты и счета на оплату и др. На сегодняшний день Smart Document Engine поддерживает 57 различных первичных, кадровых и регистрационных документов, детализированный список поддерживаемых документов в спойлере.

Список поддерживаемых документов Smart Document Engine
  • АДИ-РЕГ

  • Акт

  • Акт по форме 1с

  • Акт МХ-1 (приема-передачи товарно-материальных ценностей на хранение)

  • Акт МХ-3 (о возврате товарно-материальных ценностей, сданных на хранение)

  • Акт ОС-1а (о приеме-передачи здания (сооружения))

  • Акт ОС-1 (о приеме-передачи объекта основных средств (кроме зданий, сооружений))

  • Акт КС-2 (о приемке выполненных работ)

  • Акт ОС-4 (о списании объекта основных средств (кроме автотранспортных средств))

  • Акт сверки

  • Бухгалтерский баланс

  • Выписка из Единого Государственного Реестра Индивидуальных Предпринимателей

  • Выписка из Единого Государственного Реестра Недвижимости

  • Выписка из Единого Государственного Реестра Юридических Лиц

  • График отпусков

  • Диплом

  • Договор

  • Дополнительное соглашение к договору

  • Инвентаризационная опись основных средств

  • Корректировочный счет-фактура

  • Накладная на передачу готовой продукции в места хранения

  • Отчет о финансовых результатах

  • Платежное поручение

  • Платежное требование

  • Приказ (распоряжение) о приеме работника на работу (Форма Т-1)

  • Личная карточка работника (Форма Т-2)

  • Приказ (распоряжение) о предоставлении отпуска работнику (Форма Т-6)

  • Приказ (распоряжение) о прекращении (расторжении) трудового договора с работником (увольнении) (Форма Т-8)

  • Приказ (распоряжение) о прекращении (расторжении) трудового договора с работниками (увольнении) (Форма Т-8а)

  • Протокол согласования цен поставки лекарственных препаратов

  • Реестр сертификатов и деклараций (приложение к накладной)

  • Сведения о трудовой деятельности по форме СТД-Р

  • Свидетельство ИНН

  • Свидетельство о внесении записи в Единый государственный реестр юридических лиц о юридическом лице, зарегистрированном до 1 июля 2002 года, Форма №P57001

  • Свидетельство о внесении записи в Единый государственный реестр юридических лиц, Форма №P50003

  • Свидетельство о государственной регистрации юридического лица, Форма №P51001

  • Свидетельство о государственной регистрации юридического лица, Форма №P51003

  • Свидетельство о постановке на учет организации в налоговом органе по месту ее нахождения, Форма №1-1-Учет

  • Свидетельство о постановке на учет юридического лица в налоговом органе по месту нахождения на территории Российской Федерации, Форма №09-1-2

  • Сличительная ведомость результатов инвентаризации товарно-материальных ценностей

  • Справка 182н с предыдущего места работы

  • Справка о доходах физ. лица

  • Справка о постановке на учет (снятии с учета) физического лица в качестве налогоплательщика налога на профессиональный доход

  • Справка о стоимости выполненных работ и затрат

  • Счет на оплату

  • Счет на оплату по форме 1С

  • Счет-фактура

  • Тест ПЦР

  • Тест ПЦР на английском языке

  • Титульный лист Устава

  • Товарная накладная ТОРГ-12

  • Товарно-транспортная накладная

  • Транспортная накладная

  • Требование-накладная

  • Универсальный корректировочный документ

  • Универсальный передаточный документ

  • Штатное расписание

Высокое качество и уникальные скоростные характеристики продукта позволяют реализовать концепцию мобильного бэк-офиса, когда сотрудники сканируют и вводят данные первичных документов при помощи смартфона или планшета. Использовать решение можно не только в единых центрах ввода, куда централизованно поступают на обработку бумажные документы, но и непосредственно при приеме документов от контрагентов.

Сканер номера

Команда Smart Engines обучила нейронные сети сканировать и распознавать не только печатные номера телефонов, но и написанные от руки. Для того чтобы отсканировать номер в режиме реального времени, пользователю достаточно показать его камере телефона.

Эта технология уже позволила некоторым банкам (МКБ, Альфа-Банк) сделать переводы для клиентов значительно удобнее: в случаях, когда номер телефона получателя платежа написан от руки (например, на ярмарках, рынках и других объектах мелкой розницы), можно больше не вводить номер вручную.

Улучшение клиентского пути и совершенствование качества сервиса невозможно без применения новейших технологических продуктов. Это особенно важно сегодня, когда конкуренция за клиента выросла. Решение наших партнеров из Smart Engines сократило время и повысило удобство пользователей «МКБ Онлайн» на совершение денежных переводов через СБП.

Владислав Ермаков
Начальник управления развития дистанционного
банковского обслуживания МКБ

Любые платежи прямо в браузере

В 2022 году крупнейшие российские банки оказались в сложном положении: их мобильные приложения были удалены из App Store и Google Play, а пользователи лишились привычного и удобного способа оплаты.

Smart Engines предложила банкам собственное инновационное решение, способное считывать разные данные – например, QR-коды или банковские карты – с камеры смартфона непосредственно в браузере с помощью WebAssembly (WASM).

Как это работает? Решение Smart Engines на основе WASM интегрируется в PWA банка (progressive web app — технология в веб-разработке, которая визуально и функционально трансформирует сайт в мобильное приложение), сохраняя функционал для клиента. WASM позволяет запускать программы непосредственно на веб-странице интернет-банка на смартфоне. Таким образом, этот способ дает возможность использовать версию, более близкую к нативному мобильному приложению, в обход привычных магазинов на iOS и Android

Forbes.ru, статья "Распознавание доходов: как AI-компания заработала на попавших под санкции банках" от 23.01.2023 г.

Опрошенные Forbes эксперты назвали решение Smart Engines уникальным, безопасным и востребованным среди компаний российского финансового сектора.

Действительно, внедрение этой технологии дало возможность владельцам смартфонов совершать ежедневные платежи в интернет-версиях банков с таким же уровнем комфорта, как в мобильном приложении. Теперь ею ежедневно пользуются миллионы клиентов ВТБ, банка “РОССИЯ” и Альфа-Банка.

Кстати, про эту технологию, на примере внедрения в бизнес-процесс Альфа-Банка, мы уже писали на Хабре во всех красках.

Мобильное приложение Альфа-Банка высоко оценили независимые аналитики: оно заняло первую строчку в рейтинге агентства Markswebb. Альфа-Онлайн лидерует во всех номинациях – ежедневный банкинг (daily banking) и цифровой офис (digital office) со значительным отрывом от всех конкурентов.

Качественный скачок в распознавании паспорта РФ

В ушедшем году мы полностью переработали все компоненты технологии обработки российского паспорта. Это позволило улучшить качество распознавания всего документа, снизив число ошибок в 3,2 раза при сохранении скоростных характеристик системы. Время распознавания данных основного разворота паспорта на 1 кадре на мобильном телефоне составляет 0,15 секунды, а на сервере – 55 изображений в секунду без применения GPU.

Достигнутый уровень качества распознавания позволяет заявить о переходе процесса сканирования, извлечения и последующего введения данных в корпоративные системы в автоматический режим. С помощью решения Smart Engines компании, отказавшись от ручного ввода паспортных данных, смогут переориентировать операторов на более важные задачи, а заодно снизить риски – вызванные человеческим фактором ошибки, утечки данных через операторов и мошеннические действия сотрудников.

Сейчас наша система в реальном времени распознает все страницы и данные паспорта РФ, в том числе рукописные поля, а также проверяет его подлинность. Выпустив новую версию, мы сделали процесс распознавания и ввода паспортных данных автоматическим. Качество распознавания паспорта РФ, которого мы достигли в 2022 году, существенно превосходит качество ручного ввода операторами. Это позволяет поднять уровень клиентского обслуживания в отделениях и в дистанционных каналах.

канд. тех. наук Владимир Арлазаров
Генеральный директор Smart Engines

Технологии определения фальсификаций документов

Продукты Smart Engines теперь позволяют не только распознать данные, но и проверить предъявляемый документ на предмет наличия признаков фальсификации. Разработанная нашей командой в 2022 году комплексная система искусственного интеллекта решит задачи обнаружения цифровой и физической подделки документов и предупредит факт мошенничества.

За счет использования последних достижений в области ИИ система обнаруживает и предотвращает широкий спектр атак на предъявление фальсифицированных документов, включая предъявление ксерокопии документа или даже изображения документа на мониторе или планшете.

За счет реализации принципа “Fraud Detection via Recognition”, в рамках которого ИИ использует все данные и признаки, выявленные на всех этапах распознавания документов, система позволяет выявлять множество способов подделки документов как на обычных сканах, фотографиях и видео, так и на мультиспектральных изображениях, полученных с помощью специальных устройств.

Подход Science First

Несмотря ни на какие разговоры (где-то беспочвенные, а где-то, к сожалению, реальные) о притеснении ученых из России, в 2022 году нам удалось достигнуть грандиозных научных результатов:

  • Опубликовано 32 научных статьи в ведущих международных и российских рецензируемых журналах, 19 из которых индексируется Web of Science (WoS) и Scopus, причем 10 из них - в журналах из Q1

  • Опубликовано 20 докладов в сборниках конференций, 11 из которых индексируются Web of Science (WoS) и Scopus

  • Представлено 13 докладов на международных конференциях, включая ICPR, ICMV, Synchrotron and Free electron laser Radiation: generation and application (SFR-22), Современная рентгеновская оптика - 2022, ИТИС и другие

За минувший год в сумме сотрудники Smart Engines представили 65 научных работ.

Помимо научных публикаций мы совместно с французскими коллегами из университета La Rochelle выпустили два новых датасета в области распознавания и проверки подлинности документов:

  • MIDV-2020: A Comprehensive Benchmark Dataset for Identity Document Analysis [ссылка]

  • Document Liveness Challenge Dataset (DLC-2021) [ссылка]

Мы продолжили работу по изучению возможностей предложенной  нами в 2020 году новой технологии “Томография под контролем реконструкции”. Она позволяет сократить лучевую нагрузку, получаемую в ходе томографического исследования, до 30%. В 2023 году в журнал "Kомпьютерная оптика" принята к печати наша новая научная работа, выполненная совместно с немецкими коллегами, в которой проанализированы результаты реконструкции в случае использования алгоритмов разного типа.

Кроме того, в работе “Reprojection-based numerical measure of robustness for CT reconstruction neural networks algorithms” [ссылка], опубликованной в журнале Mathematics, мы представили результаты исследования устойчивости нейросетевых моделей, используемых в томографической реконструкции, к возможным атакам.

Мы гордимся тем, что наши показатели — относящиеся как к коммерческой, так и научной деятельности — продолжают неуклонно расти. Это свидетельствует о том, что бизнес и наука в нашей компании гармонично сосуществуют и стимулируют взаимное развитие.

канд. тех. наук Владимир Арлазаров
Генеральный директор Smart Engines

Эти и другие прикладные и фундаментальные исследования мы ведем совместно с учеными из ведущих институтов РАН в области ИИ и Компьютерной томографии – ФИЦ ИУ РАН, ИППИ РАН, ФНИЦ “Кристаллография и фотоника” ИК РАН.

В этом году мы сместили фокус по стажировкам студентов с МФТИ на Мехмат и ВМК МГУ. И не пожалели! Как и предполагалось, МГУ готовит отличные кадры с фундаментальным математическим образованием, что как раз и требуется для исследований в области ИИ, компьютерного зрения и компьютерной томографии.

Кстати, в 2023 году мы планируем расширять программы стажировки для студентов МГУ (факультеты Мехмат, ВМК, Физфак) и Физтеха, начиная с 4 курса. Если заинтересовала стажировка у нас в команде – присылайте резюме по адресу job@smartengines.ru.

Сильные бизнес-результаты

Все проделанное закономерно принесло свои бизнес-плоды. Несмотря на сильную турбулентность рынка сбыта высоких технологий нам удалось практически вдвое увеличить количество проданных распознаваний документов и, естественно, размер выручки.

Таким образом, наши значимые бизнес-достижения в 2022 году тезисно можно сформулировать следующим образом:

  1. Количество проданных распознаваний для безопасного извлечения данных в мобильных приложениях, интернет-решениях и других информационных системах составило 216 млн - это на 91% больше, чем в 2021 году;

  2. Выручка компании в 2022 году превысила 400 млн рублей, что на 43% больше, чем в 2021 году;

  3. Использовать программные продукты Smart Engines начали ВТБ, Банк Открытие, Банк Россия, Банк Точка, ювелирная сеть SOKOLOV;

  4. МТС на основе решения Smart Engines выстроила собственный сервис, позволяющий распознавать документы и верифицировать данные пользователей;

  5. Активное развитие получили проекты в Альфа-Банке, Газпромбанке, ОТП Банке, Райффайзенбанке, НСПК, ЕАБР, в компании “АльфаСтрахование” и других.

Наш вклад в борьбу с глобальным потеплением

Как мы уже несколько раз писали на Хабре, алгоритмы Smart Engines с применением фирменной природосберегающей технологии GreenOCR® на смартфоне позволяют распознать паспорт РФ за 0,15 секунды. На каждое распознавание выделяется 0,0001432891146 грамм СО2. Мы подсчитали, что высадка 1 гектара дубового леса компенсирует ~3,8 миллиарда распознаваний.

В октябре 2022 года в национальном парке “Угра” в Калужской области – на участке площадью 1 гектар – мы высадили 4000 сеянцев дуба черешчатого. Этот дубовый лес способен поглотить 556,7 тонн углерода за 50 лет.

Важный момент - компания Smart Engines не просто “скинулась” деньгами ради получения заветного сертификата. От Smart Engines в Калужскую область была направлена делегация во главе с PR-директором, лично участвовавшем в посадке деревьев.

Мы – компания, разрабатывающая программное обеспечение для распознавания изображений, основанных на многолетних фундаментальных трудах российских учёных в области искусственного интеллекта и машинного зрения. Используем в своей работе мощные компьютеры, потребляющие электроэнергию и выбрасывающие в воздух углерод. И чтобы компенсировать этот вред на десять лет вперёд, мы решили посадить в “Угре” четыре тысячи молодых дубов. Это наш первый, но не последний шаг

Владислав Новый
PR-директор Smart Engines

А что в заключении? Прогноз на 2023 год!

Самое логичное, что может быть в заключении в сегодняшней статье - это представить нашему читателю планы Smart Engines на 2023 год. Пожалуй, сформулировать это лучше генерального директора Владимира Арлазарова никто не сможет:

В 2023 году с технологической точки зрения мы собираемся расти по трем направлениям. Кроме томографии, которую мы в 2023 году намерены обозначить как бизнес-направление, мы планируем расширить область распознавания во всех обычных отраслях. Сделать так, чтобы для бизнес-сообщества именно обработка фотографий документов на мобильных телефонах и серверах стала стандартом.

канд. тех. наук Владимир Арлазаров
Генеральный директор Smart Engines
В интервью CNews 23.12.2022 г.

Желаем в наступившем году всем читателям Хабра, и себе, конечно, же тоже, достижения всех поставленных целей, продуктивной работы, успехов на творческом пути!

Комментарии (16)


  1. vdp
    25.01.2023 16:03

    А сливаете всё, что сканируете сразу в КГБ ? А кто имеет доступ к серверам ?
    Как узнать, кто ещё читает, то, что я сканирую ?
    Да и насмешили Вы про беспочвенные притеснения ученых из России.


    1. SmartEngines Автор
      25.01.2023 17:14

      Мы несколько раз уже писали в наших публикациях на Хабре, и готовы еще раз пояснить:

      Программное обеспечение Smart Engines НЕ передает личные данные на обработку в сторонние сервисы и/или третьим лицам для ручного ввода, НЕ сохраняет данные — все обработка ведется в локальной оперативной памяти устройства, НЕ требует сетевого соединения.


    1. Alexufo
      26.01.2023 02:00

      Если коммерческий ocr то сразу облака мерещатся?)) Нет, это все оффлайн движки под кучу платформ.


  1. heiheshang
    25.01.2023 17:25

    Пробовали мы это решение. Фигня, оказалось что быстро распознается MRZ на паспорте, а паспорт уже за 10-12 сек, человек всяко быстрее забивает данные. А MRZ обычным китайским сканером ручным за 50$ сканируется.


    1. SmartEngines Автор
      25.01.2023 17:49

      За 10 секунд на 32-х ядерном сервере, без использования GPU мы распознаем примерно 550 изображений разворотов паспортов РФ. Это совсем не коррелирует с Вашими "замерами". Возможно, Вы все-таки тестировали не наше ПО?


      1. heiheshang
        26.01.2023 03:41
        -1

        нет, на обычном компе, нет у нас 32-х ядерного сервера. Эфективные менеджеры купили библиотеку не для серверного распазнования, а второй раз тратить деньги уже ни кто не был готов.


        1. Alexufo
          26.01.2023 09:37

          Скорее всего под сервер и десктоп либа будет одна. 12 секунд может быть при неправильном использовании. Например, вы каждый раз инициализируете ее и после распознавания убиваете инстанс. Это не вариант php, отработал и умри, это вариант демона.

          Для десктопов/серверов выключена ленивая инициализация, разогрев при старте дольше, но последующие вызовы в библиотеку идут без каких либо затрат на инициализацию. Вы можете, наоборот, ее включить, чтобы не переписывать решение.( это не оптимально) В моем случае на двуядерном не больше 2,3,4 (когда скан с а4, когда с ватсапа) секунд вместе с запросом на сервер и это не mrz, а весь документ заграна.


          1. heiheshang
            26.01.2023 11:39

            ну мне сами ребята со smart engines сказали что 10 секунд на паспорт нормально после чего мы отстали.


            1. Alexufo
              26.01.2023 11:45

              Ну может вы описали свое внедрение, тогда это ожидаемо, нормально, но не оптимально. Яж не знаю, что и как у вас. Когда я тестировал несколько лет назад при выборе решения, у меня была распознавалка от аби, вот она работала ~7-12 cекунд но она просто не умела работать ни с чем, кроме идеальных сканов, а пошли уже фотки с мобилок и тут считай без альтернатив...


            1. SmartEngines Автор
              27.01.2023 21:41

              Это очень странное заявление. Мы уже неоднократно заявляли скоростные характеристики: распознавание скана одной страницы паспорта на персональном компьютере с конфигурацией Intel(R) Core(™) i7-2600 CPU @ 3,40 GHz, 8 Гб ОЗУ, Windows 7 SP1 64bit занимает в среднем 0,087 сек.

              Кстати, если Вы вспомните, кто Вам из наших сотрудников заявлял такую производительность - мы были бы крайне благодарны!


    1. evoq
      26.01.2023 01:12

      Первую страницу за 12 секунд переносят? Че-то вы чешете


      1. SmartEngines Автор
        27.01.2023 21:42

        Возможно, уважаемый читатель @heiheshang просто что-то путает, мы постараемся разобраться и внести ясность


        1. heiheshang
          28.01.2023 06:58

          Ничего я не путаю. Купили сканеры ваши в которых китайская камера стоит и светодиоды с поддсветкой, кассиры отказались с ними работать потому-что в глаза свет бьет. В сканерах настраивали фокус сами потому-что оказалось что расфокусировка идет, как вы сказали так и сделали, разобрали сканер камеру подкрутили. Обучали программу вы сами мы вам сканц поспортов скинули, вы нам файлик с настройками. Тестили утилитой вашей же, которая со сканером идет. MRZ распознавалась за 1-2 сек на наших компах, а сам паспорт главная страница там где все по русски за 10-12 сек. Если бы у нас были мощные компы наверное быстрее было, но имеем что имеем. У меня сканер до сих пор дома лежит. 5 лет прошло, сейчас картина может быть другая, я не спорю.


    1. Alexufo
      26.01.2023 01:51

      А когда я тестировал, оказалась не фигня. Особенно с mrz, присланными в ватсап с "утюга" где то из деревень на кавказских горах. Криво косо, но распознавать надо.


      1. heiheshang
        26.01.2023 05:12

        MRZ я и не говорил что долго, но и смысла нет, обычный китайский ручной сканер делает это на ура.


        1. Alexufo
          26.01.2023 09:39

          А нет в горах Кавказа сканера китайского, там телефон с камерой редкость, а договора заключать надо.

          Вообще, когда паспорт где то физически, это да, можно и железками, а если все удаленно по ватсапам...то без софта никак.