Smart Engines представила новое поколение систем распознавания паспортов, других удостоверений личности, банковских карт, баркодов и документов с возможностью аутентификации и биометрической верификации. Компания стала единым поставщиком технологий для точного, быстрого и безопасного извлечения данных, аутентификации документов с проверкой «живости» (document liveness detection) и признаков компрометации (computational document forensics), распознавания лиц (face matching) для верификации пользователей. Все продукты новой линейки: Smart ID Engine, Smart Code Engine и Smart Document Engine разработаны в соответствии с принципами ответственного ИИ и призваны вывести защиту пользователей и бизнеса от мошеннических действий с документами на принципиально новый уровень.
Smart ID Engine является переосмыслением флагманской технологии компании Smart IDReader, и позволяет распознавать паспорт РФ и еще 1482 удостоверяющих документа 210 юрисдикций мира с поддержкой 99 языков, включая иероглифическую письменность. Smart Code Engine объединяет решения для оптического считывания (сканирования) данных банковских карт, баркодов и машиночитаемой зоны (MRZ). Smart Document Engine – система для автоматической классификации, распознавания и выделения реквизитов из структурированных, слабоструктурированных и неструктурированных документов: справки по форме 2-НДФЛ, бухгалтерского баланса, платежного поручения и других. Новые продукты доступны для интеграции в мобильные, десктопные и серверные приложения и работают автономно, обеспечивая безопасность обработки персональных и чувствительных данных.
«В условиях, когда утечки персональных данных становятся обыденностью, на первый план выходит защита пользователя от последствий компрометации их персональных данных и изображений документов, удостоверяющих личность. Наши усилия при разработке новых продуктов направлены на повышение качества и скорости распознавания, а также на предотвращение различных сценариев использования мошенниками украденных пользовательских данных», – говорит генеральный директор Smart Engines, кандидат технических наук Владимир Арлазаров.
Представленные решения получили обновление фирменной технологии ИИ GreenOCR®, в которой внедрена новая 8-битная модель вычислений глубоких нейронных сетей. Технология создана в рамках подхода Green AI и программы устойчивого развития, реализуемой под эгидой ООН. 2-е поколение GreenOCR® позволяет существенно снизить энергопотребление при распознавании, а также обрабатывать документы быстрее. На мощных современных смартфонах производительность распознавания выросла на 10%, а на бюджетных устройствах с ограниченной вычислительной мощностью – на 30%. Благодаря новой технологии Deep Visual Memory, модульной архитектуре, дополнительной алгоритмической и кодовой оптимизации удалось добиться сокращения размера дистрибутива при увеличении количества новых документов и их шаблонов. Для паспорта РФ дистрибутив сокращен на 35%, для документов США и европейских ID карт – 25%, для паспортов всего мира – 15%, для банковских карт – 35% и для баркодов – 40%. Нововведения обеспечивают снижение углеродного следа и продление срока работы мобильных устройств на одном заряде аккумулятора.
Важной особенностью новинок стала поддержка распознавания арабской письменности и языков индо-иранской группы, что существенно расширяет рынок сбыта в странах Ближнего Востока, Юго-восточной Азии и Африки. Речь идет о 21 юрисдикциях с общим населением 500 миллионов человек, которые не используют надписи на латинице в национальных документах. Распознавание арабского языка внедрено для 73 типов документов, включая паспорта, ID-карты и водительские удостоверения следующих государств: Алжир, Бахрейн, Государство Палестина, Египет, Иордания, Ирак, Иран, Йемен, Катар, Коморы, Кувейт, Ливан, Ливия, Мавритания, Марокко, ОАЭ, Оман, Саудовская Аравия, Сирия, Судан, Тунис.
В настоящее время Smart ID Engine позволяет быстро распознавать документы в видеопотоке, на фотографиях и изображений со сканеров. Время распознавания данных разворота паспорта РФ на iPhone XR составляет 200 мс на 1 кадр, водительских прав США примерно 250 мс на 1 кадр и ID карт Германии около 150 мс. Решение всегда работает автономно на конечном устройстве (смартфоне, умной камере, терминале, компьютере, сервере), не требует сетевого соединения и не передает данные клиентов на обработку в сторонние сервисы и/или третьим лицам для ручного ввода. Smart ID Engine позволяет компаниям соблюдать стандарты безопасности обработки персональных данных (ФЗ-152, GDPR, CCPA) и выполнять требования регуляторов в части KYC/AML.
Скачать подробное техническое описание Smart ID Engine.
Пользователям и интеграторам в Smart ID Engine «из коробки» доступно автоматическое определение типа документа и компактные конфигурации SDK (или набора библиотек) для быстрого распознавания данных в режиме автовыбора без указания типа документа для паспортов 211 стран мира, ID карт и водительских прав государств стран Евросоюза и Латинской Америки, водительских прав всех штатов США, всех удостоверяющих документов стран Евросоюза и СНГ.
В процессе распознавания в видеопотоке Smart ID Engine умеет выбирать лучший кадр с изображением документа для сохранения в учетной системе компании и наименее поврежденную (наиболее четкую и без бликов) фотографию лица на документе, которая извлекается как отдельный реквизит. Биометрическая верификация пользователя в новых продуктах реализована на базе разработанной командой исследователей Smart Engines собственной технологии распознавания лиц, которая позволяет провести сверку (face matching) фотографии лица в документе с лицом владельца на другой фотографии, в том числе на сделанном пользователем селфи.
Используемые в Smart ID Engine комплексные методы проверки «живости» (document liveness detection) документов в автоматическом режиме определяют попытки использования муляжей, фотокопий, а также съемку образа документа с экрана монитора компьютера, планшета или смартфона. Алгоритмы ИИ детектируют голографические элементы защиты, специальные визуальные элементы защиты (вензеля, орнаменты и т.д.), проверяют геометрию бланка и контролируют поведение документа в реальных условиях наблюдения в видеопотоке и на отдельных кадрах. Детектор «живости» по принципу работы относится к классу «пассивных», то есть не требует от пользователя выполнения специальных действий. Для распознавания и проверки документа достаточно показать его на несколько секунд камере устройства или просто сфотографировать.
«Развитие online-индустрий и дистанционных сервисов заставили мир по-новому посмотреть на задачу обработки документов с персональными и чувствительными данными через мобильные приложения и веб-сервисы. Проверка liveness для документа по принципу биометрической проверки liveness для лица человека — это важное усовершенствование антифрод-решений, которое отлично дополняет существующие технологии определения скомпрометированных документов и подтверждения их принадлежности пользователю. Это позволяет усилить защиту конечных пользователей от возможного неправомерного использования их документов», – комментирует CEO и сооснователь Sumsub Андрей Северюхин.
Для российского паспорта повышено качество распознавания печатного и рукописного текста, добавлена возможность автоматического детектирования 18-й и 19-й страниц и значительно улучшено качество распознавания печатных штампов о регистрации. При распознавании бланков российского паспорта Smart ID Engine производит не только контроль типа бланка, но и усиленную проверку, включающую поиск и анализ геометрических отношений специфичных элементов, выявление соответствия цветности бланка документа и печати. Также систему обучили распознавать новые типы свидетельств о рождении, улучшили распознавание водительских удостоверений, СНИЛС, СТС и других документов.
Smart Code Engine обеспечивает автоматическое считывание данных банковских карт, машиночитаемой зоны и баркодов в широком классе условий захвата изображений. Система устойчива к перепадам освещения, ракурсу съемки, перекосам, углу поворота, избыточному и недостаточному освещению. Система работает в реальном времени и способна на современных устройствах распознавать банковские карты и другие объекты со скоростью 25 кадров в секунду.
В платежных сервисах Smart Code Engine позволяет сканировать и распознавать банковские дебетовые и кредитные карты платежных систем МИР, VISA, MasterCard, American Express, JCB, Maestro, UnionPay и Diners Club, выпущенные различными странами мира, обеспечивая извлечение не только номера (12-19 цифр), но и срока действия и имени владельца. Поддерживается распознавание любых видов банковских карт: с нанесением данных выдавливанием (embossed), гравировкой (indent) и плоской печатью (flat printed), с горизонтальным и вертикальным расположением идентификационных данных, и тех карт, на которых данные расположены, как на лицевой, так и на обратной стороне. В новом продукте пользователям стало доступно распознавание банковских карт с номером IBAN, которые широко распространены в странах Евросоюза.
Решение Smart Engines обеспечивает автоматический поиск и распознавание данных машиночитаемых зон документов (MRZ), выполненных в соответствии с установленными международными стандартами ISO/ICAO (IEC 7501-1/ICAO Document 9303 ISO) и локальными (Россия, Франция, Швейцария, Болгария, Эквадор) стандартами, на паспортах, идентификационных картах, визах, водительских удостоверениях и других документах. Пользователям Smart Code Engine при распознавании документов с MRZ доступны инструменты проверки «живости» и консистентности данных.
Smart Code Engine обеспечивает качественное распознавание одно- и двумерных штрихкодов из различных счетов и квитанций, включая счета за коммунальные и государственные услуги, налоговых документов и счетов, а также билетов, чеков, счетов-фактур, ценников, плакатов и объявлений. В новом продукте в 1,5 раза улучшено чтение AZTEC символов за счет внедрения новой технологии определения центров модулей баркодов и PDF417 символов, включая их компактную версию, широко используемую в водительских удостоверениях РФ. Модуль чтения QR кодов, разработанный Smart Engines, теперь способен читать инвертированные коды, а также более устойчив к их ориентации. Сегодня продукт поддерживает распознавание QR Code, AZTEC, PDF 417, Data Matrix, CODABAR, CODE_39, CODE_93, CODE_128, EAN_8, EAN_13, ITF, UPC_A, UPC_E.
«Технологии распознавания Smart Engines дают уникальную возможность бизнесу эффективно внедрять новые практики, не предъявляя высоких требований к захвату изображений и оборудованию для исполнения алгоритмов ИИ. Пользователи могут фотографировать или показывать документ, банковскую карточку или баркод камере как им удобно, при этом все вычисления не требуют высокопроизводительных комплексов и занимают секунды даже на бюджетных телефонах», – говорит вице-президент, директор по информационным технологиям «Тинькофф» Вячеслав Цыганов.
Smart Document Engine решает задачи автоматического извлечения данных из типовых форм документов, форм строгой отчетности, первичных бухгалтерских, финансовых, налоговых, юридических, нотариальных и других документов, используемых в документообороте, различных тестов и опросников, на сканах и фотографиях. Система позволяет автоматически обрабатывать одно- и многостраничные документы с фиксированным положением реквизитов, документы с плавающим расположением блоков и реквизитов, неструктурированные текстовые документы и блоки, таблицы, надписи или даже отдельные строки и метки.
Программный продукт позволяет не только быстро распознавать данные из анкет, форм и документов, но и проверять их на соблюдение формальностей. Smart Document Engine может проверить, есть ли подпись, печать или логотип, правильного ли они цвета, находятся ли они в нужном месте документа, и проверить, что надписи, которые должны быть сделаны от руки, действительно рукописные. Кроме того, в процессе обработки возможна проверка целостности и неизменности бланка, документа или его части. За счет применения технологии GreenOCR® второго поколения время обработки 1 страницы документа А4 на AMD Ryzen 7 3700X составляет порядка 2 секунд.
В коробочном варианте поставки Smart Document Engine поддерживает распознавание справки по форме 2-НДФЛ, формы бухгалтерского баланса (ОКУД 0710001), отчет о финансовых результатах (ОКУД 0710002), свидетельства ИНН и платежное поручение (ОКУД 0401060).
«Новые возможности классификации и распознавания бизнес-документов расширяют область применения программных продуктов Smart Engines в различных каналах обслуживания клиентов и бизнес-процессах в финансовом секторе, телекоме, транспорте, промышленности, ритейле, энергетике, медицине и образовании. Интеллектуальное распознавание широкого класса документов, реализованное в Smart Document Engine, органично дополняет решения для ввода данных удостоверяющих документов и предлагает бизнесу качественно новый уровень автоматизации», – отмечает Дмитрий Силуянов, директор практики блока CRM Лиги Цифровой Экономики, которая внедряет продукты Smart Engines.
Для удобства интеграции разработчикам стали доступны .NET-обертки для Linux-систем, новые улучшенные интерфейсы на C++ и Java, а также обеспечена поддержка React и Flutter для мобильных SDK. Вся линейка продуктов оптимизирована для архитектур «Эльбрус», SPARC, MIPS, ARM, x86 и совместима с операционными системами iOS, Android, МОС «Аврора», «Эльбрус», Linux, Windows, macOS и Solaris. Модульная архитектура обеспечивает минимизацию размера программной библиотеки, так как позволяет конфигурировать SDK под конкретного заказчика и включать в него только необходимую ему функциональность.
Программные продукты Smart Engines успешно решают задачи цифровой трансформации в организациях различных отраслей экономики по всему миру. Технологии используют Билайн, МТС, МегаФон, группа Тинькофф, Альфа-Банк, Газпромбанк, Банк ДОМ.РФ, МКБ, Почта Банк, Росбанк, Банк «Санкт-Петербург», Ситибанк, Банк Хоум Кредит, ФПК РЖД, Туту.ру, KUPIBILET, Альфастрахование, BioCollections Worldwide, BlaBlaCar, Blockpass IDN Ltd, Dukascopy Bank SA, Tessi, VerifyMyAge и др.
«Забота об окружающей среде является одним из ключевых приоритетов деятельности Smart Engines. Этому направлению посвящены наши исследования в области малобитных и биполярных архитектур нейронных сетей, использование которых позволяет минимизировать углеродный след наших моделей искусственного интеллекта на этапах обучения и исполнения. Важно отметить, что ученые и инженеры компании при разработке новых продуктов смогли добиться повышения качества распознавания, добавления новой функциональности и улучшения пользовательского опыта, при этом существенно уменьшив энергопотребление», – сказал генеральный директор Smart Engines, кандидат технических наук Владимир Арлазаров.