История FineReader: так создавалась легенда (часть II) / forpes.ru

Главная
История FineReader: так создавалась легенда (часть II)

История FineReader: так создавалась легенда (часть II) +7

28.09.2023 10:25

ContentAI_Team 6 1500 Источник

FineReader в человеческом обличии по мнению нейросети

Мы продолжаем изучать летопись функционального развития легендарного редактора FineReader PDF. Первую часть 30-летней истории можно прочитать здесь. А сейчас перенесемся в середину нулевых.

2005: ABBYY FineReader 8.0

В этот раз ждать новой версии пришлось всего год. Достигнув высоких показателей точности и качества распознавания, разработчики переключили внимание на другой важный компонент – скорость.

В восьмой версии появился новый режим распознавания, позволяющий в несколько раз ускорить обработку качественно отпечатанных документов. Более того, реализовано автоматизированное выполнение типовых задач распознавания, в том числе и по собственным сценариям.

Другой вектор, в котором целенаправленно и последовательно двигалась программа, – расширение диапазона работы с PDF-файлами. Вместе с общей скоростью распознавания выросла и скорость преобразования документов этого формата, а также усовершенствована технология их обработки. Теперь программа предварительно анализировала содержимое файла, определяя наличие текстовых блоков, и принимала решение о его распознавании или извлечении текста из текстового слоя.

Впервые в продукте появилась функция защиты PDF-файлов паролем. По желанию пользователь мог установить пароль на открытие файла или на внесение любых изменений. При преобразовании PDF-файла и сохранении результатов распознавания в форматы MS Word, PDF и HTML FineReader 8.0 по умолчанию восстанавливал все гиперссылки, найденные в исходном документе. Также впервые в комплект поставки системы включена утилита для распознавания скриншотов.

Повышено качество распознавания факсов и документов, отсканированных с низким разрешением, на новый уровень выведено распознавание изображений, полученных с помощью цифровой камеры. И это стало большим прорывов для программы, так как цифровые снимки отличаются от отсканированных изображений, и способ их распознавания и обработки также устроен по-другому. FineReader 8.0 научилась отличать сфотографированные документы от отсканированных и применять для обработки снимков новую адаптивную технологию распознавания.

Для пользователей, которым необходимо оцифровывать печатные издания (книги, журналы), в ABBYY FineReader 8.0 появилась функция «выпрямления» строк. Она помогала устранять искривленные строки вблизи сгиба.

Сторонние эксперты, тестировавшие вышедший релиз, подчеркивали, что конкурентов у продукта в настоящее время (2005 год ), попросту нет.

2007: ABBYY FineReader 9.0

Вернувшись к привычному двухгодичному ритму выпуска продуктов, ABBYY презентовала FineReader 9.0 в 2007 году.

В ходе работы над новой версией компания особенно тщательно проработала пользовательские фидбеки и запросы рынка. После плотного общения с аудиторией, проведенной серии опросов и фокус-групп решено было акцентировать внимание не столько на внутренней начинке, сколько на внешней оболочке. ABBYY FineReader 9.0 получила новый интерфейс с современным для своего времени UX\UI. Во главу угла был поставлен принцип простоты и понятности для того, чтобы даже у человека, который впервые сталкивается с продуктом, не возникло трудностей в понимании его устройства и нахождении основных инструментов.

Качественно новый шаг был сделан и в том, как система воспринимает поступивший для обработки документ. В 9-ой версии были внедрены технологии, позволяющие проводить анализ и распознавание документа как целостного объекта. Как комментировали тогда разработчики, идея и способ ее реализации обдумывались на протяжении нескольких лет, а с появлением новых технических возможностей наконец-то получилось их воплотить. Новая технология Adaptive Document Recognition Technology (ADRT) позволила системе воспринимать все разрозненные элементы, которые по сути формируют логическую структуру документа (колонтитулы, сноски, подписи, диаграммы, стили, шрифты, нумерацию), как единое целое. Эта разработка значительно упростила работу с сложными многостраничными файлами.

Выход ABBYY FineReader 9.0 позволил компании сделать огромный шаг в направлении международного рынка. Релиз впервые включал расширенную версию OCR с поддержкой иврита, китайского, японского и тайского языков. Традиционно они признаются самыми сложными для распознавания, И неспроста: в иврите слова пишутся справа налево (а включенные в текст иностранные слова – слева направо), китайские иероглифы имеют несколько вариантов написания, в тайском языке нет пробелов между словами и, соответственно, пунктуационных знаков. Можно только представить, как пришлось помучиться разработке.

2010: ABBYY FineReader 10

Юбилейная десятая версия увидела свет в 2010 году. Компания заявила о внедрении целого ряда инновационных технологий для повышения качества и скорости работы продукта.

Впервые внедренную в девятый релиз адаптивную технологию распознавания документов ADRT заменила ADRT2. В версии нового поколения получалось более качественно восстанавливать логическую структуру документа при распознавании. Особенно востребовано это было для обработки технических документов с множеством различных элементов.

Вообще в этой версии акцент был сделан на повышении точности распознавания документов низкого качества – плохо пропечатанных факсов, снимков со слабым разрешением. А главной новинкой релиза стала возможность распознавать изображения, сделанные с помощью фотокамеры мобильного телефона. И это при том, что мощности камер были далеки от современных. ABBYY FineReader 10.0 вполне достойно считывала данные с таких снимков и могла сохранить их в формате MS Word, Excel, PDF.

Помимо мобильных телефонов, еще один продукт современности, к которому успешно адаптировался новый FineReader, — электронные книги. Десятая версия позволила достаточно эффективно переводить бумажные издания в электронный вид. Программа могла автоматически сохранять главы книги в отдельные HTML-файлы и восстанавливать ссылки в содержании на соответствующие разделы печатного оригинала.

Примечательна ABBYY FineReader 10.0 и тем, что в текущей версии большое внимание получил блок функций для работы с файлами формата PDF. В некотором смысле это можно назвать поворотным моментом в дальнейшей истории продукта, который впоследствии целенаправленно трансформировался в редактор PDF.

2012: ABBYY FineReader 11

В одиннадцатой версии ABBYY FineReader, вышедшей в 2012 году, анонсировано значительное улучшение производительности, снижение количества ошибок при распознавании и общее повышение удобства взаимодействия с продуктом.

Что примечательно, возможности для оптимизации ресурсов были зашиты в самые разные инструменты. Так, например, появился новый черно-белый режим, который позволил ускорить обработку на 30% по сравнению с цветным. При работе с простыми по структуре документами (и с нормальным качеством печати) можно было использовать режим так называемого быстрого распознавания. В этом случае повысить производительность можно практически до 70%. Большой вклад в повышение эффективности использования вычислительных возможностей внесли и многоядерные процессоры.

С помощью этих и других приемов удалось повысить скорость обработки на европейских языках до 25% для отдельных типов документов, на иероглифических — до 40%.

При общем увеличении скорости не пострадало и качество распознавания, совсем наоборот. В одиннадцатой версии ABBYY FineReader оптимизирована работа с тяжелыми многостраничными документами. При распознавании без искажений сохранялась их структура, более качественно получилось считывать данные из таблиц, диаграмм, колонтитулов и сносок.

Last but not least – важные новшества в языковой части. В продукте появилась возможность распознавания арабского, вьетнамского, туркменского (латиница) языков. Также для них и некоторых других языков реализована словарная поддержка. По словам компании, ABBYY FineReader продолжал удерживать звание самой многоязычной системы распознавания в мире.

Подробный разбор одиннадцатой версии, сделанный самой компанией, есть в этом блоге.

2014: ABBYY FineReader 12

Постепенно подбираемся к современности. В 2014 году выходит ABBYY FineReader 12.

К числу новых возможностей программы можно отнести мгновенную загрузку отсканированных страниц и изображений, вне зависимости от размера документа. Фактически пользователь сразу получал доступ к просмотру, редактированию уже распознанных областей, изменению порядка страниц. Также программа научилась моментально распознавать и конвертировать выделенную область документа – отдельную цитату или абзац – без необходимости его полной обработки.

Появился расширенный набор опций автоматической предобработки фотографий, с помощью которых можно было превращать снимки в изображения, не уступающие по качеству хорошим сканам, и сразу же архивировать их.

Улучшить качество обработанных документов можно было за счет автоматического удаления цветных меток и сглаживания излишне пикселизированных символов.

Команда ABBYY упорно работает над более точным воссозданием и форматированием многостраничных документов со сложной структурой. В двенадцатой версии, благодаря усовершенствованной технологии ADRT, распознавание таблиц улучшено на 40%, диаграмм и графиков — на 33%.

Реагируя на обращения пользователей, разработчики сделали возможным некоторые манипуляции с многостраничным документом в фоновом режиме до завершения процесса распознавания. Пока система считывает и обрабатывает данные, можно просмотреть текст, скопировать или отредактировать фрагмент, изменить порядок страниц.

Общая скорость обработки данных выросла на 10-15%. Что интересно, теперь продукт перед запуском процесса распознавания сам предлагал пользователю сделать выбор между двумя режимами: с приоритетом скорости или качества. В первом режиме документы обрабатывались почти в 2 раза быстрее.

Вместе с тем, ABBYY FineReader 12 «подружился» с облаками, научившись загружать документы и выгружать их после обработки в Dropbox, Google Drive, Microsoft OneDrive и другие облачные хранилища.

2017: ABBYY FineReader 14

С выходом в 2017 году ABBYY FineReader 14 была четко обозначена новая траектория развития продукта – в сторону многофункциональной обработки файлов формата PDF.

В компании рассказали, что в дополнение к распознаванию и конвертации документов, за которое отвечает OCR, включен PDF-редактор с широким набором возможностей, а также различные средства автоматизации процесса обработки документов.

ABBYY FineReader 14 позиционировался как универсальный инструмент для работы с разными типами документов. В число ключевых функций продукта входило распознавание графических и текстовых документов, их конвертация, редактирование файлов формата PDF, добавление, перемещение и удаление изображений, вставка, копирование и изменение порядка страниц документа, а также возможность их защиты и использования цифровой подписи.

В программе появились фичи, без которых сегодняшние пользователи FineReader из корпоративного сегмента не могут представить себе ежедневную продуктивную работу:

возможность поиска по содержимому документа PDF;
быстрая конвертация и обработка файлов по заданному расписанию в папке Hot Folder;
сравнение документов.

Кстати, именно в этом релизе у продукта появился привычный современному пользователю интерфейс с элементами управления, распределенными между верхним и боковым меню, и большой площадью для просмотра и масштабирования документа.

2019: ABBYY FineReader PDF 15

ABBYY FineReader PDF 15 – последняя версия, доступная пользователям из России до ухода компании с отечественного рынка. Она вышла в 2019 году и включала важные обновления. «Начинка» продукта была усовершенствована за счет более современных инструментов искусственного интеллекта и машинного обучения.

Ключевая цель при разработке продукта, которую компания заявляла в то время, – сделать так, чтобы редактирование любых файлов в ABBYY FineReader могло осуществляться так же просто, быстро и удобно как в текстовых редакторах типа MS Word. Текущий релиз действительно позволил работать с PDF-документами, как говорится, в потоке. Пользователи могли в комфортном ритме и режиме совершать любые операции – извлекать нужные фрагменты, конвертировать их в требуемый формат, вносить корректировки в текст и элементы оформления, сравнивать версии или создавать файлы PDF из нескольких документов разного формата. Sounds Like Magic.

Какие еще изменения почувствовали пользователи? Во-первых, программа стала гораздо быстрее работать с многостраничными документами. На протяжении нескольких релизов команда пошагово решала эту задачу, постепенно повышая скорость обработки таких файлов и оптимизируя точность распознавания изображений, диаграмм и таблиц. В пятнадцатой версии файлы, в том числе объемные и со сложной структурой, стали открываться на 40% быстрее.

Во-вторых, был сделан большой шаг вперед в обработке таблиц, качество и структура которых зачастую страдает при конвертации в другой формат. Теперь программа научилась сохранять границы между ячейками, заполненные поля и форматирование, а также позволила удобно редактировать текст внутри ячеек.

В-третьих, использование сверточных нейронных сетей позволило существенно минимизировать ошибки распознавания PDF-документов, созданных из других приложений, в том числе PDF с битыми кодировками или некачественным текстовым слоем.

Важно отметить, что в 2020 году вышел обновленный релиз пятнадцатой версии, в котором в названии продукта впервые стал фигурировать приоритетный для него формат документов – PDF. С этого момента и по сегодняшний день продукт носит имя ABBYY FineReader PDF. В этом же релизе появилась долгожданная и широко востребованная фича создания и редактирования интерактивных PDF-форм.

2022: ContentReader PDF 15

Вы находитесь тут. История продукта ABBYY FineReader PDF в России поставлена на паузу после ухода компании с отечественного рынка в 2022 году.

Однако, как это часто бывает, каждый конец есть лишь начало чего-то нового. Развитие технологий и продуктов для интеллектуальной обработки информации в России продолжила команда бывшего российского офиса ABBYY под новым брендом – Content AI.

Одним из первых выпущенных нами решений стал ContentReader PDF 15 – технологический наследник FineReader. Это многофункциональный редактор PDF, который умеет также успешно справляться с любыми задачами по обработке документов этого формата, как и его легендарный предшественник.

Что выгодно отличает ContentReader PDF, это возможность запуска на Linux. Мы адаптировали продукт для совместимости с отечественными операционными системами и сейчас работаем над новой кроссплатформенной версией продукта. У ContentReader PDF есть своя стратегия развития. Обещаем регулярно выводить актуальные новинки с прицелом на задачи и потребности российских пользователей.

А вот краткая версия всего вышеизложенного:

Комментарии (6)

Miranda11
28.09.2023 12:01
#26008550
"Однако, как это часто бывает, каждый конец есть лишь начало чего-то нового. " - верно, заграничные сервисы уходят, но зато налаживается наше производство и разработки. Это не может не радовать
1. baldr
  28.09.2023 12:01
  #26008556
  +3
  Так FineReader был не заграничным. С самого начала российским был.
  
  Так что, ничего не налаживается, а просто не все смогли уехать.
  1. virrus
    28.09.2023 12:01
    #26009318
    +1
    Не "не смогли", а "не захотели". Не нагоняйте "драматизму" на ровном месте :)

niccolo2019
28.09.2023 12:01
#26009778
Описана история застоя, по сути... По отзывам на руборде реальных улучшений в качестве распознавания у Файнридера не наблюдается уже лет 15, несмотря на появление нейронных сетей, рост мощности компов и т.п.
Интерфейс, спроектированный под моники 2:3, уже совсем не так хорош на 16:9....
Всякие удобные мелочи, типа перезагрузки картинки страницы, программисты файнридера считают видимо ниже своего достоинства разрабатывать....Это же мелочи, а не приличный кусок коричневой субстанции, называемый «редактор изображений...»
Скорость работы - т.е. возможность начать работать с результатами сразу после распознавания 1-й страницы в последних версиях хуже, чем в 8, несмотря на i9, SSD и кучу памяти.....
Только добавились несколько языков да новых форматов.... За 15 лет.... Прогресс однако....
1. baldr
  28.09.2023 12:01
  #26009966
  Ну в статье они пишут что с каждой версией на 40% быстрее работает, так что уж должен, наверное, за разумное время работать?
  
  Я последний раз пользовался OCR лет 20 назад, наверное, так что сравнить не с чем. Какие ему сейчас конкуренты реальные?
  1. theurus
    28.09.2023 12:01
    #26010264
    Adobe acrobat может сканировать и распознавать текст в пдф, и редактировать после этого. Причем у него там есть такая модная фишка как генерация шрифтов на лету, что бы шрифт которым ты редактируешь отсканированный текст выглядел более похожим на то что есть на этой странице.
    
    Генерируются шрифты с искажениями похожими на искажения от печати-сканирования, что бы правки в пдф выглядели естественнее.

История FineReader: так создавалась легенда (часть II) +7

2005: ABBYY FineReader 8.0

2007: ABBYY FineReader 9.0

2010: ABBYY FineReader 10

2012: ABBYY FineReader 11

2014: ABBYY FineReader 12

2017: ABBYY FineReader 14

2019: ABBYY FineReader PDF 15

2022: ContentReader PDF 15

Комментарии (6)

Miranda11

baldr

virrus

niccolo2019

baldr

theurus