Система оптического распознавания текстов (OCR) на Google Drive пополнила список поддерживаемых языков — теперь их количество превышает 200 (клингонского пока нет). Вместе с тем, число систем письма, в которых может быть написан текст, выросло до 25. Для добавления новых языков и улучшения распознавания старых инженеры используют скрытые модели Маркова, которые применяются в компании для возможностей распознавания речи и голосового поиска.

Последовательность распознавания текста очень проста. Необходимо загрузить файл (картинки в JPG, PNG, GIF-форматах или PDF-документ) на сервис:

image

И открыть его с помощью Google Docs — в примере используется фрагмент на хинди. Аналогично процесс выглядит и на Android. Распознанный текст появится ниже используемой картинки. Система обрабатывает графические файлы в течение примерно 30 секунд, распознавание PDF может длиться до минуты.

image

Совсем без ограничений использовать сервис не получится: максимальный объём загружаемой картинки составляет 2 Мб, а в PDF-документе будут обработаны только первые десять страниц.

Ранее Google представила инструмент для рукописного ввода теста на сенсорных экранах, которое используется в мобильных приложениях Google Translate и в специально выпущенной клавиатуре. Ввод рукописного русского текста в приложениях поддерживается достаточно хорошо для беглого и не очень аккуратного почерка.

Комментарии (4)


  1. dyadyaSerezha
    08.05.2015 16:53

    На Андроиде открыл jpg-файл с текстом в Docs, ну открылся он как картинка — и что дальше??


  1. newdya
    08.05.2015 18:05

    клингонского пока нет

    Куда там! Классического монгольского нет, маньчжурского нет…


  1. stepik777
    09.05.2015 13:24

    Ранее Google представила инструмент для рукописного ввода теста на сенсорных экранах, которое используется в мобильных приложениях Google Translate и в специально выпущенной клавиатуре. Ввод рукописного русского текста в приложениях поддерживается достаточно хорошо для беглого и не очень аккуратного почерка.
    В 7 винде тоже есть рукописный ввод текста и формул, для английского текста работает более-менее не плохо, а вот русский и формулы у меня так и не получилось нормально ввести.


  1. SerJook
    09.05.2015 17:56

    Google хочет убить ABBYY.