В Штатах адреса всей бумажной почты сканируются и автоматически распознаются. Однако, если адрес написан неразборчиво или поврежден, он отправляется в Центр удаленного декодирования Почтовой службы США в Солт-Лейк-Сити.

Там около 800 человек круглосуточно занимаются тем, что за 4 секунды должны перевести нечитаемый адрес в странный код, разработанный Siemens в 1990-х годах (надо ли добавлять, что он не интуитивен и сложен?). Поскольку работники используют сотни быстрых сочетаний клавиш, у них даже клавиатуры специальные.

image

Если меня когда-нибудь спросят о странной организации работ или о плохом UX/UI-дизайне, пожалуй, я покажу им вот этот пост. Посмотрите, как может выглядеть такая деятельность.

Итак, в штатах, где бумажная почта до сих пор очень развита (причем значительная часть нагрузки приходится на бюрократический аппарат), за распознавание адресов отвечают сканеры. Они успешно справляются с более чем 98% адресов, но в особо заковыристых случаях скан этого адреса отправляется в специальное подразделение в Солт-Лейк-Сити.

Процент “неудач” вроде бы небольшой, но умножив его на годовые объемы почты и получаем довольно внушительное число в 1,2 миллиарда “ужасных” адресов.

image
Объем пересылки корреспонденции в США

К слову, это последний такой центр, оставшийся у USPS (еще в 1997 году их было 55). Рост качества распознавания, плюс большое количество напечатанных на принтере адресов, позволяют вполне успешно эти адреса распознавать. Но, некоторые люди пишут настолько неразборчиво, что данный центр удаленного декодирования пришлось все-таки оставить.

image
К примеру, вот такой адрес

image
Или вот такой. На фото шаблонный пример начальной сложности (используется для обучения новых сотрудников). Авторы говорят, что действительно сложные случаи они не могут показать из-за условий конфиденциальности. Но представить не сложно. 

Работа ведется круглосуточно, так как круглосуточно работает сортировка. Как только письмо на ленте сканируется, и система не может распознать адрес, его скан улетает сюда. Интересный факт: к центру подходят три оптоволоконных линии для обеспечения бесперебойности распознавания — основательный такой подход к отказоустойчивости гражданского сервиса.

В результате у ребят есть около 90 секунд на то, чтобы уточнить адрес, иначе письмо будет автоматически “сброшено” в мусорную корзину и будет рассматриваться уже в отдельном порядке. Учитывая, что 90 секунд, это общее время, на распознавание живым человеком (с учетом передачи, времени ожидания в очереди и возможности нескольких неудачных попыток) самому оператору дается гораздо меньший тайминг.

Работа у персонала в чем-то похожа на распознавании капчи: по сути надо всмотреться в полученный скан и вбить на клавиатуре тот самый замысловатый код, разработанный Siemens еще в 90-х (сименсы, кстати, довольно круты и сортировку почты начали автоматизировать еще в 60-х годах на почте Германии, но удобство там явно было не в фаворе). На фото ниже пример американской шпаргалки, которая висит в кабинках у операторов:

image
Начало индекса, где выбирается штат или другие направления… Фото взято из видео

image
А теперь суффикс для улицы…

Очевидно, что на любой почте мира никто не ищет легких путей и потому здесь общая работа строится в т.ч. с большим количество шоткартов на клавиатуре. Сделанной, как вы понимаете, на заказ, но от этого не становящейся менее кондовой.

image
Обратите внимание, что верхний ряд (под F* клавишами) лишен цифр. Цифры зачем-то переехали на средний ряд

Поскольку работа требует высокой концентрации (шутка ли — обработка 900-1200 изображений в час), а персонал трудится в довольно плотном опенспейсе, всюду висят таблички, просящие соблюдать тишину.

image

Так как тут не работают специализированные нейросети (пока), у человеческого OCR есть собственные сильные и слабые стороны. У кого-то лучше получается распознавать один вид почерка, у кого-то другой. Кроме того, регулярно встречаются адреса вроде “дому вниз по улице от аптеки на углу» или адресованные «месту рядом с красным амбаром” — тут уже никакая сеть не справится.

Отдельной строкой идут письма из языковых анклавов, например, когда одни испанцы пишут другим внутри страны. Естественно, на испанском. Естественно с нулевым результатом автораспознавания адреса. И знание нескольких языков сильно выручает операторов.

По словам директора центра декодирования, Райна Буллока, им удается распознать около половины сложных адресов. В случае, когда адрес не дается одному человеку, он передается другому работнику и только после нескольких неудачных попыток сходит с радаров. Точнее, такое “бракованное” письмо попытаются рассмотреть вживую на месте — мало ли чего не заметил сканер — и, если и тут не получится, отправят обратно.

Если обратный адрес так же не читается (или отсутствует), почтовое отправление может быть продано на аукционе. Бывает, что там встречаются ценные предметы (вроде GoPro или ноутбука), а бывает, что и криминальные (вроде марихуаны на сумму $5000, спрятанной в картине, или человеческие останки, смешанные с коллекцией посуды, и тут понятно, почему никто не написал обратный адрес). Забавно, что если в таких потерянных отправлениях находят деньги, то их высылают (снова почтой) в Министерство Финансов.

Вместо выводов: наблюдать за другими профессиями бывает чертовски интересно. Но, конкретно в этом случае, мы видим огромный атавизм, оставшийся из доцифровой эпохи, помноженный на требование к отказоустойчивости. И, конечно, явный вызов современным любителям преобразований. 

Как уже говорилось выше, это один из самых странных примеров организации работ, что мне приходилось встречать в жизни. И это ровно тот случай, когда развитие нейросетей может его ликвидировать. С другой стороны, что тогда будут делать 800 человек, умеющих за 4 секунды переводить текст из одной абракадабры в другую?

Комментарии (39)


  1. xztau
    06.01.2023 12:33
    +15

    Мониторинг в реальном времени в... EXCEL!!!


    1. Maslukhin Автор
      06.01.2023 16:11
      +14

      Как говорится, нет такой жизненной ситуации, которую нельзя выразить через формулу в Excel :)



      1. gresolio
        07.01.2023 03:11

        Тут отлично раскрыта тема сортировки писем:
        AirTags Expose Dodgy Postal Industry (DHL Responds)


  1. event1
    06.01.2023 16:33
    +3

    Как уже говорилось выше, это один из самых странных примеров организации работ, что мне приходилось встречать в жизни. И это ровно тот случай, когда развитие нейросетей может его ликвидировать.

    Можно без всяких нейросетей удвоить цену за марку если на конверте адрес написан руками. Или наоборот уполовинить, если адрес закодирован qr-кодом.

    С другой стороны, что тогда будут делать 800 человек, умеющих за 4 секунды переводить текст из одной абракадабры в другую?

    То же самое что делают бывшие сотрудники предыдущих ликвидированных 54х центров


    1. Maslukhin Автор
      06.01.2023 16:43
      +5

      Можно без всяких нейросетей удвоить цену за марку если на конверте адрес написан руками. 

      Или изобрести индекс со специально заполняемым полем на конверте, заполняемым по определённым правилам :)


      1. event1
        06.01.2023 17:10
        +1

        Всё что широкая публика будет заполнять ручкой на бумаге будет сделано с ошибками в каком-то проценте случаев. Даже 2% ошибок заставляют держать целый центр со специально обученными людьми. qr-код может создаваться на сайте почтовой службы, содержать цифровую подпись и, таким образом, самовалидироваться


        1. acsent1
          06.01.2023 17:34
          +1

          А кто будет печатать этот код? Самому напечатать - можно и с обычным адресом так. Нужны будут какие то люди. Ну вот те кто сейчас распознает будут сидеть и печатать код


          1. Kanut
            06.01.2023 18:22
            +3

            Распечатать код может простейший автомат. Например автомат по продаже почтовых марок и/или Packstation. Причём в теории это можно делать прямо на конверте и сразу и марку печатать.


            1. Wesha
              07.01.2023 09:06

              в теории это можно делать прямо на конверте и сразу и марку печатать.

              Всё уже украдено до Вас


              1. Kanut
                07.01.2023 12:00
                -1

                Это же для посылки, правильно? С посылками оно уже и у нас так давно работает. А вот с письмами пока вроде бы ещё нет.


                1. Wesha
                  07.01.2023 12:15
                  +1

                  Можно и для письма. Просто этот конкретный поц посылку отправлял.


          1. event1
            06.01.2023 20:09

            можно печатать и обычный адрес, но если уж оцифровывать почту, то можно и воспользоваться плодами прогресса. Тем более, что если делать другой уровень цен для цифрового адреса то неплохо и обеспечить более высокий SLA. Для чего, конечно, подписанный самой почтой адрес доставки очень пригодится.


          1. Wesha
            07.01.2023 09:00
            +1

            кто будет печатать этот код

            Ещё чего — печатать им! Сами нарисуют, не облезнут!


        1. Maslukhin Автор
          06.01.2023 17:53
          +2

          Если человек способен сгенерировать себе qr-код, то он и адрес нормально напечать сможет.

          Тут же речь о тех самых 1-2%, неспособных несколько букв читаемо написать. Индекс здорово выручает хотя бы озими правилами написания


          1. event1
            06.01.2023 20:15
            +1

            Система с qr-кодом будет примерно такая: принес конверт в ларёк, завёл адрес доставки в спец-приложку, сунул конверт в щёлку, приложил телефон, (ларёк забрал с телефона адрес и деньги), получил конверт с пропечатанным кодом назад. Даже писать не надо уметь.


            1. SomeDD
              07.01.2023 09:09
              +1

              И снова упирается в те 2% людей, у которых кнопочные "глупофоны"


            1. Wesha
              07.01.2023 09:10
              +2

              Всё уже украдено и до Вас тоже


            1. sshemol
              07.01.2023 15:02

              завёл адрес доставки в спец-приложку


      1. Moskus
        06.01.2023 20:32
        +1

        Вы никогда не видели индекс, который написан поверх этого поля не по правилам?


      1. Javian
        07.01.2023 11:45
        +1


        ПОЧТОВАЯ связь / Энциклопедический словарь юного техника / Сост. Б. В. Зубков, С. В. Чумаков.—2-е изд., испр. и доп. — М.: Педагогика, 1987.—464 с.: ил.
        На современных почтамтах письма обрабатываются на машинах, образующих автоматическую линию. Вначале их сортируют по размерам на разборочной машине. Автоматические измерители проверяют геометрические размеры писем (высоту, длину, толщину) и вес. Стандартные письма размерами 162Х114 мм собирают в специальные кассеты, нестандартные машина отделяет для ручной обработки. С введением в нашей стране нового стандарта на почтовую корреспонденцию число нестандартных отправлений значительно уменьшилось.
        Из кассет письма поступают в лицовочно-штемпелевальную машину, которая укладывает
        их при помощи фотоэлементов в одинаковое положение — адресом кверху, чтобы марка была в правом верхнем углу, и штемпелюет — наносит оттиск календарного штемпеля гашения марки. Затем письма едут по конвейеру в сортировочную машину. Здесь их сортируют по областям, крупным городам, по предприятиям связи. Если сортировочная машина полуавтоматическая, то адрес на конверте читает оператор, после чего он нажимает нужную кнопку и письмо попадает в определенное отделение сортировочной машины — в клетку-накопитель. Если машина автоматическая, а таких машин становится все больше, — область страны, куда адресовано письмо, определяется по почтовому индексу, стандартные цифры которого мы пишем в левом нижнем углу конверта.
        Автоматическая сортировочная машина работает очень быстро, за час она сортирует
        около 20 тыс. писем.


      1. moroz69off
        08.01.2023 15:09
        +1

        изобрести индекс со специально заполняемым полем на конверте, заполняемым по определённым правилам

        Такой?


  1. Maslukhin Автор
    06.01.2023 16:51
    +2

    Почтатех @heyjudelawскажите, а можно рассказать, как это работает у вас? Интересно же!


  1. vadimk91
    06.01.2023 19:36
    +1

    В музее связи в Санкт-Петербурге видел планшет, заточенный для распознавания адреса. Работающий, можно было попрактиковаться, чем я и воспользовался. Надо сказать, что люди мой почерк воспринимают без проблем, в школе когда-то даже хвалили, но тут на планшете мне удавалось заставить систему распознать адрес только примерно в одном случае из трех. Не знаю, насколько широко эта система использовалась на почтах.


  1. serafims
    06.01.2023 19:44
    +2

    Странно, что а) нет полей для машинораспознаваемого индекса, как у нас, чтобы уже почтальон на месте распознавал адрес, зная, где "красный амбар".

    б) не ввели сокращенную форму адреса, как в Англии.

    в) не ввели повышенную стоимость для рукописно написанного адреса..


    1. Moskus
      06.01.2023 20:41
      +2

      Больше требований, чтобы справиться с проблемой, происходящей от того, что кто-то не смог следовать существующим требованиям?

      Вы, случайно, не профессиональный бюрократ?


    1. Kudesnick33
      06.01.2023 21:35
      +1

      в) будет бить как раз по тем людям, у которых и так нет денег на принтеры.


    1. RatVieN
      07.01.2023 08:10

      Допустим, индекс не удалось распознать нейросеткой(там правда уже и человек будет бессилен) при отправке в центр задача будет максимально простой распознать только индекс и никаких кодов знать не нужно.


    1. masai
      08.01.2023 19:01

      А что такое сокращённая форма адреса? Живу в Англии, не сталкивался с таким.


  1. DaneSoul
    06.01.2023 21:19
    +4

    Очевидно, что на любой почте мира никто не ищет легких путей и потому здесь общая работа строится в т.ч. с большим количество шоткартов на клавиатуре.
    Есть очень большая разница в проектировании интерфейсов рассчитанных на простого человека, который использует интерфейс редко и рассчитанных на профессионала который сидит в этом интерфейсе часами после соответствующего обучения.
    Если человеку нужно делать много однотипных операций быстро — использование шоткатов и разных хитрых кодов и сокращений — это здраво и разумно. После пары месяцев такой работы человек будет их использовать не задумываясь и не тратя лишнее время.


    1. Maslukhin Автор
      07.01.2023 09:07

      Фраза про "не ищет лёгких путей" относилась к общей организации и странному коду Сименса.

      С шорткатами то все порядке, они хороши всегда, но они следствия


  1. PsihXMak
    07.01.2023 10:46
    +1

    Когда был студентом, довелось поработать оператором в подобной системе. Целью были ошибки в распозновании бланков ЕГЭ и ГИА.

    Точно помню то, что где то после часа такой такой работы просто нереально хочется спать.


  1. gatoazul
    07.01.2023 10:58

    Сложная, нестандартная работа, с которой не справляются компьютеры. Хитрое кодирование результата.
    При этом 90 секунд на распознавание и рабочее место в кубикле, больше похожее на загон для скота.
    Мне одному кажется, что тут есть какое-то противоречие?


    1. Maslukhin Автор
      07.01.2023 11:04

      Поясните свою мысль, пожалуйста


      1. gatoazul
        07.01.2023 11:15

        Сложная работа требует соответствующих условий. Тишина, удобное рабочее место, спокойный подход, отсутствие спешки.
        Мы же видим прямую противоположность.


        1. Maslukhin Автор
          07.01.2023 11:32

          Именно поэтому я назвал UX-адом для людей.

          По сути, это госучреждение с людьми-функциями. Удобство тут вообще не учитывается


    1. K0styan
      07.01.2023 12:24
      +1

      Есть 2 класса задач, в которых человек не может быть заменён компьютером. Первая - это действительно сложная работа, требующая учёта кучи неочевидных и непредсказуемых факторов и, возможно, самое главное - с высокой ответственностью. Например, пилот авиалайнера. Тут будет и максимально эргономичное рабочее место, и гуманные условия труда.

      А второй - это когда человеку "повезло" иметь свою белковую нейросеть уже наученной для решения задачи тыщами лет эволюции - распознавание образов тому пример. И тут о квалификации или суперответственности речи нет, просто мозг работает (пока?) лучше. И под эти задачи будут строиться натуральные конвейеры.

      Такая себе организация, факт, но что есть - то есть,


  1. bozman
    07.01.2023 15:06

    Я одного не понял: если робот распознает надпись, то он каким-то образом отправляет письмо куда надо. Если надпись распознает человек — он зачем-то должен еще и перевести ее в какой-то код? Почему нельзя вернуть роботу распознанный текст? Или речь идет не столько о плохом почерке, сколько о нераспознаваемых адресах? (через два дома налево от церкви)

    Так-то логичнее было бы, если адрес написан понятным языком возвращать управление роботу сразу после расшифровки почерка.


    1. Maslukhin Автор
      07.01.2023 15:10
      +1

      Насколько я понимаю, для скорости (помним про 4 секунды) он должен распознанный адрес вбить в виде короткого кода, который понимает система.