Всем привет! В прошлом году мы внедрили свое решение для голосовой верификации пользователей контакт-центров VoiceKey.Agent в Приорбанк (это один из крупнейших коммерческих банков Беларуси, входящий в австрийскую группу «Райффайзен») и теперь хотим рассказать вам о том, как мы это сделали и зачем это все понадобилось банку. На территории России и СНГ это второе внедрение голосовой биометрии в КЦ банка, поэтому мы стали практически первопроходцами.

Зачем банку биометрия


Не будем в очередной раз рассказывать, что традиционные технологии верификации пользователя (то есть подтверждение личности по знаниям: паролям, пин-кодам, кодовым словам и пр.) громоздки и не дают гарантированного результата. Крайне сложно удостовериться, действительно ли на другом конце провода находится тот самый человек, за которого он себя выдает. Оператор контакт-центра может лишь задавать уточняющие вопросы и сопоставлять голос человека с его полом, возрастом и другими особенностями. Достаточно очевидно, что для защиты финансовой информации этого мало.
Поэтому банки, страховые компании, пенсионные фонды и т.п. ищут способы оптимизации удаленного обслуживания через КЦ. Например, растет количество обращений клиентов в контакт-центры банков с запросами, требующими персональной идентификации. Так, если в ноябре-декабре 2007 года в КЦ Приорбанка было зафиксировано 46% звонков с необходимостью запроса персональной информации, то в аналогичный период 2015 года количество таких обращений увеличилось до 68% от общего количества всех звонков, а это уже два звонка из трех.

Типовые вопросы, которые задают клиенты по телефону


На сегодняшний день операторы контакт-центра Приорбанка ежемесячно обрабатывают десятки тысяч звонков, более половины обращений — запросы информации по счетам и операциям. Основные вопросы: «почему не работает карточка», «какая задолженность по кредиту», «почему не проходит операция» и так далее. Эти вопросы нельзя решить без подтверждения личности клиента — по законодательству информация по счетам предоставляется только их владельцам.

Подобные сведения не раз пытались получить не владельцы счета, а третьи лица. Вот поэтому у позвонившего в банк человека всегда спрашивают паспортные данные, номер карточки, девичью фамилию матери и так далее. На выяснение этих вопросов уходит в среднем 30?40 секунд на одного клиента.

Получается, что, во-первых, опасность выдать информацию не тому человеку довольно серьезная, во-вторых, растет среднее время обслуживания клиента, а это один из основных рабочих показателей любого КЦ.

Таким образом, банку нужно минимизировать время обслуживания одного клиента, повысить уровень защиты данных и сделать все это так, чтобы клиенту все еще было удобно и просто получить в КЦ необходимую информацию. Для решения этих задач мы предложили Приорбанку VoiceKey.Agent.

Как работает VoiceKey.Agent




При каждом вызове (входящем или исходящем) в момент начала разговора с оператором запускается проверка пользователя в фоновом режиме и собираются данные о его голосе. Затем информация поступает в обработку на сервер и сравнивается непосредственно с образцом голоса клиента, хранящимся в системе. Результат проверки отображается в интерфейсе оператора контакт-центра. Это процесс называется верификацией (есть еще такое понятие, как идентификация, и их нужно различать).

Архитектуру VoiceKey.AGENT имеет клиент-серверную и предоставляет гибкие возможности для интеграции c контакт-центром и CRM.



Процесс надёжен настолько, что позволяет отличать, например, голоса близнецов или звонок пародиста. Система за несколько секунд сверит голос с эталоном и сообщит, что верификация не пройдена. Система языконезависима, поэтому клиент банка может говорить на любом доступном ему языке.

Но чтобы в базе появились голосовые отпечатки (или эталоны голосов) клиентов, их нужно сначала записать.

Как формировалась база голосов клиентов в Приорбанке?


Предусмотрено несколько процессов при работе с голосовыми эталонами:

• первоначальное наполнение базы голосовыми эталонами клиентов на основании записей их звонков в контактный центр. Причем при создании эталона клиент должен подтвердить свое согласие на его (эталона) запись;

• обновление голосовых эталонов;

• верификация клиентов по голосу.

База данных с голосовыми эталонами клиентов формировалась в процессе их обращений в контакт-центр банка по телефону. Если во время разговора с оператором клиент мог подтвердить свою личность стандартным способом (по паспортным данным, секретным словам, номерам договоров и пр. деталям), то, когда набиралось достаточное количество речевого материала, система создавала цифровой эталон на базе уникальных особенностей его голоса: акцента и скорости речи, произношения и пр. Также учитывались и физические особенности: речевой такт, форма и размер рта, строение носа. Таким образом, уже при следующем вызове в КЦ процедура верификации клиента существенно сокращалась по времени за счёт фонового подтверждения личности по голосу.

Регистрация голосового эталона




• При звонке клиент идентифицируется по номеру телефона (если он звонит с мобильного телефона, номер которого зарегистрирован в банке).

• Дальше он проходит процедуру стандартной аутентификации по знаниям ФИО, даты рождения, номера паспорта и договора, секретной фразы. В общем, вплоть до того, как зовут кошку.

• В процессе разговора система накапливает нужное для создания голосового эталона количество речи (обычно около 40 секунд чистой речи), и когда собрано достаточно, информирует о готовности создать эталон. Оператор нажимает на кнопку, и если сведения, которые сообщил о себе клиент, совпадают с данными из систем банка, оператор сохраняет голосовой эталон. В противном случае сохранения не происходит. Согласие от клиента на создание голосового эталона банк получает заблаговременно, на этапе подписания клиентом договора на обслуживание.

Пример диалога клиента с оператором:


Верификация клиента




Клиент звонит и его идентифицируют по номеру мобильного телефона. Если для него уже создан голосовой эталон, то дальше система начнёт:

• процедуру верификации, если нет, то смотри историю про регистрацию нового эталона. Оператор задаёт несколько простых вопросов клиенту (просит представиться и указать дату рождения).

• В течение нескольких секунд разговора, когда накоплено достаточное количество чистой речи клиента (7–9 сек.), система сравнивает его голос с эталоном и показывает результат оператору («свой», «чужой», «не уверена»).

• Оператор либо заканчивает опрос, либо продолжает, потому что система «не уверена», что это свой, либо мягко отказывает клиенту, потому что он «чужой».

Пример успешной верификации:


Если необходимо, оператор может вручную перезапустить процедуру биометрической проверки клиента, например, если в процессе верификации в разговор вмешивался третий участник.



Или перевести клиента на своего руководителя или службу безопасности:



После завершения процедуры верификации система больше «не слушает» разговор, и её ресурсы не задействуются.

Этапы и особенности внедрения


• Разработка технического задания, проектирование и внедрение.
• Интеграция с CRM.
• Калибровка системы.
• Тестирование / опытная эксплуатация.
• Сдача работ.

Для определения решения в системе настраиваются три порога («первый», «второй» и «обогащение»). Если результат сравнения выше первого порога, то система считает, что клиент «свой», если ниже второго — клиент «чужой», если между — это значит, что система не может наверняка быть уверена в своем решении.

Если при сравнении результат выше первого порога и выше порога «обогащение», то система автоматически обновляет эталон голоса. Это позволяет поддерживать эталоны в актуальном состоянии.

Безусловно, 100% результат никакая биометрическая система не выдать не может, так как является вероятностной. Иногда, хотя и очень редко, случаются ошибки.
Они бывают разных типов.

Типы ошибок


Ошибки бывают первого и второго типа или, иначе, ложного пропуска «чужого» (False Acceptance Rate, FAR) и ошибки ложного отказа «своему» (False Reject Rate, FRR). Эти ошибки взаимосвязаны, и настройка биометрических систем требует нахождения «компромисса» между уровнями этих ошибок, чтобы максимально удовлетворять задаче.

Голосовая биометрия может быть применена в различных приложениях. Например, для верификации пользователей при разговоре с оператором контакт-центра, автоматической верификации по голосу в IVR, предоставления доступа пользователю в мобильное приложение (используется совместно с другими видами биометрии: отпечаток пальца или лицо), идентификации мошенников по голосу (антифрод) и пр.

Ссылки:
» Подробнее о биометрической платформе VoiceKey.
» Сообщение о проекте на белорусском Interfax.
Поделиться с друзьями
-->

Комментарии (13)


  1. sshikov
    16.08.2016 19:04
    +1

    Пояните пожалуйста одну вещь: насколько я знаю, для отпечатков пальцев сегодня не существует технологии их хранения в таком виде, чтобы


    • отпечаток можно было использовать для аутентификации клиента
    • в случае компрометации вашей базы взломщик не получил бы все отпечатки в их исходном виде

    Т.е., если пароли хранятся в виде хешей с солью, то для отпечатков это не так. А что для отпечатков голоса?


    1. MariaTaradeyko
      17.08.2016 11:03

      Голосовые отпечатки представляют собой только те характеристики, которые отвечают за индивидуальные особенности голоса человека. Но это не сам голос или информация о том, что сказано. Поэтому восстановить по отпечатку голоса исходное речевое сообщение в принципе невозможно.

      Во-вторых, голосовые отпечатки хранятся в анонимном виде, т.е. даже получив его, невозможно сопоставить его с персональными данными клиента системы. База данных, отвечающая за сопоставление отпечатков и персональных данных, хранится в другой системе, которая защищена столь же надежно, сколько и собственно финансовые данные клиентов банка.


      1. sshikov
        17.08.2016 14:01

        Т.е. это все-таки не отпечаток ни в каком виде, а скорее ближе к хешу. Понятно, спасибо.


  1. sluge
    17.08.2016 14:12

    Можно ли по информации голосового отпечатка синтезировать голос клиента?


    1. MariaTaradeyko
      17.08.2016 14:54

      Абсолютно точно нет. Голос по хранящейся информации восстановить нельзя.


      1. mapatka
        18.08.2016 14:19

        Не верю. Если как-то закодировали, значит можно как-то раскодировать и подделать.


        1. foxmuldercp
          26.08.2016 15:44

          Вы по sha256 чек сумме сможете узнать размер исходного файла?


  1. all
    17.08.2016 14:50

    Если у клиента заложило нос (простудился, к примеру) какова вероятность всё же аутентифицировать его по такту речи или каким-то другим речевым характеристикам?


    1. MariaTaradeyko
      17.08.2016 14:57

      Зависит от степени заложенности носа)) Если человек сильно охрип или произошли значительные изменения голоса (т.е. такие, что вы бы сами не смогли узнать своего знакомого, который позвонил вам в таком состоянии), то биометрическая система его не опознает. Но это приведет не к отказу обслуживать клиента, а к верификации традиционным способом: больше вопросов, кодовые слова и проч.


      1. all
        17.08.2016 15:54

        А после дополнительной успешной верификации, подобные значительные изменения в голосе будут учитываться для последующего распознавания? Допустим, через месяц клиент опять простудился.
        Иными словами — может ли у одного клиента храниться несколько вариантов «отпечатков» голоса?


        1. Simplevolk
          17.08.2016 17:01

          Например, он простудился и позвонил в банк, где и произошла запись его голоса.


          1. MariaTaradeyko
            17.08.2016 17:16

            Запись голоса надо производить в здоровом состоянии) А то потом все время придется звонить в банк больным.


        1. MariaTaradeyko
          17.08.2016 17:15

          Вообще, в системе настраиваются три порога («первый», «второй» и «обогащение»). Если результат сравнения ниже первого порога, то система считает, что клиент «чужой», если выше второго — клиент «свой», если между — это значит, что система не может наверняка быть уверена в своем решении.

          Так вот, когда клиент звонит сильно охрипший, то его голос оказывается между первым и вторым порогами, и модель не обогащается.

          На верхней границе «второго» порога есть еще зона «обогащения». Если при сравнении результат оказывается в этой зоне, то система автоматически обновляет эталон голоса. Это позволяет поддерживать эталоны в актуальном состоянии.