Всем привет! В прошлом году мы внедрили свое решение для голосовой верификации пользователей контакт-центров VoiceKey.Agent в Приорбанк (это один из крупнейших коммерческих банков Беларуси, входящий в австрийскую группу «Райффайзен») и теперь хотим рассказать вам о том, как мы это сделали и зачем это все понадобилось банку. На территории России и СНГ это второе внедрение голосовой биометрии в КЦ банка, поэтому мы стали практически первопроходцами.
Зачем банку биометрия
Не будем в очередной раз рассказывать, что традиционные технологии верификации пользователя (то есть подтверждение личности по знаниям: паролям, пин-кодам, кодовым словам и пр.) громоздки и не дают гарантированного результата. Крайне сложно удостовериться, действительно ли на другом конце провода находится тот самый человек, за которого он себя выдает. Оператор контакт-центра может лишь задавать уточняющие вопросы и сопоставлять голос человека с его полом, возрастом и другими особенностями. Достаточно очевидно, что для защиты финансовой информации этого мало.
Поэтому банки, страховые компании, пенсионные фонды и т.п. ищут способы оптимизации удаленного обслуживания через КЦ. Например, растет количество обращений клиентов в контакт-центры банков с запросами, требующими персональной идентификации. Так, если в ноябре-декабре 2007 года в КЦ Приорбанка было зафиксировано 46% звонков с необходимостью запроса персональной информации, то в аналогичный период 2015 года количество таких обращений увеличилось до 68% от общего количества всех звонков, а это уже два звонка из трех.
Типовые вопросы, которые задают клиенты по телефону
На сегодняшний день операторы контакт-центра Приорбанка ежемесячно обрабатывают десятки тысяч звонков, более половины обращений — запросы информации по счетам и операциям. Основные вопросы: «почему не работает карточка», «какая задолженность по кредиту», «почему не проходит операция» и так далее. Эти вопросы нельзя решить без подтверждения личности клиента — по законодательству информация по счетам предоставляется только их владельцам.
Подобные сведения не раз пытались получить не владельцы счета, а третьи лица. Вот поэтому у позвонившего в банк человека всегда спрашивают паспортные данные, номер карточки, девичью фамилию матери и так далее. На выяснение этих вопросов уходит в среднем 30?40 секунд на одного клиента.
Получается, что, во-первых, опасность выдать информацию не тому человеку довольно серьезная, во-вторых, растет среднее время обслуживания клиента, а это один из основных рабочих показателей любого КЦ.
Таким образом, банку нужно минимизировать время обслуживания одного клиента, повысить уровень защиты данных и сделать все это так, чтобы клиенту все еще было удобно и просто получить в КЦ необходимую информацию. Для решения этих задач мы предложили Приорбанку VoiceKey.Agent.
Как работает VoiceKey.Agent
При каждом вызове (входящем или исходящем) в момент начала разговора с оператором запускается проверка пользователя в фоновом режиме и собираются данные о его голосе. Затем информация поступает в обработку на сервер и сравнивается непосредственно с образцом голоса клиента, хранящимся в системе. Результат проверки отображается в интерфейсе оператора контакт-центра. Это процесс называется верификацией (есть еще такое понятие, как идентификация, и их нужно различать).
Архитектуру VoiceKey.AGENT имеет клиент-серверную и предоставляет гибкие возможности для интеграции c контакт-центром и CRM.
Процесс надёжен настолько, что позволяет отличать, например, голоса близнецов или звонок пародиста. Система за несколько секунд сверит голос с эталоном и сообщит, что верификация не пройдена. Система языконезависима, поэтому клиент банка может говорить на любом доступном ему языке.
Но чтобы в базе появились голосовые отпечатки (или эталоны голосов) клиентов, их нужно сначала записать.
Как формировалась база голосов клиентов в Приорбанке?
Предусмотрено несколько процессов при работе с голосовыми эталонами:
• первоначальное наполнение базы голосовыми эталонами клиентов на основании записей их звонков в контактный центр. Причем при создании эталона клиент должен подтвердить свое согласие на его (эталона) запись;
• обновление голосовых эталонов;
• верификация клиентов по голосу.
База данных с голосовыми эталонами клиентов формировалась в процессе их обращений в контакт-центр банка по телефону. Если во время разговора с оператором клиент мог подтвердить свою личность стандартным способом (по паспортным данным, секретным словам, номерам договоров и пр. деталям), то, когда набиралось достаточное количество речевого материала, система создавала цифровой эталон на базе уникальных особенностей его голоса: акцента и скорости речи, произношения и пр. Также учитывались и физические особенности: речевой такт, форма и размер рта, строение носа. Таким образом, уже при следующем вызове в КЦ процедура верификации клиента существенно сокращалась по времени за счёт фонового подтверждения личности по голосу.
Регистрация голосового эталона
• При звонке клиент идентифицируется по номеру телефона (если он звонит с мобильного телефона, номер которого зарегистрирован в банке).
• Дальше он проходит процедуру стандартной аутентификации по знаниям ФИО, даты рождения, номера паспорта и договора, секретной фразы. В общем, вплоть до того, как зовут кошку.
• В процессе разговора система накапливает нужное для создания голосового эталона количество речи (обычно около 40 секунд чистой речи), и когда собрано достаточно, информирует о готовности создать эталон. Оператор нажимает на кнопку, и если сведения, которые сообщил о себе клиент, совпадают с данными из систем банка, оператор сохраняет голосовой эталон. В противном случае сохранения не происходит. Согласие от клиента на создание голосового эталона банк получает заблаговременно, на этапе подписания клиентом договора на обслуживание.
Пример диалога клиента с оператором:
Верификация клиента
Клиент звонит и его идентифицируют по номеру мобильного телефона. Если для него уже создан голосовой эталон, то дальше система начнёт:
• процедуру верификации, если нет, то смотри историю про регистрацию нового эталона. Оператор задаёт несколько простых вопросов клиенту (просит представиться и указать дату рождения).
• В течение нескольких секунд разговора, когда накоплено достаточное количество чистой речи клиента (7–9 сек.), система сравнивает его голос с эталоном и показывает результат оператору («свой», «чужой», «не уверена»).
• Оператор либо заканчивает опрос, либо продолжает, потому что система «не уверена», что это свой, либо мягко отказывает клиенту, потому что он «чужой».
Пример успешной верификации:
Если необходимо, оператор может вручную перезапустить процедуру биометрической проверки клиента, например, если в процессе верификации в разговор вмешивался третий участник.
Или перевести клиента на своего руководителя или службу безопасности:
После завершения процедуры верификации система больше «не слушает» разговор, и её ресурсы не задействуются.
Этапы и особенности внедрения
• Разработка технического задания, проектирование и внедрение.
• Интеграция с CRM.
• Калибровка системы.
• Тестирование / опытная эксплуатация.
• Сдача работ.
Для определения решения в системе настраиваются три порога («первый», «второй» и «обогащение»). Если результат сравнения выше первого порога, то система считает, что клиент «свой», если ниже второго — клиент «чужой», если между — это значит, что система не может наверняка быть уверена в своем решении.
Если при сравнении результат выше первого порога и выше порога «обогащение», то система автоматически обновляет эталон голоса. Это позволяет поддерживать эталоны в актуальном состоянии.
Безусловно, 100% результат никакая биометрическая система не выдать не может, так как является вероятностной. Иногда, хотя и очень редко, случаются ошибки.
Они бывают разных типов.
Типы ошибок
Ошибки бывают первого и второго типа или, иначе, ложного пропуска «чужого» (False Acceptance Rate, FAR) и ошибки ложного отказа «своему» (False Reject Rate, FRR). Эти ошибки взаимосвязаны, и настройка биометрических систем требует нахождения «компромисса» между уровнями этих ошибок, чтобы максимально удовлетворять задаче.
Голосовая биометрия может быть применена в различных приложениях. Например, для верификации пользователей при разговоре с оператором контакт-центра, автоматической верификации по голосу в IVR, предоставления доступа пользователю в мобильное приложение (используется совместно с другими видами биометрии: отпечаток пальца или лицо), идентификации мошенников по голосу (антифрод) и пр.
Ссылки:
» Подробнее о биометрической платформе VoiceKey.
» Сообщение о проекте на белорусском Interfax.
Комментарии (13)
sluge
17.08.2016 14:12Можно ли по информации голосового отпечатка синтезировать голос клиента?
MariaTaradeyko
17.08.2016 14:54Абсолютно точно нет. Голос по хранящейся информации восстановить нельзя.
mapatka
18.08.2016 14:19Не верю. Если как-то закодировали, значит можно как-то раскодировать и подделать.
all
17.08.2016 14:50Если у клиента заложило нос (простудился, к примеру) какова вероятность всё же аутентифицировать его по такту речи или каким-то другим речевым характеристикам?
MariaTaradeyko
17.08.2016 14:57Зависит от степени заложенности носа)) Если человек сильно охрип или произошли значительные изменения голоса (т.е. такие, что вы бы сами не смогли узнать своего знакомого, который позвонил вам в таком состоянии), то биометрическая система его не опознает. Но это приведет не к отказу обслуживать клиента, а к верификации традиционным способом: больше вопросов, кодовые слова и проч.
all
17.08.2016 15:54А после дополнительной успешной верификации, подобные значительные изменения в голосе будут учитываться для последующего распознавания? Допустим, через месяц клиент опять простудился.
Иными словами — может ли у одного клиента храниться несколько вариантов «отпечатков» голоса?Simplevolk
17.08.2016 17:01Например, он простудился и позвонил в банк, где и произошла запись его голоса.
MariaTaradeyko
17.08.2016 17:16Запись голоса надо производить в здоровом состоянии) А то потом все время придется звонить в банк больным.
MariaTaradeyko
17.08.2016 17:15Вообще, в системе настраиваются три порога («первый», «второй» и «обогащение»). Если результат сравнения ниже первого порога, то система считает, что клиент «чужой», если выше второго — клиент «свой», если между — это значит, что система не может наверняка быть уверена в своем решении.
Так вот, когда клиент звонит сильно охрипший, то его голос оказывается между первым и вторым порогами, и модель не обогащается.
На верхней границе «второго» порога есть еще зона «обогащения». Если при сравнении результат оказывается в этой зоне, то система автоматически обновляет эталон голоса. Это позволяет поддерживать эталоны в актуальном состоянии.
sshikov
Пояните пожалуйста одну вещь: насколько я знаю, для отпечатков пальцев сегодня не существует технологии их хранения в таком виде, чтобы
Т.е., если пароли хранятся в виде хешей с солью, то для отпечатков это не так. А что для отпечатков голоса?
MariaTaradeyko
Голосовые отпечатки представляют собой только те характеристики, которые отвечают за индивидуальные особенности голоса человека. Но это не сам голос или информация о том, что сказано. Поэтому восстановить по отпечатку голоса исходное речевое сообщение в принципе невозможно.
Во-вторых, голосовые отпечатки хранятся в анонимном виде, т.е. даже получив его, невозможно сопоставить его с персональными данными клиента системы. База данных, отвечающая за сопоставление отпечатков и персональных данных, хранится в другой системе, которая защищена столь же надежно, сколько и собственно финансовые данные клиентов банка.
sshikov
Т.е. это все-таки не отпечаток ни в каком виде, а скорее ближе к хешу. Понятно, спасибо.