— Добрый вечер, меня зовут Наталья, чем я могу Вам помочь?
— Здравствуйте, у меня была заблокирована карта.
— Хорошо, назовите свое имя.
— Василий Моржаков.
(вбивает на клавиатуре)
— Ваше кодовое слово?
— Декобраз через Е.
— Простите, Вас не слышно.
— Де-ко-браз, через ЕЕ
— Что-то со связью, извините, можете повторить? (и кажется вешают трубку)

И вот я знаю немного про речевой ИИ, про ботов читал вчера Хабр, но все еще не могу понять, что же происходит.

Конечно, я перезвонил, и говорю:

— Здравствуйте, я за границей, связь не очень, не вешайте, пожалуйста, трубку. У меня заблокировали карту.
— Да, назовите свое имя…
Я слышу, как вбивают что-то на клавиатуре. Фамилию и имя. Кодовое слово прошло на этот раз, не стал грузить про букву Е (связь то не очень).
— Да, я вижу у вас заблокирована карта, переключаю Вас на другой отдел. (играет приятная музыка секунд 5)
Все повторяется с Ильей и снова мне говорят, что связь что-то не очень!

Я задумался о том, чтобы залезть на какое-то дерево и еще раз пройти всех операторов. Стресс же! Понимаете, деньги на карте заблокированы, ночь, другая страна. Хорошо, хоть операторы мгновенно берут трубку и…

Ночью операторы мгновенно берут трубку?

Стоп! Вот это я идиот.

Это что, уже речевые чат боты в банке отвечают за разблокировку карты? Что-то новенькое!

Набираю еще раз… точно. все то же самое. Что? Зачем чат бот вбивает на клавиатуре что-то? Ага, если я говорю что-то неожиданное, мне рассказывают про плохую связь. Отлично. Заканчивается все тем, что некий очень правдоподобно звучащий (с легкой интонацией наглости) Илья объясняет, что нужно позвонить со своего телефона, несмотря на верификацию кодовым словом. Но это просто невозможно по техническим причинам. И тут уже я не смог подобрать правильного ответа. Наверное, скрипт ожидал “спасибо за помощь”.

Фрустрация! Во время легкого стресса из-за заблокированной карты. А если бы у меня украли кошелек и нужно срочно попросить ее заблокировать?

В итоге: из 7 минут разговора с банком:

  1. 30 секунд рад, что быстро взяли трубку
  2. 2 минуты недоумеваю что со связью то?
  3. 30 секунд думаю, что это они уже издеваются! Нет никаких проблем со связью
  4. 10 секунд сильнейших эмоций, что тебя разыграли
  5. и все оставшееся время уже бесишься из-за того, что боты продолжают набивать на клавиатуре твои ответы, пытаясь угадать заложенные скрипты и говорить максимально разборчиво

Да в результате еще и не можешь добиться желаемого никак.

Ну и чего я хотел от бота?


Чтобы меня не обманывали.

Хотелось бы короткого предупреждения. Дополнительных инструкций. Возможность начать разговор сначала или узнать чего же ожидает от меня скрипт. Например, так:

“Здравствуйте, с вами говорит автоматический голосовой помощник Бот Елена. Могу я попросить Вас говорить проще и разборчивей? Почти наверняка я смогу вам помочь. Но во время разговора Вы можете попросить соединить с оператором, спросить что я от вас ожидаю или начать разговор сначала.”

А когда перезваниваю в течении дня, можно все это и не повторять, просто предупреждать о том, что это “все еще Бот Елена”.

Это вступление занимает около 10 секунд, что сопоставимо со временем ожидания ответа на любой звонок.

Да, клиент будет спрашивать оператора, но через полминуты ожидания ответа можно уточнить, не переключить ли на голосового помощника, который почти наверняка сможет решить Вашу проблему.

И немного о UX


Мне нравится концепция голосовых помощников. Мне, кстати, и консоль/терминал нравится вместо сложных панелей в front-end для конфигурации сложных систем или навигации по сложно структурированным данным.

У нас в школе был предмет ТРИЗ — Теория Решения Изобретательских Задач. Ничего оттуда не помню, но запомнился один прием решения противоречия в постановке задачи: попробуйте избавиться от сущности, которая выполняет необходимую функцию в системе, при этом сохранив функцию.

Сущность — это front-end, т.е. пользовательский интерфейс, через который мы взаимодействуем с web-сервисами (а многое так или иначе становится web-сервисами).

Иными словами, подключите консоль практически прямо к API сервиса. Или подключите голосового помощника прямо к API сервиса:

Предупредите о спасительных словах (что бот умеет делать, сбросить все).

Спросите чем можете помочь.

По-очереди спросите аргументы запроса, если они есть, если необходимо, озвучив тип ожидаемых данных (по буквам, только цифры, дату, время)
Ответьте на запрос.

Если работаете с контекстом, то предупредите о контексте, в котором бот понял запрос.

Конечно, ограничьте права и подумайте о безопасности.

Завершающая часть


Да, я понимаю, что глупо пытаться научить специалистов в UX голосовых помощников делать свою работу. А бизнес-отдел банка рассчитал прибыль от внедрения голосовых помощников, протестировал пилот, и какой-то один расстроенный пользователь с заблокированной картой — лишь выброс статистики.

Но надеюсь, эта история сэкономит немного нервов читателем этой заметки в случае попадания на голосового бота. И точно повеселит всех участников этого внедрения в банке (вот представляю как они покатывались, записывая все эти речевые сообщения).

И самое странное, что я даже не могу найти упоминаний в СМИ о внедрении такого типа помощника в этом конкретном банке. И, даже услышав раз 40 про “проблемы со связью” на любые нестандартные ответы при отличной связи, я до сих только на 99% уверен, что это был робот, а не 2 живых человека в колл-центре банка, решивших поиздеваться.

П.С.


На самом деле я был лишь свидетелем этой кул-стори, повестование от первого лица использовано в качестве художественного приема. А все имена ботов изменены, т.к. я просто их не помню.