Боты бесят многих, но при разумном применении они приносят пользу не только бизнесу, но и клиенту. Например, запишут пациентов к врачу вместо администраторов или найдут нового сотрудника в магазин вместо HR. Хороший бот должен быть приветливым, понимать запросы пользователей на естественном языке, не тупить и быстро решать задачу клиента, поэтому у них «под капотом» сложная и гибкая система.
Привет, Хабр! Меня зовут зовут Анна Гаджимурадова, я менеджер продукта Robovoice. В 2019 году мы начали проектирование платформы по созданию, администрированию и аналитике диалоговых ботов. До этого мы тоже делали ботов, но кастомно, поэтому подстраивались под каждого клиента — это приносило свои плоды, но с изменением бизнес‑процессов клиентам требуются корректировки скриптов, что влечет дополнительные финансовые и временных расходы. В статье расскажу, с какими сложностями мы столкнулись при разработке платформы.
Диалоговая платформа — что, зачем и как
В ряде сфер потребители требуют от бизнеса быть на связи 24/7, а огромная часть запросов является типовой и может быть решена без участия человека — голосовые и текстовые боты выступают как идеальное решение. Они подходят для любой организации, которая ведет активное общение с клиентами и имеет в своем распоряжении колл‑центр или команду менеджеров по работе с клиентами.
Например, многие ритейлеры используют колл‑центры для типовых коммуникаций. Операторы могут не соблюдать скрипт, ошибаться при фиксации данных по итогам разговора в CRM, общаться раздраженно с клиентами из‑за усталости и даже хамить, не справившись с эмоциями. И если выбирать между колл‑центром и ботом, то бот в итоге будет дешевле и управляемее. Особенно на фоне роста цен на контактные центры: зарплаты операторов и менеджеров показали рекордный рост в 2023 году — на 28–30%.
Разумное применение ботов приносит пользу как самому бизнесу, так и его клиентам: с одной стороны, они уменьшают рабочую нагрузку на сотрудников и сокращают время на обработку запросов, с другой — клиенты получают необходимую информацию незамедлительно. Если бот настроен правильно, его ответы будут не только быстрыми, но и точными. Особенно ценной является способность ботов работать без перерывов и выходных, 24/7 — в нашей стране 11 часовых поясов.
И все бы ничего, но… откуда взять такого бота? Кто будет им управлять? Как убедиться, что бот работает правильно? А что делать с той полезной информацией, которую бот получает от клиента, где ее хранить?
Инструмент, который справляется со всеми этими запросами, — диалоговая платформа. По сути это приложение для создания ботов с понятным и удобным визуальным интерфейсом, которое значительно упрощает разработку ботов и делает их доступными даже для небольших компаний без собственного отдела IT. Так от кастомной разработки мы ушли в создание платформы для разработки омниканальных диалоговых систем на базе искусственного интеллекта.
Сложности, с которыми мы столкнулись при создании платформы
Диалоговая платформа — это система с кучей сервисов, поэтому ее разработка не обошлась без препятствий. Одной из ключевых задач стало создание удобного визуального редактора, который позволяет пользователям без знаний в программировании самостоятельно создавать функциональных ботов.
В теме голосовых роботов мы уже были давно и понимали, что делается на российском рынке, что в планах у конкурентов и чего их продуктам не хватает. Поэтому мы сделали ставку на визуализацию процесса создания и редактирования сценария — придумали для Robovoice простую схему в виде дерева с блоками и стрелочками.
Сложность 1: UX
Удобный UX был для нас целью № 1 — на старте мы посмотрели на другие Low‑Code и No‑Code конструкторы ботов и поняли, что удобных инструментов настройки сценария в России практически нет. Решения были реализованы либо в виде множества сервисов, когда настройка NLU идет в одном интерфейсе, реплик — в другом, а редактор бизнес‑логики сценария вообще отдельно, и в итоге все нужно держать в голове. Либо все наоборот — визуальная часть перегружена блоками на каждый самый невероятный случай пользователя, и сложные сценарии, как например запись к врачу или консультация по продуктам банка, превращаются в огромное полотно кубиков, как в Minecraft. В таких инструментах просто теряешься.
Мы прошли через множество UX‑прототипов, проверяя различные гипотезы и тестируя их на пользователях. В итоге удалось найти баланс между простым и понятным UX и достаточной гибкостью и технологичностью. И в дальнейшем мы усовершенствовали многое в Robovoice именно благодаря пользовательскому опыту.
Сложность 2: вложенные и фоновые сценарии
Мы сфокусировались на реализации базовой функциональности настройки и стали смотреть, что же пользовали попросят «докрутить». Именно пользователи помогали нам расставлять приоритеты. Так первая обратная связь привела к появлению фоновых сценариев, которые могли включаться из любого нужного места диалога и отрабатывать встречные вопросы. Пользователям было важно, чтобы робот мог отвечать на вопросы не по теме — вроде «А вы кто?» или «Откуда у вас мой номер?», а если бот продолжал основную линию диалога вместо ответа, это звучало глупо и сильно снижало лояльность звонящих.
Сложность 3: BI-аналитика
Нелегко далось обеспечение высокой детализации работы ботов и построение инструментов для аналитики. Мы понимали, что клиентам мало просто настроить бота — его нужно улучшать. Поэтому был нужен инструмент, который, во‑первых, позволит просматривать (и прослушивать) любой диалог человека с роботом, а во‑вторых, даст возможность строить агрегированную статистику по диалогам, чтобы можно было рассчитывать конверсии и бизнес‑эффективность ботов.
К нашему глубокому изумлению, в тот момент на рынке не оказалось ни одного решения со встроенной аналитикой, как мы ее видели. Поэтому мы внедрили в Robovoice BI‑инструмент, который позволяет ставить цели на конкретные точки диалога, рассчитывает доходимость до этих точек и представляет это все в виде удобных для чтения диаграмм.
Сложность 4: обмен данными
Во время диалогов боты попутно собирают много полезной статистики от своих собеседников. Так как клиентам было важно автоматизировать не только саму типовую коммуникацию, но и комплексно связанные с ней бизнес‑процессы, то нужно уметь взаимодействовать с CRM и обмениваться данными с внешней инфраструктурой клиента. Поэтому мы сделали простой, но функциональный API и несколько готовых интеграций для самых популярных CRM, в том числе для Битрикс24.
Теперь наша платформа позволяет извлекать информацию от клиентов в переменные и делиться ей с системами компании. Плюс все диалоги хранятся в общем разделе, где можно применить базовые и сложные смысловые фильтры и сделать выгрузку, чтобы в дальнейшем менеджеры могли глубже проанализировать ее и сделать полезные для бизнеса выводы.
Сложность 5: внедрение NLU
Ядро Robovoice обеспечивал наш собственный диалоговый движок, который позволяет управлять беседой. И чтобы она могла продвигаться по сценарию, в начале мы, как и все, стартовали с условий на регулярных выражениях. Для небольших сценариев это было удобно: настроил регулярки — и бот уже отличает «да» от «нет», распознает простые ответы, выбирает следующий блок сценария и идет к нему. Но когда сценарии стали сложнее, то вариантов, как человек может ответить на вопрос бота, гораздо больше. Поэтому нам понадобился инструмент, который позволил бы боту понимать естественную человеческую речь и обрабатывать ее без тысячи алгоритмических условий.
Решение было одно — использовать нейросети. Иначе возникает проблема: огромная разветвленная блок‑схема сценария, неудобная для администрирования и к тому же несовершенная — все ответы предугадать нереально. Поэтому мы заморочились и сделали встроенный механизм дообучения модели на основе NLU. Как это работает: аналитик закладывает в нейросеть примеры для обучения, затем она в рамках конкретной задачи эффективно определяет намерение человека (интент) по смыслу высказывания — и неважно, какими именно словами он его выразил.
В итоге связка между блоками стала удобнее и проще — вместо кучи условий с регулярками несколько интентов, которые добавляются по клику. И понимать людей бот стал гораздо лучше.
Сложность 6: естественное звучание и GPT
Следующим вызовом было сделать так, чтобы робот говорил, как человек. Для максимально естественного звучания мы добавили функцию загрузки аудиофайлов, которые бот проигрывает в блоках. Для работы с разными языками мы апгрейднули и синтез — интегрировались со всеми основными спич‑ресурсами (Яндекс, Гугл, Тинькофф и др.).
Что дальше
Сейчас мы делаем наших ботов еще более нативными, поэтому наш разговорный ИИ будет дополнен генеративным. Мы уже выпустили beta‑версию со встроенным GPT‑блоком, который позволяет генерировать ответы робота на разные вопросы на лету с помощью всего одной инструкции — то есть по факту берет на себя большой кусок сценария из нескольких обычных блоков и общается с человеком самостоятельно, без дополнительной настройки.
Мы активно работаем над собственными сервисами синтеза и распознавания, чтобы можно было генерировать собственный голос, который будет работать в паре с нашим умным блоком GPT и звучать более естественно, чем встроенный в спич‑сервисы.