Как мы уже писали в своей первой статье, мы в Just AI специализируемся на технологиях искусственного интеллекта для понимания естественного языка (NLU). У нас есть своя платформа для разработки разговорных ассистентов, как текстовых, так и голосовых. Платформа имеет развитую функциональность для решения NLP-задач (кластеризация логов, поиск семантически близких фраз и др.) и собственный язык разработки (Just AI DSL). С использованием DSL команда лингвистов-разработчиков пишет код сценариев чатботов, интеграционные модули для связи с внешними системами, а также автотесты.

В этой статье мы расскажем о созданном нами инструменте для разработки ботов под разные платформы, в том числе для Яндекс Диалогов, без знания DSL и навыков программирования.

Крупные проекты, такие как автоинформатор для поддержки клиентов телеком-оператора или полнофункциональный голосовой помощник, могут насчитывать более 1000 классифицируемых интентов пользователя, десятки справочников для извлечения сущностей и включать в себя интеграции с несколькими внешними сервисами. Поэтому разработка ведётся одновременно несколькими лингвистами и разработчиками, с использованием систем контроля версий и инструментов для нагрузочного тестирования, с привлечением копирайтеров и UX-дизайнеров.

Изначально мы были уверены, что комплексность подхода к разработке – это то, что нужно и разработчикам чатботов, и бизнесу, ведь создание интеллектуального чатбота – непростая и ресурсоемкая задача. Мы выстроили довольно сложную архитектуру, чтобы закрыть все возможные кейсы, и даже сделали в платформе визуальный редактор, чтобы облегчить клиентам управление логикой чатботов. Но довольно часто на практике мы продолжаем сталкиваться с тем, что даже подготовленный бизнес с уже запланированным бюджетом на автоматизацию, медлит с внедрением и не понимает, как корректно составить ТЗ и правильно спланировать внедрение ИИ в свои процессы.

Нам захотелось упростить для компаний начало работы с искусственным интеллектом и одновременно дать им в руки инструмент, который сразу позволит начать тестировать технологию. При этом нужно было, чтобы продукт был способен понимать естественный язык (запросы обычного пользователя) и не отвечать односложно на типовые вопросы (“Я не понял, повторите ваш вопрос”). В общем, нужно было скрыть “под капотом” наши крутые технологии enterprise-платформы, чтобы облегчить вход для российского бизнеса в мир искусственного интеллекта. В общем, нужно было сделать продукт для пользователя, чтобы можно было настроить, пощупать, увидеть, как работает. Поэтому внутренности платформы скрыли под оболочкой конструктора.

Хорошо у нас получилось или нет – судить вам (ссылки для регистрации в конструкторе и для переписки в коммьюнити – в конце статьи). В итоге появился продукт Aimylogic – визуальный конструктор, где можно собрать интеллектуального чатбота, понимающего естественный язык, из простых блоков: реплик пользователя, ответов бота, обращений к внешним системам. Работа с Aimylogic не требует знания DSL основной платформы, навыков написания паттернов распознавания интентов и автотестов.

Кейс: создание чатбота для HR-отдела


Сегодня рассмотрим достаточно простой кейс: создание чатбота для HR, который консультирует сотрудников о внутренних процессах компании через Telegram, сайт компании или Яндекс.Алису, может принимать заявки (на отпуск, ДМС и т.д.) и отправлять их на доску в Trello.

Весь процесс можно разбить на следующие этапы:

  1. создание сценария диалога HR-бота с сотрудником компании;
  2. конфигурация сбора заявок пользователей (мы будем использовать Trello);
  3. тестирование бота;
  4. публикация бота в Телеграм, на сайте или в Яндекс.Алисе.

Итак, обо всём по порядку…

1. Создание сценария общения с сотрудниками


Сейчас в Aimylogic уже есть шаблон бота для HR с диалогами про зарплатный проект, отпуск, страховки и другие вопросы, которые бот будет понимать сразу. Таким образом, вы можете использовать готовый сценарий и при желании изменить его под себя. Опишем, как был сделан этот шаблон.

Процесс создания сценария в Aimylogic сводится к добавлению блоков и установлением переходов между ними.

На скриншоте выше видно, что сценарий бота начинается с приветствия. Чтобы поприветствовать пользователя и объяснить, какие вопросы он может задать боту, используем текстовый блок. Можно добавить и картинку.

После создания блока с текстом приветствия добавим в нашего бота блок “Фразы”, который позволяет обучать бота на примерах запросов пользователей. В блоке “Фразы” добавляем отдельные группы фраз, соответствующие намерениям (интентам) пользователей и каждую из них наполняем примерами запросов.

В рассматриваемом примере мы создадим несколько групп фраз:

  • подключение зарплатного проекта;
  • корпоративная программа ДМС;
  • заявление на отпуск;
  • получение справок из бухгалтерии и отдела кадров;
  • компенсация питания.

В группах фраз зададим наборы примеров на основе реальных запросов сотрудников в HR-отдел. Например, для группы «Корпоративная программа ДМС» это будут запросы:

  • как оформить дмс?
  • меня интересует медицинское страхование
  • как получить полис ДМС?

Группы фраз могут дополняться примерами в любой момент, что позволяет оперативно дообучать бота в процессе эксплуатации.

Для каждой группы фраз создадим свою последовательность действий в сценарии. Например, для группы фраз «Заявление на отпуск» реализуем запрос дополнительных данных от пользователя и сохранение его заявки в Trello для последующей обработки сотрудником HR-отдела.

Чтобы запросить данные у пользователя, последовательно добавим в сценарий блоки с запросом ФИО сотрудника и желаемых дат отпуска.



Введённая пользователем информация сохраняется в переменные $Name и $vacation_date и становится доступной для дальнейшего использования в сценарии. Например, для отправки этих данных во внешнюю систему.

В будущих версиях Aimylogic для приёма данных разных типов (текста, чисел, номера телефона) в системе появятся соответствующие блоки, которые автоматически провалидируют ввод пользователя.

Теперь настроим интеграцию бота с Trello, куда будут сохраняться собранные заявки от пользователей.

2. Сохранение заявок пользователей в Trello


Trello предоставляет API для интеграции со своими инструментами, но есть сервисы, в том числе бесплатные, позволяющие использовать их, не тратя время на написание интеграционного кода. Один из таких сервисов — IFTTT. Созданный нами в Aimylogic чатбот отправляет данные в IFTTT, и они появляются в Trello.

Для этого в IFTTT создадим апплет Webhook, который при получении HTTP-запроса от бота будет помещать данные из тела запроса на доску в Trello. В сценарий бота в Aimylogic добавим блок “HTTP-запрос”, который будет передавать данные апплету.

Создание апплета


В интерфейсе IFTTT создаем новый апплет (My Applets -> New applet) задаем триггер срабатывания апплета (нажатием на +this). В появившемся поиске набираем “webhook” и выбираем найденный триггер под названием “Webhooks”.

Жмем на “Receive a web request” и задаем название события триггера (пишем его латинскими без пробелов в поле “Event Name”). Нажимаем на “Create trigger”.

Теперь конфигурируем действие, которое будет происходить, когда бот отправит из сценария запрос на апплет, который мы только что настроили — нажимаем на “that” в апплете.

Настройка интеграции IFTTT с Trello


После нажатия на “that” в IFTTT опять появляется поиск. Ищем там Trello и авторизовываемся в этом сервисе.

После выдачи разрешений на доступ к аккаунту в Trello, выбираем в IFTTT действие “Create a card”.

Далее указываем доску, на которой будут появляться карточки, в поле “Title” (название карточки) укажем “Value1” — это переменная из тела запроса от бота, в которой будет передаваться суть заявки сотрудника (“<Имя сотрудника> хочет пойти в отпуск <период отпуска>”).
Жмем на “Create Action”, когда все настроили как нам нужно. Далее — “Finish”.
Теперь всякий раз, когда бот отправит HTTP-запрос на настроенный нами вебхук, IFTTT возьмет переменную “Value1” из этого запроса и автоматически добавит в Trello карточку с таким названием.

Получение адреса вебхука в IFTTT


Пожалуй, это самая нетривиальная часть интеграции.

Нажимаем на меню “Search” в верхней части страницы IFTTT. Далее ищем в поиске “webhook”. Нажимаем на найденный Webhooks. Далее жмем “Settings”.

Откроется страница, на которой есть URL. Это еще не адрес вебхука! Нужно скопировать этот URL и открыть его в новой вкладке браузера.


Откроется страница тестирования вебхука. Тут можно заполнить название события триггера (то, которое мы выдумали при создании апплета в разделе “Создание апплета”) и значение переменной “Value1”. Теперь если нажать на “Test it”, то в Trello добавится карточка со значением переменной “Value1” в заголовке.


Теперь копируем получившийся URL вебхука (в последней строке, над кнопкой «Test it”) — это и есть адрес вебхука, который мы должны использовать в HTTP-запросе в боте.

Настройка HTTP-запроса в Aimylogic


Добавляем в сценарий блок с HTTP-запросом, когда мы уже собрали данные от пользователя (в переменные $Name и $vacation_date).

В настройках HTTP-запроса в качестве URL прописываем тот адрес вебхука, который мы получили из IFTTT.


В тело запроса помещаем значение переменной “Value1” — формируем в ней текст с переменной $Name, в которой хранится имя пользователя, а также переменной $vacation_date, в которой хранятся даты отпуска. То есть должно получиться так:

{ "value1" : "$Name хочет пойти в отпуск $vacation_date" }

Теперь при выполнении этого запроса, бот подставит в тело запроса значения $Name и $vacation_date и отправит запрос в апплет IFTTT. Тот, в свою очередь, создаст карточку на доске Trello.

3. Тестирование бота


Подготовив сценарий диалога, его тут же можно проверить в Aimylogic, нажав на кнопку “Тест”. На экране появится виджет, в котором можно пообщаться с ботом. Виджет поддерживает как ввод сообщений текстом, так и с помощью кнопок, если они предусмотрены сценарием. Например, в Алисе принято предлагать пользователю кнопки в качестве подсказок, чтобы знакомить его с возможностями навыка.

На этом этапе можно отладить диалог и проверить, насколько он корректен и понятен, не используя дополнительных средств прототипирования.

Обратите внимание, что, благодаря NLU-технологиям (включая сопоставление синонимов, нормальных форм слов, их векторных представлений и синтаксических структур запросов), бот поймёт не только фразы, совпадающие с примерами, но и близкие к ним по смыслу. Если этого не происходит, вы можете дообучить бота, расширив список соответствующих примеров.

Теперь чатбот умеет общаться с сотрудником и сохранять данные в Trello. Осталось разместить бота в нужном канале.

4. Публикация чатбота


С помощью Aimylogic созданного бота можно разместить в одном или нескольких каналах. На данный момент в Aimylogic доступны: чат-виджет для сайта, Telegram или голосовой помощник Яндекс.Алиса.

В скором времени мы добавим новые каналы: VK, Facebook, Slack и другие. Везде сценарий поведения HR-бота будет практически одинаковым, а заявки из всех каналов попадут на доску Trello.


В зависимости от выбранного канала, Aimylogic автоматически сформирует скрипт для вставки на сайт или адрес вебхука для указания в Яндекс.Диалогах. Для использования Telegram достаточно указать токен вашего Telegram-бота, полученный у BotFather.

В Aimylogic отображаются все подключённые к боту каналы и их статусы.

А где можно потестить?


Мы открываем Aimylogic в режиме бета-тестирования. Честно говоря, он еще “сыроват”, но его можно потестить и попробовать разные кейсы: создавать сценарии диалогов в разных каналах, экспериментировать с подключением внешним систем, строить FAQ-боты с пониманием естественного языка.

В релиз следующей версии войдут справочники именованных сущностей, что существенно расширит возможности продукта.

Мы начали делать Aimylogic, стремясь облегчить для пользователей создание простых ботов на нашей платформе, при этом сохранив доступ к ее основной функциональности — NLU, простота интеграции с внешними системами и каналами. Будем дальше развивать продукт, улучшая его UX, прокидывая новые полезные фичи из основной платформы. Будем рады фидбеку и предложениям.

Протестировать платформу можно тут: app.aimylogic.com

Пообщаться с нами или другими разработчиками можно в телеграм-канале. Или просто наберите в поиске Telegram фразу „Aimylogic“.

Комментарии (12)


  1. vassabi
    29.05.2018 18:15

    о, наконец-то интеграция с пользовательскими скиллами.
    помню, как читал доки амазона про алексу — там годный пример был как сделать свой скилл «заказать пиццу» или «рассказать гороскоп».
    мало подробностей про интеграцию с данными самой Алисы (т.е. что знает яндекс про пользователя) и мало подробностей про DSL разбора фраз (откуда берутся всякие $name и $vacation_date) — особенно в разрезе, как это сделать, когда там хочется регулярные выражения или эластичность вариантов (и не копипастить простыни)…


    1. IvanGolubev Автор
      29.05.2018 18:43

      Спасибо за комментарий! Кейс заказа пиццы хрестоматийный для разговорных интерфейсов. Мы в Just AI как раз недавно решили его на нашей платформе, результаты можно видеть в известном голосовом помощнике. Полностью этот кейс решается довольно сложно, учитывая большое количество возможных параметров заказа и глубокую интеграцию, и о нём хочется рассказать отдельно. Aimylogic — пример инструмента для более простых сценариев.

      Сейчас Яндекс передаёт разработчикам Яндекс Диалогов только некий идентификатор пользователя, благодаря которому вы внутри навыка технически можете вести историю общения с конкретным пользователем, задавая ему вопросы и запонимая контекст: имена, адреса, телефоны и т.п., — чтобы упростить повторное использование навыка.

      DSL остался за рамками этой статьи, о нём тоже хочется написать позднее. Он как раз позволяет достаточно гибко описывать фразы на естественном языке, минимизируя копипаст. В Aimylogic используются алгоритмы, которым достаточно нескольких примеров фраз — вариативность речи компенсируется на уровне системы и функций поиска семантической близости.

      В примере из статьи переменные $name и $vacation_date сохраняют себе весь текст пользовательского запроса на определённом шаге диалога. Т.е. на уровне проектирования диалога вы, задавая вопрос про имя, определяете «сохрани следующий ответ в переменную $name». В будущем в инструменте появятся блоки для разных типов данных, так как многие «регулярки», умеющие извлекать нужные данные из запросов (числа, даты, единицы измерения, адреса и т.п.) уже написаны внутри нашей платформы.


      1. vassabi
        29.05.2018 20:43

        о, спасибо за ответ!
        1) ясно
        2)

        Яндекс передаёт разработчикам Яндекс Диалогов только некий идентификатор пользователя
        а он может потом использоваться для других яндекс сервисов? (ну например связать его с яндекс такси) Или он просто уникальный и все?
        3) понятно. надеюсь в вашем «решении заказа пиццы» это можно увидеть.
        4) хорошо. ограничения на переменные и внутренняя структура (а также пользовательские типы — например перечисления) — это было бы замечательно.


        1. Rupper
          30.05.2018 08:36

          Тоже вчера после яка пробовал найти эту информацию, но похоже что нет.

          Вообще, сразу в голову пришли некоторые кейсы, которые невозможны сейчас, но были бы интересны. Для этого нужна пара фич:
          1. Активация навыка по расписанию.
          2. Кроссплатформенная персонификация пользователя

          П. 2 можно обойти если в диалоге пользователь сам будет себя как то идентифицировать.

          А 1 нужен для кейса типа «учу слова». Загружаем список слов в навык (в обход алисы) и даем задание алиса проверяй меня 2 раза в день. И алиса 2 раза начинает диалог сама просит дать перевод для каждого слова по списка в случайном порядке.

          Ну или аналогичные по сути кейсы.


          1. vassabi
            30.05.2018 14:18

            Активация навыка по расписанию.

            1) стремная фича.
            2) можно сделать запись своего голоса с фразой и дать ее прослушать алисе в нужное время (неслышимо для пользователя), а потом соединить алису с пользователем и пускай болтают дальше сами.

            даем задание алиса проверяй меня 2 раза в день

            это задание можно засунуть в обычный планировщик, по которому вы будете вызывать скилл «алиса, проверь, как я выучил слова»


            1. Rupper
              30.05.2018 17:35

              Почему стремная?

              Как алисе передать этот голос? Разве в апи есть такое?

              Понятно что можно в календарь, но тогда магия алисы как то тускнеет, вау
              эффекта не возникает.

              А хочется чтобы прямо как в фантастических фильмах. Если говорить о суровой реальности то консоль то и поудобнее может будет.


              1. vassabi
                31.05.2018 02:40

                1) потому что ее нужно будет отдельно строго контролировать.
                2) мдааа… mea culpa, клиентского апи у него я не вижу, только для скиллов. А жаль. У той же Алексы можно было передавать звук не из микрофона, а из файла…


                1. Rupper
                  31.05.2018 07:41

                  В чем суть контроля? интерфейс должен быть такой чтобы его легко было контролировать, иначе он нафиг не нужен конечно.

                  Я потерял как то Суть диалога уже если честно.


                  1. vassabi
                    01.06.2018 12:46

                    суть контроля в том, что если у вас навыки пассивные (т.е. не работают, когда вы их не зовете), то их у вас может быть 100500. А вот если активные, то уже нужно делать «не по выходным», «не посреди совещания», «не чаще раза в минуту», «звать по одному», «группировать однотипные» и т.д.

                    мое второе замечание — это про наличине серверной части АПИ (там где скиллы), и отсутствие клиентской (чтобы например можно было сделать свое приложение для вызова алисы изнутри).


        1. IvanGolubev Автор
          30.05.2018 12:42

          По поводу user_id, передаваемого навыкам, из официальной доки Яндекс Диалогов:

          Идентификатор экземпляра приложения, в котором пользователь общается с Алисой, максимум 64 символа.

          Даже если пользователь авторизован с одним и тем же аккаунтом в приложении Яндекс для Android и iOS, Яндекс.Диалоги присвоят отдельный user_id каждому из этих приложений.


          1. vassabi
            30.05.2018 14:23

            Идентификатор экземпляра приложения, в котором пользователь общается с Алисой, максимум 64 символа.
            ээээ… прямо просится посмотреть — «чо там с перебором» и «нет ли зависимостей от ОС и времени» :)

            вообще, не так сильно волнует как они выглядят, волнует практический вопрос — можно ли его потом использовать для сервисов _самого_ яндекса? То есть амазон выдавал токен пользователя (НЯП размером в 3кб или даже больше), через который в сценарии скилла «покупка пиццы» (или билетов), можно было сразу после заказа его оплатить в амазоне же. Или сделать другой заказ, и т.д.


            1. IvanGolubev Автор
              30.05.2018 15:30

              Насколько я понимаю, сейчас нельзя. В чате для разработчиков Яндекс Диалогов можно попробовать уточнить.