Не зря в прошлом году Telegram открыл доступ к расшифровке голосовых сообщений. Пользователям куда проще прочитать текст, чем переслушивать записи, особенно когда речь идёт о десятках и сотнях звонков в месяц. Именно поэтому стоит затронуть механизм транскрибации звонков и сообщений через API и облегчить будни тех, кто уже ищет способ автоматизации в своей компании или контакт-центре.

Транскрибация может быть довольно трудоемким и затратным процессом, особенно если это делать вручную. В среднем на ручную транскрибацию 15-минутной записи уходит не меньше 30 минут, к тому же услуги транскрибаторов обходятся недёшево: от 1 500 руб. в час. Такие ценники можно увидеть на биржах вроде Zapisano, YouDo, Workzilla и FL. К счастью, существует множество инструментов и сервисов, которые могут автоматизировать этот процесс.

Например, МТС Exolve. Из этой статьи вы узнаете, как начать работу с платформой, зарегистрироваться на ней, настроить параметры аккаунта, выбрать подходящие инструменты и воспользоваться преимуществами транскрибации.

Начало работы 

MTС Exolve — облачный сервис, который использует Voice API — технологию для подключения функций вызовов в сторонние продукты, а заодно машинное обучение для преобразования речи в текст с высокой точностью и скоростью. С помощью Voice API разработчики могут создавать голосовых помощников, интерактивные голосовые системы и другие решения, использующие голос для взаимодействия с пользователями.

Эти функции Voice API позволяют создавать полноценных виртуальных ассистентов, способных распознавать самих пользователей, их речь и общаться с ними голосом.

Для начала использования Exolve разработчику необходимо зарегистрироваться. Каждый пользователь получает 300 ₽ для тестирования: покупки номера и услуг. Подробнее о возможностях тестового аккаунта можно почитать здесь.

Настройка параметров аккаунта

Для настройки параметров аккаунта в МТС Exolve необходимо войти в свой аккаунт и перейти в раздел «Настройки» или «Профиль». Здесь вы сможете изменить пароль, а также выбрать предпочтения для использования сервиса. Вы также можете добавить и подтвердить свой номер телефона, чтобы использовать функции звонков и SMS.

Методы транскрибации

Одно из основных преимуществ автоматической транскрибации — скорость и эффективность. Алгоритмы машинного обучения могут обрабатывать большие объемы аудиозаписей за короткое время, что делает этот метод идеальным для расшифровки длинных записей разговоров с клиентами или интервью с пользователями.

Автоматическую транскрибацию можно настроить для распознавания конкретных терминов и фраз, что позволяет улучшить точность. При высочайшем качестве связи существующих провайдеров связи автоматический перевод речи в текст оказывается не менее эффективным, чем ручной.

Ручная транскрибация

Считается, что ручная транскрибация может подойти для расшифровки аудиозаписей с конфиденциальной или чувствительной информацией. В этом случае человек-оператор может гарантировать, что информация будет точно и безопасно донесена в тексте. Но всё больше пользователей всё равно прибегают хоть к какой-то автоматизации, через программы вроде LossPlay. Поэтому в таких случаях нужно учитывать риск утечки данных.

Exolve успешно работает с конфиденциальной информацией, и в отличие от человека не передаст данные третьим лицам. Платформа специализируется на точных транскрибациях записей разговоров, поэтому предлагает формат полной детализированной транскрипции.

Пользователи могут отслеживать статус расшифровки в реальном времени. Платформа предоставляет удобные форматы вывода, в частности JSON, также в ближайшее добавится TXT.

Примеры использования транскрибации

Транскрибация звонков

Вы можете использовать транскрибацию для преобразования разговоров в текст. Это может быть полезно для контактных центров, которые хотят сохранять записи разговоров с клиентами для последующего анализа, улучшения качества обслуживания и улучшения скриптов.

Примеры технической реализации транскрибации

Вот примеры использования МТС Exolve с JavaScript кодом для транскрибации звонков и голосовых сообщений:

Звонки

Чтобы транскрибировать звонки с помощью МТС Exolve, рекомендую сразу заглянуть в документацию, а затем выполнить несколько шагов:

1. Создать новый звонок, передав объект с параметрами звонка, такими как номер телефона, на который осуществляется звонок (to), номер телефона, с которого осуществляется звонок (from), и флаг записи звонка (record).

2. После создания звонка, получить идентификатор записи разговора, передав в качестве параметра идентификатор звонка.

3. После завершения транскрибации, вывести текст транскрибации в консоль с помощью console.log.

Код для транскрибации звонков с помощью MTC Exolve будет выглядеть следующим образом:

```
// Создание нового звонка
const call = await exolve.createCall({
  to: '+79001234567',
  from: '+79007654321',
  record: true
});


// Получение идентификатора записи разговора
const recordingId = await exolve.getCallRecordingId(call.id);


// Транскрибация записи разговора
const transcription = await exolve.transcribeRecording({
  recordingId: recordingId,
  language: 'ru-RU'
});


// Вывод текста транскрибации в консоль
console.log(transcription.text);
```

Голосовые сообщения

Чтобы транскрибировать голосовые сообщения с помощью MTС Exolve, необходимо:

1. Создать новую голосовую SMS с помощью метода createVoiceSms.

2. Получить идентификатор записи голосового сообщения с помощью метода getVoiceSmsRecordingId.

3. Транскрибировать запись голосового сообщения с помощью метода transcribeRecording.

Пример кода:

// Создание новой голосовой SMS
const voiceSms = await exolve.createVoiceSms({
  to: '+79001234567',
  from: '+79007654321',
  fileUrl: 'https://example.com/voice.mp3'
});


// Получение идентификатора записи голосового сообщения
const recordingId = await exolve.getVoiceSmsRecordingId(voiceSms.id);


// Транскрибация записи голосового сообщения
const transcription = await exolve.transcribeRecording({
  recordingId: recordingId,
  language: 'ru-RU'
});


console.log(transcription.text);
```

Для взаимодействия с Exolve API используется библиотека exolve-sdk-js. Для установки библиотеки необходимо выполнить команду `npm install exolve-sdk-js`, затем импортировать библиотеку в свой проект и создать экземпляр класса Exolve с указанием токена доступа для авторизации в Exolve API. После этого можно использовать методы библиотеки для взаимодействия с API.

Добавлю, что МТС Exolve предоставляет услугу расшифровки записей разговоров по цене 0.60 руб. за минуту, включая НДС. Оплата прозрачна и простая, без дополнительных сборов. Ряд конкурентов предлагают фактически ту же услугу по более высокой стоимости, вплоть до 16 рублей за минуту.

Заключение

Выше лишь база для того, чтобы двинуться дальше и создать свою механику расшифровки. В любом случае, благодаря таким алгоритмам машинного обучения и профессиональным платформам, сейчас куда выгоднее интегрировать API в свои проекты и использовать подобные сервисы с высокой точностью транскрибации, чем отдавать деньги за ручные расшифровки.

При этом, нередко в похожих сервисах вы можете выбирать уровень детализации транскрибации, от простого текста до подробного протокола с указанием временных меток и говорящих лиц.

Автор: Роман Андреев

Комментарии (2)