С появлением application programming interface или, если кратко, API, жизнь программистов стала несколько легче, чем раньше. За минимальное время теперь можно добавить в свое приложение определенные функции, структуры, процедуры, предоставляемые другим приложением, операционной системой или сервисом. API своих сервисов и приложений сейчас открывают многие разработчики.

В 2013 году компания IBM открыла сразу три API когнитивной системы Watson в рамках “The Watson Ecosystem” — экосистемы, которая на то время включала более 40 различных технологий. Благодаря этим API разработчики получили возможность встраивать в собственные приложения и сервисы возможности, предлагаемые IBM Watson. Сейчас открытых компанией IBM API гораздо больше, чем три, да и сами сервисы стали более функциональными. В продолжении — описание существующих API различных сервисов, к которым может получить доступ разработчик.

Сейчас они разделяются на несколько групп в соответствии с основными возможностями и сферой использования.

Группа «Язык»


В эту группу входит семь различных сервисов с открытыми API:
• AlchemyLanguage;
• Conversation;
• Document Conversion;
• Language Translator;
• Natural Language Classifier;
• Natural Language Understanding;
• Personality Insights;
• Retrieve and Rank;
• Tone Analyzer.

AlchemyLanguage


Сюда входит целый набор API, который позволяет научить свое приложение или сервис «понимать» чувства, ключевые слова и фразы, высокоуровневые абстракции и прочее. Этот сервис можно применить для того, чтобы проанализировать общие настроения покупателей определенного продукта. Что думают о вашем товаре или услуге фолловеры в Twitter или друзья из Facebook? Это важная информация, которая позволит улучшить взаимодействие со своей целевой аудиторией.

Кроме того, сервис поможет уловить момент появления новых конкурентов или проанализировать действия старых. Также сервис анализирует контент на сайте компании и оценивает его по различным критериям.

Доступ к API можно получить здесь. Дополнительная информация доступна по этой ссылке.

Conversation


Watson Conversation помогает разработчику создать бота или виртуального ассистента в виде приложения для мобильного устройства, веб-сервиса или даже робота «во плоти», способного общаться с людьми. В рамках сервиса разработчикам предоставляется визуальный редактор диалогов, благодаря которому разработчик может наладить канал общения со своими посетителями. Никакие особенные навыки программирования здесь не требуются.

Доступ к API здесь, подробная информация здесь.

Document Conversion

Этот сервис позволяет преобразовывать различные форматы документов в формат, который используется одним из сервисов Watson. Document Conversion — вспомогательный сервис, который используется наряду с другими возможностями когнитивной системы.

Доступ к API здесь, подробная информация здесь.

Language Translator

Переводит контент разных типов на разные языки. Может работать в режиме реального времени. Этот сервис удобен тем, что с его помощью можно создать приложение, с которым сможет работать любой пользователь из любого уголка мира. То есть компания, например, из России, сможет предлагать свою продукцию покупателю из Японии. Но возможности этого сервиса гораздо шире, чем просто налаживание диалога с покупателями и пользователями из разных стран.


Сервис самообучающийся. Так что если где-то была допущена ошибка, и ее исправили, то эта ошибка больше не появится. Кроме того, сервис «запоминает» специфические названия продуктов, имена людей и термины для того, чтобы перевод был максимально корректным.

Доступ к API здесь, подробная информация здесь.


Natural Language Classifier


Этот сервис классифицирует контент по его тематике. Например, он позволяет «объяснить» компьютеру, что вопросы вроде «Какая сегодня погода», «Жарко ли сегодня», «Можно ли будет отправиться на море» имеют отношение к погоде и температуре. Соответственно, разработанный бот сможет «понять», о чем спрашивает пользователь и дать релевантный ответ.

Доступ к API здесь, подробная информация здесь.

Natural Language Understanding

Анализ и извлечение мета-данных из такого типа контента, как термины, ключевые слова, категории, описание чувств, эмоций, отношений, семантических ролей. Этот сервис может работать с неструктурированным текстом.

Доступ к API здесь, подробная информация здесь.


Personality Insights

Этот сервис позволяет оценить некоторые аспекты личности автора определенного текста (например, делового сообщения). Анализ ведется по содержимому написанному и тому, как составлено послание или документ. Для того, чтобы сервис работал корректно, рекомендуется загружать тексты, содержащие не менее 1200 слов.

Доступ к API здесь, подробная информация здесь.

Retrieve and Rank

При помощи этого сервиса разработчик может извлечь наиболее релевантную информацию из группы документов. Например, применив Retrieve and Rank, разработчик может быстро найти решение проблемы с каким-либо оборудованием, проанализировав инструкцию к этому оборудованию. С его помощью можно улучшить и работу колл-центра, когда сотрудник при помощи сервиса быстро находит решение на заданный вопрос. В результате сокращается время поиска ответа, а клиент получает более полную информацию по своему вопросу.

Доступ к API здесь, подробная информация здесь.

Tone Analyzer

Сервис IBM Watson Tone Analyzer использует лингвистический анализ для определения тона сообщения. Он помогает сразу оценить эмоциональную составляющую контента, чтобы быстрее сориентироваться в том, как нужно отвечать. Сервис может использоваться и для анализа социальных медиа — например, странички социальной сети с отзывами о продукции или сервисе компании. Также с ним можно работать при общении с клиентами.

Доступ к API здесь, подробная информация здесь.

Группа «Речь»


Сюда входят такие сервисы, как
• Speech to Text;
• Text to Speech.

Speech to Text


Этот сервис используется, как уже можно понять по названию, для перевода речи в текст. Таким образом, можно расшифровывать аудиообращения клиентов, переводя их в текстовый документ, а также анализировать общий тон звонков при помощи сервисов, указанных выше. Конечно, это лишь один из способов, на самом деле их гораздо больше.

Доступ к API здесь, подробная информация здесь.

Text to Speech

Ну а этот сервис преобразовывает печатный текст в речь, используя различные голоса, тональность и языки. Таким образом, разработчик может кастомизировать произношение ботом каких-либо слов для более тесного общения с аудиторией. В качестве примера использования сервиса можно привести разработку интерактивной игрушки, создание автоматического колл-центра, навигационной системы с говорящим виртуальным ассистентом.

Доступ к API здесь, подробная информация здесь.

Группа «Обработка изображений»


В этой группе пока только один сервис:

Visual Recognition


Сервис позволяет «объяснить» машине, что изображено на картинке. Он распознает продукты питания, блюда, лица людей с определением их примерного возраста и пола, ищет схожие изображения. Также можно создавать собственные кастомные шаблоны. Пригодиться такой сервис может ритейлерам и представителям многих других сфер.

Доступ к API здесь, подробная информация здесь.

Группа «Работа с данными»


А в эту группу входят сервисы, которые позволяют провести подробный анализ данных любых сложных документов различной тематики:
• AlchemyData News;
• Discovery;
• Discovery News.

AlchemyData News

Этот сервис индексирует от 250 до 300 тысяч англоязычных новостей каждый день. Поиск по новостной истории доступен за последние два месяца. Ведется поиск по ключевым словам. Таким образом, можно встроить API сервиса в свое приложение и предложить его пользователям, которым нужны структурированные новости на различную тематику.

Доступ к API здесь, подробная информация здесь.

Discovery


Структурирование данных из проанализированных новостей с выделением основного содержания. Сервис работает, преимущественно, с английским языком. Каждый день этот сервис анализирует более 300 тысяч новостных заметок и блог-записей из 100 000 источников. Сервис позволяет искать и анализировать в полученной информации отзывы по определенному продукту или услуге с определением частоты упоминания различных названий и выполнять с данными прочие действия.

Доступ к API здесь, подробная информация здесь.

Discovery News

Этот сервис предоставляет доступ к набору данных, собранных в результате анализа сотен тысяч новых статей и блог-записей на разные темы. Количество источников достигает 100 000.

Доступ к API здесь, подробная информация здесь.

Как работать со всеми этими инструментами?

Для того, чтобы начать работу с IBM Watson и его сервисами, необходимо выполнить следующие действия:

1. Получить бесплатную учетную запись на платформе Bluemix. Первый месяц работы с этой платформой бесплатен;
2. Настроить аккаунт, указав данные и настроив окружение. В этом поможет мастер;
3. Найти необходимый сервис, который нужен именно вам. На самом деле, Bluemix предлагает гораздо больше сервисов, чем указано выше. Начать работу с ними очень просто;
4. Создать инстанс. Для этого нужно выбрать сервис Watson и затем нажать кнопку Create;
5. Получить необходимые данные для встраивания в свое приложение.
6. Создать собственный сервис или приложение.

Сейчас Watson API используют тысячи партнеров компании, в их числе как крупнейшие корпорации, вроде японской компании Softbank, так и независимые разработчики. Оценить возможности когнитивной системы IBM Watson можно совершенно бесплатно.
Поделиться с друзьями
-->

Комментарии (1)


  1. frees2
    19.06.2017 13:58
    -2

    Voice Transformation SSML, конечно хорошая няшка, можно вылизывать текст.
    Русского языка нет.
    Чуть бухая микрософтовская Ирина мобайл, это конечно треш, но в принципе, таки удалось настроить и словарик составить, хотя всё равно дама путает слова. Получается лучше чем у IBM.

    Попробовал технический английский. Не впечатлило.
    https://text-to-speech-demo.mybluemix.net/