В середине нулевых, когда я ещё был студентом, я знакомился с девушками, в универе, в клубах и парках. А ещё на сайтах знакомств. Вёл долгие переписки, пытаясь добиться согласия девушки прийти на живую встречу. И бывало так, что «девушка» просила пополнить ей баланс, и тогда уж она точно сможет мне перезвонить или например потратить деньги на проезд. И несмотря на то, что сообщения её периодически повторялись, я всё равно перечислял деньги. Не буду оправдываться, утверждая, что был тогда юным и доверчивым, это не отменяет того факта, что вёл я себя как олень. Тогда это было моё первое знакомство с чат-ботом.

Хоть идея поговорить с роботом может показаться глупой или фантастичной, тем не менее вы уже делали это, если когда-либо обращались в онлайн-службу поддержки клиентов крупной компании. Развитие и интеграция ИИ в нашу повседневную жизнь означает, что роботы постепенно начинают окружать нас повсюду. Чат-боты — лишь один из распространённых примеров.

Создание машины, которая действует и разговаривает как человек, уже давно стало венцом в разработке ИИ, и чат-боты на один шаг приближают нас к машинам, которые смогут разговаривать так, будто они — одни из нас с вами. Если когда-то чат-боты были передовым приложением, которое могли себе позволить интегрировать в свои продукты и услуги только крупнейшие компании мира, то уже сегодня эти машины распространены повсеместно. Современные чат-боты вызывают в воображении образы Siri, Alexa, Google Assistant или Cortana, но их обычно рассматривают как диалоговые ИИ, поскольку они распознают лишь живую речь, но не текст.

Легко предположить, что чат-боты — это разработка XXI века, но на самом деле у них длинная история, которая восходит чуть ли не к созданию самого компьютера.

Первые шаги


В начале XX века Алан Тьюринг разработал теорию о том, что человеческий мозг представляет собой цифровой вычислительный механизм, который с течением времени обучается, чтобы стать универсальной машиной. В целом, Тьюринг известен благодаря своим новаторским работой в области искусственного интеллекта. В 1950 году он разработал тест, чтобы определить, способен ли компьютер думать.


Самый первый в мире чат-бот был создан Джозефом Вейценбаумом в Массачусетском технологическом институте (MIT) в 1966 году и получил название ELIZA. Бот использовал методологию сопоставления с образцом и последующей подстановки, чтобы придумывать ответы на запросы, вводимые людьми. Сценарий ELIZA имитировал работу психотерапевта, и её создатель быстро открыл для себя силу чат-ботов, когда обнаружил, что тестировщики легко доверяют программе секреты и сокровенные мысли. Доступные на тот момент методы программирования были чрезвычайно примитивными по сравнению с сегодняшним днём, но ELIZA всё же доказала, что компьютеры могут, по крайней мере, имитировать человеческий текстовый разговор. ELIZA полагалась на обработку входных операторов в соответствии с предопределёнными сценариями, созданными Вейценбаумом, что, по сути, создавало впечатление, что она может понимать весь текст до тех пор, пока её ограничения в конечном итоге не обнаруживались в ходе продолжающегося разговора.

На протяжении 80-х годов были созданы различные версии чат-ботов. Следующим по известности был Parry, созданный в 1972 году Кеннетом Колби, профессором психиатрии Стэнфордского университета. Parry пытался подражать больному шизофренией и представлял собой чат-бот типа «стимул-реакция», как ELIZA, но с дополнительной встроенной стратегией разговора, улучшающей его функциональность.

У Пэрри и Элизы было множество разговоров, самый известный из них доступен здесь. Это были ранние попытки использовать обработку естественного языка в чат-ботах. Оба прошли ограниченную форму теста Тьюринга для ИИ, и Пэрри удалось обмануть около 52 % психиатров, проанализировавших его ответы. Конечно, в то время представления людей об ИИ были очень примитивны, и Элиза с Пэрри были одними из первых компьютеризированных устройств, которые были способны обмануть людей, заставляя их думать, что они люди. Это было довольно невероятным фактом на то время.


Очеловечивание


После Тьюринга исследователи начали использовать различные технологии, такие как обработка естественного языка и искусственный интеллект.

Jabberwacky — это чат-бот, созданный разработчиком Ролло Карпентером в 1988 году. Его целью было имитировать естественный человеческий разговор в развлекательной форме. Некоторые люди используют его в целях академических исследований. Считается, что чат-бот использует технику искусственного интеллекта, называемую «контекстным сопоставлением с образцом».

Созданный в 1992 году для MS-Dos, Dr Sbaitso был одним из первых попыток внедрения ИИ в чат-бот. Распространяемая с различными звуковыми картами производства Creative Technology, программа «разговаривала» с пользователем, как если бы она была психологом, и была разработана для демонстрации голосов, которые могли воспроизводить звуковые карты.

Программисты опирались на наработки Вейценбаума для создания чат-ботов, способных выполнять более сложные функции в течение следующих нескольких десятилетий. Чат-боты стали основой автоматизированных телефонных систем. Следующим большим прорывом стало создание Ричардом Уоллесом ALICE в 1995 году. Ранее программа была известна как Alicebot, потому что она был первой, кто работал на компьютере под именем «Алиса». Программа основана на AIML, языке разметки искусственного интеллекта, который помогает задавать правила диалога. Программа имитирует общение с реальным человеком через Интернет. ALICE была способна обрабатывать естественный язык и имитировать реальный человеческий разговор. Однако настоящая революция произошла, когда исходный код ALICE стал открытым. Другие программисты могли использовать ALICE для создания собственных чат-ботов, что позволяло быстро продвигаться в мире чат-ботов. В 2001 году появился Smarterchild, который стал доступен в чатах MSN и AOL. Многие люди считают Smarterchild предшественником Siri, популярного сегодня чат-бота Apple.

Некоторые из тяжеловесных чат-ботов XXI века включают IBM Watson (хотя технически это сервис искусственного интеллекта, а не чат-бот сам по себе), который выиграл в популярном американском шоу ответов на вопросы Jeopardy! в 2011 году.

Внедрение искусственного интеллекта и разработка чат-ботов с открытым исходным кодом привели к быстрым улучшениям и, в последствии, к широкому внедрению этой технологии. Чат-боты теперь регулярно служат личными помощниками или техподдержкой по обслуживанию клиентов в компаниях по всему миру. Siri от Apple, Bixby от Samsung, Cortana от Microsoft, Google Assistant от Google и Alexa от Amazon — всё это примеры чат-ботов, которые действуют как личные помощники. Они реагируют на голосовые команды и способны отслеживать электронную почту, календари, системы домашней безопасности и другие задачи. Однако ни один из этих чат-ботов не идеален. У Siri есть проблемы с разными акцентами, и для работы требуется подключение к Интернету. Alexa и Google Assistant имеют проблемы с конфиденциальностью. Cortana способна устанавливать вредоносное ПО. Несмотря на свои недостатки, эти чат-боты стали неотъемлемой частью нашей сегодняшней жизни.


В 2016 году Facebook разрешил разработчикам развертывать интерактивные чат-боты в Messenger — сейчас на платформе более 300 000 ботов, хотя не все они основаны на искусственном интеллекте.

В 2022 году Google запускает приложение, которое позволит пользователям взаимодействовать с искусственным интеллектом LaMDA. Компания начала разрешать пользователям регистрироваться в приложении AI Test Kitchen, используя учётную запись Google на устройствах Android или Apple. Приложение позволяет пользователям общаться с LaMDA в непрерывном наборе тестовых демонстраций.

В 2022 году появился новый чат-бот с искусственным интеллектом под названием ChatGPT от создателей DALL-E и GPT-3. OpenAI предоставил публичный доступ к ChatGPT бесплатно на время исследовательского периода, что позволило большому числу людей понять, как может выглядеть жизнь с ИИ. Составление письма своему боссу, объяснение сложных идей или предложение идей подарка – это всего лишь несколько простых действий, которые может совершить ChatGPT, всё, что вам нужно – ввести вопрос. Он далёк от совершенства, у него всё ещё есть свои ограничения, но его потенциал огромен.


Как человек



Чат-боты бывают двух видов. Чат-бот, управляемый правилами, следует заранее определённому рабочему процессу или сценарию. Напротив, чат-боты, управляемые искусственным интеллектом, понимают контекст разговора и намерения пользователя и участвуют в осмысленном динамичном диалоге. В результате бот с искусственным интеллектом заставляет вас чувствовать, что вы взаимодействуете с человеком, а не с компьютером.


Будущее диалоговых чат-ботов с ИИ зависит от того, насколько хорошо реализованы следующие критерии:

  • Понимание
  • Память
  • Настроение
  • Личность
  • Непрерывность
  • Перемена темы


Понимание
Правильная интерпретация запроса пользователя является основой для ИИ. Эта технология также способна идентифицировать и объединять дополнительную информацию для предоставления более полного ответа. Например, сотрудник хочет получить информацию о существующем продукте. Помимо общедоступной информации, чат-бот знает, что вышло последнее обновление. В таком случае, в ответ будут включены обе части информации. Предоставление более полных данных экономит время сотрудников и гарантирует, что у них будет самая актуальная информация.

Память
Чат-боты запоминают. Они сохраняют информацию для использования в разговоре или для помощи во время будущих взаимодействий. Например, клиент часто пользуется онлайн-службой поддержки компании. После нескольких использований чат-бот запоминает, что клиент всегда нажимал на часто задаваемые вопросы, прежде чем просматривать любую другую информацию. В следующий раз, когда клиент попросит о помощи, чат-бот поместит часто задаваемые вопросы вверху результатов поиска.

Настроение
Люди используют одни слова, когда они в хорошем настроении, и другие, когда в плохом. ИИ может научиться распознавать различия и оценивать настроение конечного пользователя. Предположим, что клиент некоторое время общался с чат-ботом по поводу проблемы. Чат-бот определяет изменение настроений по длине ответа и используемым словам. Чат-бот с ИИ направляет клиента к человеку, если считает, что клиент разочаровывается в ответах чат-бота.

Личность
Чат-боты с искусственным интеллектом могут улучшить взаимодействие. Язык также может передать личность или стиль. Некоторые компании создают персонажей, чтобы передать «личность». Чем ближе взаимодействие к человеческому разговору, тем больше вовлекается пользователь. Потребители, которые часто используют Siri или Alexa, и воспринимают их как индивидуальность.

Непрерывность
Чат-боты используют прошлые взаимодействия для продолжения разговоров, когда пользователи переходят с одного устройства на другое. Людям не нужно повторять запрос, если они переходят со своего телефона на ноутбук. Если что-то и не нравится потребителям, так это необходимость повторяться каждый раз, когда они начинают новое взаимодействие.

Перемена темы
Известно, что люди перескакивают с темы на тему. Группа обсуждает планы на отпуск, когда кто-то спрашивает, пробовал ли кто-нибудь новый тайский ресторан в городе. Внезапно группа переходит к китайским ресторанам, не решая вопрос про отпуск. Чат-ботов с искусственным интеллектом можно научить адаптироваться к этим человеческим непостоянствам.

Внедрение более продвинутых концепций ИИ в ландшафт чат-ботов решило ряд проблем. Современные боты могут делать намного больше, чем просто повторять ответы на часто задаваемые вопросы клиентам в браузере веб-сайта. Они могут реагировать на естественный человеческий голос, обнаруживать эмоции и чувства в тоне клиента и запускать автоматизированные рабочие процессы без участия человека.

Со временем, когда клиенты и сотрудники компаний стали требовать интерактивного, персонализированного многоканального взаимодействия в режиме реального времени, организациям потребовались сложные чат-боты с поддержкой ИИ, чтобы оправдать их ожидания. Следовательно, чат-боты превратились в диалоговый ИИ с мощными возможностями, включая машинное обучение, обработку естественного языка, понимание контекста и анализ настроений.

Машинное обучение позволяет алгоритмам ИИ учиться на огромном количестве данных. Аннотации NLP и маркировка данных облегчают ИИ восприятие разговоров, что приводит к более точным результатам, которые становятся более естественными, детализированными и реалистичными. ИИ используют различные подходы машинного обучения к NLP, чтобы понимать как речь, так и текст. Машинное обучение помогает чат-ботам избежать головоломки, связанной с необходимостью предварительного программирования диалоговых стратегий.


Разговорный ИИ — это набор передовых технологий, включая обработку естественного языка (NLP), понимание естественного языка (NLU), машинное обучение (ML) и распознавание речи, для обработки письменных и устных входных данных и реагирования на них в естественной, человеческой манере. Разговорные ИИ-боты могут понимать нюансы языка, включая грамматику, сленг и канонические словоформы. Более того, они обучены понимать тип и интенсивность эмоций пользователя и реагировать соответствующим образом.


График развития чат-ботов

Важно отметить, что существуют фундаментальные различия между чат-ботом и настоящим диалоговым взаимодействием с ИИ. Человеческий язык сложен, а разговорный ИИ предоставляет множество расширенных возможностей, которые позволяют выходить за рамки сценариев. Некоторые из них включают:

  • Управление контекстом. Благодаря диалоговому ИИ боты всегда извлекают уроки из прошлых взаимодействий с пользователем и запоминают важные детали, включая информацию и предпочтения клиентов, профиль сотрудника и т. д., что упрощает проведение персонализированных разговоров с богатым контекстом.
  • Анализ настроений. Диалоговые боты с ИИ понимают тон и эмоции высказывания пользователя и реагируют соответствующим образом; например, они могут направить беседу в другое русло или изменить стиль общения.
  • Управление диалогами. Человеческие разговоры полны поворотов. Разговорный ИИ позволяет ботам обрабатывать такие сложные изменения диалогов, включая изменение сущности, обработку нескольких сущностей в рамках одного высказывания и т. д.
  • Многоканальная и многоязычная поддержка. Разговорный ИИ позволяет пользователям начинать общение в одном канале (например, WhatsApp) и заканчивать его в другом (например, Facebook) без потери контекста или непрерывности. Более того, организации могут обращаться к глобальной аудитории с помощью чат-ботов, поддерживающих разные языки.


Вначале разговорные боты начинались как виртуальные помощники, которые могли помогать пользователям в онлайн-поиске, отвечать на голосовые команды, воспроизводить музыку и т. д. Но со временем, особенно после 2015 года, разговорный ИИ развивался быстрыми темпами, и предприятия начали использовать чат-боты (и голосовые боты) на базе искусственного интеллекта для различных вариантов использования в различных рабочих функциях — от продаж до операций и поддержки.

Учитывая множество преимуществ, которые они предоставляют, становится ясно, что организации в первую очередь должны внедрить чат-ботов с возможностями диалогового ИИ. Они обеспечивают интерактивные, индивидуальные и ценные взаимодействия для улучшения отношений с клиентами и сотрудниками. Поскольку диалоговые чат-боты с искусственным интеллектом извлекают уроки из прошлых разговоров и любых новых данных, которые поступают в систему, они могут точно предсказать, чего хотят пользователи, чтобы сформулировать конкретные ответы.

Будущее чат-ботов


Раньше качество телефонных линий было настолько плохим, что трудно было чётко услышать голос оператора, и оказалось, что женский голос на частоте 3 кГц звучал намного лучше, чем мужской, поэтому для компенсации плохого качества сети на работу привлекались операторы-женщины. Затем представили представили интерактивное голосвое меню (IVR), машины, которые можно активировать, чтобы давать самые простые ответы на основе предварительно записанных голосов (и многих они раздражали длинной последовательностью вопросов, на которые надо было ответить). IVR со временем стал умнее, например, вместо того, чтобы взаимодействовать, нажимая цифру (нажмите 1, если хотите…), вы могли сказать «Один». Тем не менее, назвать их «умными» — преувеличение. Большинство людей до сих пор ненавидят разговаривать даже с самыми умными из них.

Взаимодействие с чат-ботом может в конечном итоге стать таким же беспроблемным, как и общение с человеком. Но всегда ли мы рады общению с «неизвестным» человеком? Подумайте о разочаровании, которое вы испытываете, когда звоните в сервисный центр и разговариваете с представителем службы поддержки. Вам нужно объяснять свою проблему, что у вас была та же проблема месяц назад, когда вы говорили с другим представителем, который предложил то-то или это…


Можно предсказать, что в будущем появятся экземпляры чат-ботов, которые будут распознавать ваш голос независимо от того, откуда вы звоните и какое устройство используете. После он превратится в вашего личного помощника, который знает вас и помнит все предыдущие взаимодействия с вами. Вам не придётся объяснять чат-боту свою «историю», он её знает (возможно, даже лучше вас), и вы можете продолжить разговор с того места, на котором остановились в прошлый раз.

С другой стороны, это может повлечь за собой серьёзные проблемы с конфиденциальностью. Это будет (частичная) копия нас самих (части наших проблем и решений) в киберпространстве, скорее всего, вне нашего контроля. Это будет ещё одна ситуация, когда мы пожертвуем частью нашей конфиденциальности, чтобы получить лучший сервис.

По мере того, как развитие ИИ продолжается, мы можем ожидать, что чат-боты также улучшатся. Вскоре станет невозможно определить, разговариваете ли вы онлайн с ботом или с реальным человеком. Чат-боты прошли долгий путь от своей первоначальной формы, а обработка естественного языка и искусственный интеллект позволяют быстро внедрять новые технологии в нашу повседневную жизнь.

Чат-боты будущего ещё больше преодолеют разрыв между роботизированным и человеческим словесным и текстовым общением, становясь при этом всё более эмоционально чувствительными и автономными. С развитием технологий, происходящим ежедневно, кто знает, каким будет следующий шаг в эволюции чат-ботов. Повсеместное распространение чат-ботов проникнет в науку, сельское хозяйство и производство, где роботы-помощники смогут содействовать исследователям проводить эксперименты, а также отслеживать и систематизировать данные.

Комментарии (2)


  1. vassabi
    18.12.2022 19:02

    Можно предсказать, что в будущем появятся экземпляры чат-ботов, которые будут распознавать ваш голос независимо от того, откуда вы звоните и какое устройство используете. 

    о,

    1) анонимизация через TTS получит новое дыхание
    2) а что будет за подделку чужого голоса ? :)


    1. vkni
      18.12.2022 19:51

      Ну то же, что и сейчас. :-)