В мае этого года состоялась презентация нового персонального помощника, созданного на основе Siri (приложения Apple, призванного отвечать на вопросы, заданные устной речью и давать различные рекомендации). Новая программа была разработана создателями Siri Дагом Киттлаусом (Dag Kittlaus) и Адамом Чейером (Adam Cheyer) и получила имя Viv. Проект набирает обороты, позиционируя себя, как шаг в новое поколение персональных помощников. В недавнем интервью Даг Киттлаус раскрыл особенности нового проекта.



Кто же она такая, эта Viv?


На официальном сайте, Viv представлена как платформа искусственного интеллекта, которая позволяет разработчикам распространять свои продукты через интеллектуальный разговорный интерфейс. Что является самым простым в мире способом взаимодействия с устройствами. Viv обучается миром, знает больше, чему ее научили и самообразовывается каждый день. Вроде ничего необычного для современного искусственного интеллекта, но только на первый взгляд.

В то время как Siri отвечает только на определенные команды и не помнит того, что Вы ей только что говорили, Viv в состоянии опираться на информацию, полученную из предыдущих «бесед» и может удовлетворить чрезвычайно специфические запросы. Так, к примеру, Viv может предоставлять информацию о прогнозах на будущее и совершать платежные операции.

Представляем Вашему вниманию интервью, взятое Popular Science у Дага Киттлауса на Венском фестивале (Pioneers Festival 2016).



Даг Киттлаус рассказывает о своем новом виртуальном персональном помощнике на венском Pioneers Festival 2016 г.

Popular Science: Вы помогли стартовать Siri и у Вас есть глубокое понимание того, как работают большинство персональных помощников. Как Viv справляется там, где другие «опускают руки»?

Даг Киттлаус: На сегодняшний день каждая платформа, подобная Viv, зачастую имеет своего менеджера по продукту, который выясняет, какими должны быть новые функции. Затем разработчик кодов — как правило, весьма сложных — обеспечивает работу команд по типу «Если кто-то спросит об этом, то делай вот это». Проблема заключается в том, что в такой способ Вы не можете охватить весь мир. Viv позволяет сторонним разработчикам действовать с ней совместно (в сущности, как и Wikipedia) и использовать набор довольно простых инструментов, чтобы создать то, чего они хотят. Это помогает Viv охватить целое множество вещей, которые могли бы создать разные специалисты — от десятков, тысяч, десятков тысяч единиц и до самого не предсказуемого количества. Достаточно большой шаг вперед, согласитесь. Viv дает возможность тысячам людей со всего мира в одночасье обучать ее новым вещам.



PS: Вы упомянули, что секретным «соусом» в опциях Viv выступает способность самостоятельно писать собственные команды. По сути — это программа, которая пишет саму себя. Как это поможет ей приобрести лучшие практические знания?

ДК: В каждом случае для такой системы как эта, индивидуальный разработчик должен сказать машине, что ей делать шаг за шагом. Главная задача заключается в том, чтобы сначала чему-нибудь научить искусственный интеллект, а затем тренировать его делать это все лучше и лучше. Но Вы не можете поступить таким образом, когда на рынке представлены десятки тысяч различных услуг. В частности, когда многие из них работают совместно и таким образом, о котором Вы и не задумывались. Один из наших больших скачков вперед заключается в том, что Viv в состоянии распознавать намерения пользователя с помощью устной речи и сразу же, динамично писать ответные команды. Эта способность в паре с огромным количеством других сервисов может коренным образом изменить способ применения персонального ассистента, частоту обращений за его помощью и нашу зависимость от него. Это грандиозная вещь.



PS: Хорошо, если это Ваше большое преимущество, то в чем же заключается Ваш большой недостаток? И как Вы думаете, возможно ли его преодолеть?

ДК: У нас здесь двусторонняя модель рынка. Нам нужна база пользователей, и нам нужны разработчики для создания сервисов. Кроме того, мы конкурируем с компаниями, у которых уже миллиард пользователей. Также, множество людей уже вовлечено в проект, еще до создания большой базы пользователей. Теперь для нас важно получить широкое распространение и создать дополнительный соблазн для разработчиков. Многие из них имеют огромное количество идей, а также виденье потенциальных бизнес-моделей. Мы связаны, чрезвычайно связаны с другими заинтересованными сторонами.



PS: Вы сказали, что изготавливаете пользовательскую версию. Для чего?

ДК: Да, мы создаем ее. И хотя мы надеемся, что Viv будет представлена в большом количестве мест, мы также разрабатываем пользовательское приложение, которое будет работать далеко за пределами многих других систем. Цель состоит в том, чтобы обеспечить выгоды потребителя с самого первого дня. После чего, нам нужно будет просто продолжать концентрировать усилия на создании долгосрочных стимулов для разработчиков. Это нужно для того, чтобы вовлечь до 100 миллионов пользователей, которые уже выстроятся в очередь.



PS: Как выглядит жизнь, которые протекает в Viv-центрическом мире?

ДК: Значительно упрощается взаимодействие со всем на свете. На прошлой неделе я разговаривал с парнем, которому за 60. Он спросил меня чем я сейчас занимаюсь. Я попытался объяснить ему суть проекта, но он перебил меня и сказал: «Ох, все эти технические штуковины, я просто ничего не понимаю в этом». На что я ответил: «Вся идея заключается в том, что Вам больше и не нужно ничего понимать. Все, что Вам нужно — это только поговорить с ней.»

Язык для нас — это врожденный, природный способ взаимодействия. Чем больше вещей Вы обсуждаете, в тех ситуациях которые и правда имеют смысл, тем проще эти вещи становятся для взаимодействия и для работы с ними. Т.е. то что мы сейчас обсуждаем — представляет собой мир, где Вы сможете говорить с чем-либо, с любым девайсом благодаря Вашему цифровому помощнику, который сделает все что угодно.



PS: Что мог бы я сказать в таком идеальном мире?

ДК: Ну, в общем, все что имеет смысл. Все что сегодня предполагает комплексное взаимодействие. Вы будете разговаривать со своей машиной, многие люди уже делают это. В США за рулем мы тратим в пустую миллиарды часов в год. Представьте только, что сидя в своей машине Вы занимаетесь рождественским шопингом, давая своему персональному ассистенту указания на счет разнообразных подарков. Вообразите, как сможете заказывать еду так, чтобы она прибыла к Вам домой как раз к Вашему приезду. Вы также будете разговаривать со своим зеркалом во время подготовки к выходу на работу. Имеются готовые дисплеи, которые должны появиться в ближайшем будущем. Вместе с Viv в Вашем зеркале, Вы могли бы подтягивать заголовки тех тем, которые интересны. Вы можете рассматривать в нем изображения. Ну знаете, как «Эй дружище, повыше вот здесь немного. Увеличь прямо вот там». Я имею ввиду, кто знает что может быть еще? Кроме того, Viv может найти применение и в медицине. Простор здесь абсолютно открыт.



PS: Какие самые безумные предложения по-поводу применения Viv Вам доводилось слышать?

ДК: Один парень сказал мне сегодня, что самую первую вещь, которую он хотел бы сделать — это создать приложение, позволяющее кому угодно писать программы с естественным языком, т.е. без необходимости какого-либо фактического кодинга. Это довольно далеко от реализации.

PS: Может ли Viv когда-нибудь стать настоящим компаньоном?

ДК: Вне всяких сомнений. Я думаю, что наличие интеллектуальных помощников — и, надеюсь, Viv является победителем среди них — будет настолько обычным делом, что наши дети станут спрашивать нас, как мы когда-либо могли обходится без таких. Мой ребенок спрашивает меня, как я ходил в колледж без ноутбука. У Вас будет свой собственный помощник, так сказать, персональная цифровая «правая рука»; и делегировать ей рутинные задачи из Вашей жизни будет столь обычным делом, что Вы даже не сможете представить как можно было обходиться без нее. Это долгосрочная цель. С Viv, мы собираемся закончить то, что мы начали.

Поделиться с друзьями
-->

Комментарии (14)


  1. FDsagizi
    29.06.2016 15:43
    +1

    В социальном плане уже жескач — а будет вообще, мой лучший друг живет в Айфоне))

    А вот, где это реально будет супер — медицина!


  1. nikitastaf1996
    29.06.2016 15:59
    +3

    Я не могу понять почему все полагаются на голос.Не хочу я говорить со своим телефоном.Как я понимаю только с google assistant можно будет переписываться.


    1. tormozedison
      29.06.2016 20:52
      -1

      Вы — не хотите. И я не хочу. А вот пожилые люди бы не отказались от устройства, которое не надо осваивать, как куда нажимать, где что набирать, а достаточно сказать: машина, найди мне в интернете то-то — и слушать ответ. Сегодня они в подобных ситуациях знакомым звонят, отвлекают всячески и обижаются, если те заняты. А поднапрягутся разработчики голосовых интерфейсов — и решат эту проблему.


      1. Rastishka
        29.06.2016 22:58
        +1

        Я вроде не пожилой (33года), но мне реально проще и быстрее попросить сири голосом «поставь таймер на 25 минут», «поставь будильник на 9 утра» и т.п. чем разблокировать, искать иконку, выбирать действие, настраивать время…

        До появления русскоязычной сири рассуждал так же как вы.
        С андроидом не сложилось, вероятно он понимает речь только если говорить в определенном формате.


      1. potan
        30.06.2016 14:42
        +1

        Так почему бы не делать два интерфейса? Речь же все равно сначала преобразуется в текст, желающие могли бы его сразу и вводить.


    1. rroyter
      30.06.2016 00:02

      С Кортаной тоже можно.


    1. Bercut_bird
      30.06.2016 10:20

      Если в моем телефоне голосовой помощник действительно не особо нужен — разве что будильник выставить, то для ПК, в связке с телевизором ставшего центром домашней жизни, это уже очень актуально. Мне постоянно не хватает возможности попросить его включить танчики или выставить на паузу сериал без необходимости тянуться за мышкой с клавиатурой (будь компьютер сильно быстрее, необходимость так включать игры пропала бы, разумеется). Плюс возможность посреди беседы нагуглить информацию или в процессе чтения спросить перевод незнакомого слова.

      Я не раз пробовал играться с существующими программами голосового управления, но их возможности, особенно для русского языка, пока еще совершенно не устраивают.


  1. hp6812er
    29.06.2016 16:26

    помниться Майкрософт уже пытался обучать своего бота «всем миром». Не очень получилось


  1. mike7l
    29.06.2016 17:45
    +1

    Кошмар!

    Представьте себе часы с Viv.

    Viv: Хозяин, вставай. Кофе готов.
    Я: Какие дела на сегодня?
    Viv: Никаких. В 7 вебера будет футбол.
    Я: ок, напомни мне за час. Покажи новости по зеркалу.

    Я: прочитай список покупок. А потом включи аудиокнигу.

    Я: рецепт пельменей!
    Я: напомни завтра перезвонить сереге.

    Круто… и вполне реально.


    1. ustaspolansky
      29.06.2016 21:27
      +3

      Как вариант
      Я: Что нового?
      Viv: Письмо от «Твоей милашки», прочитать?

      Жена: Какого… #$@#


      1. VerTox
        29.06.2016 23:20
        +2

        Согласитесь, дело тут не в голосовом помощнике.


      1. mike7l
        30.06.2016 00:18
        +2

        Тоже вариант :)

        Или так:

        Viv: сообщение от контакта Серега: «ждала тебя весь вечер, когда позвонишь?»

        И жена: Какого… #$@#


  1. Khayrullin
    29.06.2016 22:13
    +2

    Голосовые помощники, это, конечно, хорошо, и я даже нашел бы применение такому продвинутому (сейчас пользуюсь Сири, которая, к сожалению, не очень хороша на русском).

    Но я все жду систему (пусть даже без голоса), которая могла бы отвечать на вопросы по произвольному тексту. Я даже в общих чертах представляю как это должно работать, но к сожалению, эта область не в моей профессиональной компетенции. Если бы она обучалась по заданным мной документам, и могла ответить, пусть даже на правильно сформулированный конкретный вопрос, то она спасла бы мне (и не только) тысячи часов бесценного времени, которое тратится на поиск в плохо структурированных документах.

    Если же «помощник» будет «жить в облаке» и сможет обучаться только по чужим поисковым запросам в интернете, то от него польза будет только детям, ведь область его «знаний» быстро скатится в «что там у хохлов» и «как правильно целоваться». Идет 2016 год, а я до сих пор пребываю в шоке, как же сложно искать в поисковиках что-либо более ли менее профессиональное. Программирование и прочее IT, конечно, исключение.

    Хочу свой маленький корпоративный Гугл. А лучше сразу IBM Watson.


  1. MUTbKA98
    30.06.2016 10:20

    "… В США за рулем мы тратим в пустую миллиарды часов в год. Представьте только, что сидя в своей машине Вы занимаетесь рождественским шопингом, давая своему персональному ассистенту указания..."

    Эта проблема решается совсем с другого конца — автопилотом. А отвлекаться за рулем, даже держа на нем обе руки — не стоит, по крайней мере далеко не все это могут. Огромное кол-во мелких ДТП по всему миру тому живое доказательство.