По сведениям, которые интернет-издательство Bloomberg получило из нераскрытого внутреннего источника, компания Amazon тестирует новую разработку – носимый гаджет, оснащенный технологиями для распознавания эмоционального состояния человека.
Устройство будет крепиться на запястье пользователя и при помощи встроенных микрофонов записывать его голос. Далее данные будут передаваться установленному на его смартфон приложению, которое при помощи алгоритмов искусственного интеллекта проведет нужную работу по интерпретации звучания и выдаст ответ с соответствующими рекомендациями. Анонимный представитель компании определил проект как направленный в первую очередь на заботу о физическом и психологическом здоровье человека.
По слухам, в проекте с кодовым названием Dylan активно задействована команда Lab126, которая работала над аппаратными решениями для смарт-динамика Amazon Echo, а также специалисты, разработавшие программное обеспечение для голосового ассистента Alexa. На данном этапе идет бета-тестирование прототипа, хотя неизвестно, какие именно компоненты разработки уже готовы к эксплуатации: гаджет с датчиками, программная часть разработки или все в совокупности.
Несмотря на то, что компания воздержалась от каких-либо официальных заявлений, ограничившись замечанием о том, что «не комментирует слухи и предположения», в свете ее предшествующей деятельности представленная Bloomberg информация выглядит вполне правдоподобно. Так, в 2017 году Amazon зарегистрировала патент на систему, которая анализирует паттерны в звучании голоса, чтобы определить, как чувствует себя пользователь в данный момент. Список эмоций, который она сможет различать, включает радость, злость, скорбь, печаль, страх, отвращение, скуку и напряжение.
Иллюстрация из патента
В качестве иллюстрации действия системы в патенте приводится ситуация, когда больная женщина, кашляя, говорит голосовому ассистенту, что голодна. По искаженному голосу ассистент определяет ее состояние как отклонение от нормы, выявляет причину и, помимо рецепта подходящего блюда, предлагает ей оформить заказ на доставку лекарства. Определение настроения по интонациям, безусловно, потребует более тонкого анализа, однако пример отражает общую идею, состояющую в обработке невербальных звуковых сигналов нейросетями для удовлетворения невысказанных потребностей пользователя.
Другой недавний патент Amazon описывает алгоритмы распознавания аудиоданных, которые позволяют выделять голос носителя из окружающих шумов. Редакция Bloomberg утверждает, что применение этой технологии в проекте Dylan документально подтверждено.
Информация о новом проекте вызвала смешанный отклик в интернет-сообществе. По мнению многих, вторжение в эмоциональную сферу пересекает ту грань, за которой должно начинаться личное пространство каждого человека. Кроме того, хотя источник и делает акцент на заботе о благополучии людей, есть вероятность, что Amazon будет использовать технологию и для привлечения дополнительной прибыли. Даже в тексте первого патента упоминается о том, что одним из основных способов применения обработанных данных является персонализация коммерческих предложений. Идея монетизации переживаний пользователя кажется большинству крайне циничной.
Интерпретация эмоций – одна из сложнейших задач, которые ставятся перед искусственным интеллектом. Даже если слухи полностью верны, возможно, разработка еще долгие годы не будет выходить за пределы лабораторий Amazon или пополнит число замороженных проектов.
Комментарии (6)
opaopa
24.05.2019 20:39+1Устройство будет крепиться на запястье пользователя и при помощи встроенных микрофонов записывать его голос. Далее данные будут передаваться установленному на его смартфон приложению
На смартфоне микрофоны некошерные чтоли и неспрособны записать голос?
ИМХО не чай в том чайнике…
bugdesigner
25.05.2019 02:14Интересно было бы проверить это устройство на людях, обученных обманывать детекторы лжи — на шпионах, например, или игроках в покер.
dominigato
Пол Экман давно уже занимается определением эмоций, в основном по лицу и языку тела, конечно. И я уже лет 7 назад видел программу, определяющую эмоции (и вероятную ложь) по голосу по его методам. Без всякого AI, между прочим.
Список эмоций «от Амазона» тоже вызывает слегка вопросы, это скорее состояния все-таки. Базовых эмоций — семь: страх, гнев, печаль, удивление, радость, отвращение, презрение. Скука это скорее отсутствие эмоции, напряжение — просто состояние.
Так что единственное новшество тут будет монетизация определяемых состояний скорее всего, можно расслабиться.
Если ты в гневе — Алекса порекомендует тебе ближайший магазин оружия, например, где есть дискаунты на пистолеты. Если печаль — закупит и пришлет антидепрессанты, а в Сиэттле так и что-то поинтереснее даже.
dolovar
dominigato
Я же написал — по модели Пола Экмана.
dolovar
Система от Амазона: страх, злость, скорбь, печаль, радость, отвращение, --, скука, напряжение.
Ваш список Экмана: страх, гнев, -, печаль, радость, отвращение, --, презрение, удивление.
Списки схожи, и причина расхождений — неопределенность термина «эмоция». Под термин сложено несколько разных смыслов:
Список считываемого не обязан совпадать со списком ощущаемого. И уж тем более, не может ограничиваться одним из списков базовых переживаний.
Я удивлен, что списки «Амазон — Экман» совпадают больше чем наполовину. Вероятно, авторы распознающей системы тоже взяли за основу один из множества существующих списков базовых переживаний, подгоняя решение под него, а не отталкивались от задачи.
Есть мнение, что «скука» — разновидность «раздражения», это не отсутствие эмоции, это подталкивающее к действию ощущение. Есть мнение, что «напряжение» — свойство «тревоги», которую тоже можно отнести к эмоциям, поскольку она обладает побуждающим действием.
Кстати, упомянутом патенте речь идет об «emotional states» и не только. Особенно мне понравилась гипотетическая возможность определения сарказма и иронии. Данная статья содержит заметное упрощение.