Московский театр на Таганке анонсировал проект, в котором при помощи искусственного интеллекта воссоздан голос Владимира Высоцкого. По информации ТАСС, воссозданный голос посетители театра могли услышать уже на этой неделе в рамках творческой лаборатории «Метаморфозы Таганки», однако полноценный запуск проекта состоится летом.

«Мы планируем презентовать помещение, куда любой человек смог бы прийти и пообщаться с Высоцким. Мы планируем это сделать к 25 июля, когда будет 40 лет со дня смерти Высоцкого», — рассказала директор театра Ирина Апексимова.

Воссозданием голоса Владимира Высоцкого занимался проект Vera Voice, разработанный компанией режиссера Тимура Бекмамбетова Screenlife Technologies совместно с командой «Робот Вера».

Как ранее сообщало издание РБК, проект создан для того, чтобы воспроизводить голоса знаменитостей. В его основе лежит нейросеть, которая обучается копировать речь, «слушая» записи оригинала. Разработчики планируют использовать Vera Voice для озвучивания аудиокниг, фильмов, игр, а также в других сферах. Чтобы получать голоса знаменитостей на законных основаниях, проект будет заключать с артистами соответствующие договоры. На сегодня у Vera Voice уже есть соглашение на использование голоса Руслана Габидуллина из студии «Кубик в кубе» ИИ будет записывать его голосом аудиопоздравления, рекламу и озвучивать аудиокниги.

Подобные проекты в России уже создавались. Например, в 2013 году компания АБК, учреждённая Сбербанком, представила ролик с воспроизведённым голосом актёра Иннокентия Смоктуновского. Ролик длится около 20 секунд, на нем голос актера произносит: «Прослушав всего около 18 часов записи великого артиста, нейронная сеть теперь способна говорить его голосом». Затем Сбербанк представил технологию на Российском инвестиционном форуме в Сочи. На форуме заместитель председателя правления банка Станислав Кузнецов отметил, что подобные проекты могут использовать злоумышленники. После этого Кузнецов включил на форуме запись, на которой вымышленный губернатор попросил голосом актера Иннокентия Смоктуновского 5 млрд руб. на постройку моста.

Технологию синтезирования человеческой речи в 2016 году представил стартап DeepMind. Его нейросеть под названием WaveNet способна имитировать «любой человеческий голос», утверждается на сайте проекта.

Летом текущего года разработчики компании Facebook Шон Васкес и Майк Льюис также представили алгоритм, который генерирует человеческую речь. Алгоритм под названием MelNet воссоздал голос Билла Гейтса и ещё нескольких знаменитостей, включая Стивена Хокинга, профессора Дафни Коллер, актера Джорджа Такеи и других. Голосом Гейтса машина произносит несколько кажущихся бессмысленными фраз, например, «Свечение усилилось в глазах милой девушки». Фразы составлены из сборника «Гарвардские предложения», к которому инженеры часто обращаются для тестирования систем связи или голосовых программ, указывалось в статье MIT News, посвящённой проекту.

В июне стартап AI Dessa представил аудиоклип, на котором искусственный интеллект «говорит» голосом известного радиоведущего Джо Рогана. В сентябре Amazon сообщил, что вскоре голосовой помощник Alexa сможет разговаривать голосами знаменитостей. Первым, с кем Amazon подписал соответствующий контракт, стал актер Сэмуэль Л. Джексон. Всего же, как пишет РБК, по оценке консалтинговой компании Markets&Markets к 2023 году рынок клонирования голоса достигнет $1,73 млрд.

Комментарии (12)


  1. fougasse
    09.11.2019 21:33

    Не приумаляя достижения в области синтеза речи, задача озвучки произвольного текста на базе парсинга голоса решалась без особых проблем еще лет 15 назад.
    Да, в те тёмные времена приходилось нарезать звуки вручную, выделять сочетания букв, начало/конец фразы, пунктуацию и прочее.
    Но собиралось воедино оно уже тогда без особых проблем при чтении строчек.
    Сейчас, очевидно, это гораздо более автоматизировано, нейросеть сама разобьёт на фонемы, склеит правильно и т.п.
    Да, риалтайм, все дела, в начале 2000х на обычном "пне" такие задачи сложновато шли.


    1. laronov
      10.11.2019 10:29

      Иде, хоть и давняя, но интересная и перспективная
      Но было бы очень интересно, если бы ИИ ещё проанализировал все высказывания человека и мог формулировать позицию человека, пускай и умершего, по различным вопросам…
      А протестировать можно было бы и на живых.


  1. perfect_genius
    09.11.2019 21:52

    Такими темпами нам придётся обучать нейросеть, чтобы получить штампованный «роботообразный» голос, который сейчас вдруг стал архаичным во всём медия, кроме редких фильмов типа «Она» и «Интерстеллар».


  1. Dmitrsha01
    09.11.2019 14:05
    -2

    планируем презентовать помещение, куда любой человек смог бы прийти и пообщаться с Высоцким
    А тема для общения тоже любая?) Если так, то мнение ИИ ВС Высоцкого о психическом здоровье его тёзки по фамилии Путин я бы послушал


    1. avkudrin
      10.11.2019 13:49

      От имитации голоса до имитации мнения огромная пропасть, вам не кажется? :)


  1. Ivnika
    09.11.2019 15:04

    В плане развития технологий вроде все отлично, а вот использование голоса мертвого человека в таком амплуа… как-то передергивает меня, представил — приношу цветы к памятнику, а он — спасибо, в общем не укладывается в голове эта идея
    Да и неуважительно как-то…


    1. fougasse
      09.11.2019 16:16

      А озвучка всяких новых серий "Ну, Погоди!" и других "Постоквашино" — это уважительно к уже умершим?


      1. Ivnika
        09.11.2019 16:18

        Теперь уже и не знаю )))
        Но одно дело когда просто озвучка, а другое когда имитация живого — предполагается ведь что отвечать будет


        1. dartraiden
          09.11.2019 18:54

          Меня, например, покоробил не факт имитации, а то, что голосом Высоцкого эти люди синтезировали похвалы самим себе.


  1. stalinets
    09.11.2019 19:49

    Думаю, нужно дать людям этот инструментарий, чтобы люди могли творить. Примерно так, как сейчас японцы делают новые песни при помощи вокалоидов.
    Только тут сам мог бы сделать вокалоида, скормив ему побольше фраз того или иного человека для обучения нейросети.
    Понятно, что если голос человека в подборке фраз в основном говорит, а не поёт — нейросеть будет хорошо им говорить, а не петь, и наоборот.


  1. nikolainefedov
    10.11.2019 09:04

    Новость, прямо скажем, не очень. Не стоило бы трогать голос умершего, а тем более экспериментировать. Это действительно неуважение к великому человеку, даже оскорбление, мне кажется


  1. annasmirn
    10.11.2019 12:10
    +1

    Чистой воды бред и неуважение. Не понимаю, как вообще такое можно допустить? Думаю, ходить на такое уважающие себя и Высоцкого люди не будут