В сентябре мы рассказывали Хабру о том, как наша команда помогает преодолевать языковой барьер с помощью перевода видео. Эта функция позволяет автоматически переводить видео так, чтобы зритель сразу слышал русскую речь. Пользователи встретили новую возможность тепло: ролики с переводом смотрят больше 200 тысяч раз в день.

С тех пор мы развиваем перевод видео. Не писали здесь про каждое изменение, потому что скромные по отдельности они не тянут на рассказ. Но сегодня воспользуюсь поводом и расскажу не только про свежую версию, в которую добавили перевод субтитров, но и про предыдущие обновления.



Осень: запуск перевода видео


Несколько слов о том, как вообще работает перевод видео. Если вы читали и запомнили наш предыдущий пост, то можно смело переходить к следующему разделу. Для всех остальных коротко напомним главное.

Для человека всё выглядит просто. Кликаешь по кнопке — слышишь перевод. Под капотом оно, конечно же, сильно сложнее. Перевод создаётся в несколько этапов, причём на каждом этапе за работу берётся своя нейросеть. Сначала Яндекс распознаёт речь в текст с указанием таймингов и спикеров (за это отвечает голосовая биометрия). Переводить такой текст сразу нельзя: он может быть нарезан не по границам предложений и абзацев. Только после предобработки в дело вступает наша технология машинного перевода. Ну а затем готовый перевод синтезируется в речь, причём с использованием разных голосов.

Схематично это выглядит так:



Каждый этап — достаточно прожорливый с точки зрения вычислительных ресурсов. К счастью, у нас есть суперкомпьютеры (и пост про них на Хабре), поэтому перевод свежих роликов занимает не часы, а минуты или того меньше.

Зима: новые языки и качество


Первые результаты — это хорошо, но нужно двигаться дальше. Когда вы запускаете что-то новое, у вас бесконечное множество возможных путей развития. И выбрать дальнейший путь — уже непростая задачка. Кто-то просит новые языки, для других важно качество перевода текущих. Мы не стали выбирать: всю осень и зиму двигались в обоих направлениях.

Добавили поддержку немецкого, французского и испанского языков. Теперь ролики и на этих языках можно смотреть в закадровом переводе на русский. При этом мы не гонимся за количеством: при выборе новых языков для поддержки ориентировались не только на запросы пользователей, но и на итоговое качество результата.



Кроме того, продолжаем совершенствовать технологию. Наиболее значимые изменения:

  • Качество выросло: теперь наш переводчик допускает меньше ошибок, лучше удерживает контекст на протяжении ролика.
  • Синхронизация голоса стала точнее: перевод лучше подстраивается под длительность оригинальной озвучки, поэтому его проще воспринимать.
  • Скорость создания перевода увеличилась: при первом запуске перевод создаётся пока ещё не мгновенно, но уже быстрее.


Весна: субтитры и регулировка громкости


Другим популярным запросом со стороны пользователей оставались субтитры. Оно и понятно: не всегда получается смотреть видео со звуком, текстовые субтитры спасают в таких случаях. Технологически мы изначально переводим именно текст, а значит, оставалось научиться выводить перевод в субтитрах вместо звука. Но мы решили не идти простым путём и замахнулись на большее.

Наша цель — помочь людям преодолеть языковой барьер и узнать что-то новое. Перевод текста, картинок, видео в нашем Браузере — это лишь инструменты. Но лучший инструмент — это знание языка. Поэтому всё время существования как Яндекс Браузера, так и Яндекс Переводчика мы стараемся не просто переводить, но и помогать учить язык. Например, в Браузере можно переводить не только веб-страницы целиком, но и отдельные слова и фразы. По этой же причине в Переводчике вы видите не только перевод, но и примеры контекстного употребления тех или иных слов. В общем, мы решили сделать перевод субтитров полезным и для тех, кто уже знает язык, но хотел бы пополнить свой словарный запас и потренироваться в восприятии речи на слух.

Теперь, если вы включите субтитры на оригинальном языке, то сможете кликнуть на любое слово и увидеть его перевод.



Более того, мы дали возможность включить подсветку слов, которая синхронизируется с речью спикера в ролике. Эта опция поможет не терять смысл сказанного, что особенно важно для тех, кто изучает язык и пока ещё не владеет им достаточно уверенно.

Для тех, кому нужен только перевод, можно сразу выбрать сгенерированные нами субтитры на русском языке. Все настройки прячутся за кнопкой с тремя точками.



(Кстати, на скриншоте выше вы можете заметить возможность регулировать громкость оригинальной дорожки. По умолчанию мы и так приглушаем громкость оригинала, если включить голосовой перевод, но ряд пользователей просили нас о более персональной настройке.)

Сейчас опция доступна в Яндекс Браузере для Windows и macOS (версии для Linux, Android и iOS уже в работе). Поддерживается перевод субтитров на четырёх языках — английском, французском, немецком и испанском. Опция доступна для роликов на YouTube. В будущем поддержим и другие популярные сайты.

На этом наша работа, конечно же, не останавливается. Продолжим смотреть как в сторону качества перевода, так и в сторону новых возможностей (к примеру, работаем над переводом прямых эфиров, но это пока секрет). Присылайте идеи!

Комментарии (23)


  1. 13werwolf13
    30.03.2022 11:06
    +2

    версии для Linux, Android и iOS уже в работе

    учитывая как долго ябрузер для linux был в стадии беты (стейбл появился вот только пару дней назад) я бы не надеялся дождаться когда можно будет пощупать..


    1. BarakAdama Автор
      30.03.2022 11:30

      После перехода в стейбл дело должно двигаться быстрее.


  1. amarao
    30.03.2022 11:09
    +6

    у нас есть суперкомпьютеры

    Правильно говорить, "у нас всё ещё есть компьютеры". У вас сервера на юрлицо в РФ оформлены же?


  1. Caesare
    30.03.2022 12:42
    +3

    А когда Ютуб заблокируют что вы переводить будете?


    1. SiteCenter
      31.03.2022 16:35
      +2

      Очевидно - будут переводить видео. Не одним YouTube едины, на том же Яндекс.Видео останутся материалы, требующие перевода.


  1. Urvdmih
    30.03.2022 14:21
    -2

    Я правильно понимаю, что опции перевода "только с субтитрами, но без озвучки" нет?


    1. BarakAdama Автор
      30.03.2022 14:45

      Есть :)
      Можно оставить оригинальную озвучку (для этого достаточно не нажимать кнопку «Перевести видео»), но включить в менюшке созданные нами русские субтитры.


  1. Akr0n
    30.03.2022 15:23

    Наверняка же уже есть бот в Telegram, которому можно кинуть ссылку на зарубежный ролик, а в ответ получить переведенное Я.Браузером видео?


  1. Rebeiro
    30.03.2022 15:33
    -3

    кому это нужно непонятно, если только малому проценту


    1. BarakAdama Автор
      30.03.2022 16:33
      +2

      Думаю, вы правы в том, что субтитры будут менее востребованы, чем перевод с озвучкой. В целом же спрос на помощь с переводом любого контента (текст, картинки, видео) достаточно высокий. Тянуться к новым знаниям — вполне естественная потребность.


  1. Krotolesya
    30.03.2022 15:38

    Да, выглядит замечательно, но в примерах очень хорошо произносятся слова, хотя, даже в таком случае от фраз "... положу своё яйцо в центр ..." тяжело будет избавится (как в вашем примере), но вот для английского языка, когда носители "проглатывают" буквы (фразы навроде "catch 'em all"), как пример, здесь транскриптор от Google написал "not it says no swimming madame all" (0:57) переводчик от Яндекса способен такое правильно обработать?


    1. TimurRyabinin
      30.03.2022 18:04

      Здравствуйте! Спасибо вам за обратную связь, я показал пример перевода команде. Будем работать над нашими алгоритмами перевода :)


  1. densan
    30.03.2022 15:38

    Когда в Яндекс браузер для организаций сделают управление браузером, плагинами браузера через GPO?


    1. BarakAdama Автор
      30.03.2022 16:43

      Насколько я помню, групповые политики поддерживаются: https://yandex.ru/support/browser-corporate/policy/list.html. Но, возможно, там нет того, что нужно именно вам. Можете уточнить?


      1. densan
        31.03.2022 07:46

        В Chrome более 800 параметров которыми можно управлять через GPO + несколько десятков параметров которыми можно управлять процессом обновления хрома https://chromeenterprise.google/policies/. В Яндекс браузере всего несколько десятков параметров https://yandex.ru/support/browser-corporate/policy/list.html


  1. soul32bit
    30.03.2022 19:00
    +2

    Сильно не хватает опции «принудительный превод». Например есть ролик, где ведущий на русском представляет повара, который затем уже говорит на английском — кнопка перевода не появляется. Вообще интересно, по какому алгоритму происходит определение того, что язык не русский?


    1. BarakAdama Автор
      31.03.2022 08:23

      Да, сталкивались с таким. Если дорожка в начале содержит русский язык, то она может засчитаться русскоязычной и проскочить мимо перевода. Есть идея это поправить.


  1. silinio
    30.03.2022 19:21

    Добавьте в .deb установщик добавление apt sources — чтобы обновлять через «apt update && apt upgrade».
    Сейчас скачал и установил стэйбл с сайта — теперь в меню два ярлыка, на стэйбл и на бету.


    1. silinio
      02.04.2022 01:10
      +1

      отвечу сам себе — apt sources всё есть, но на debian'е автоматом не обновилось (на астре норм)
      вообщем встречу подобные глюки — напишу в поддержку.


  1. Jalart
    30.03.2022 22:13
    +2

    А как дела с русской речи на русский текст для глухих? Лекции, например, некоторые послушать/прочитать субтитры.


    1. BarakAdama Автор
      31.03.2022 11:46

      Пока так не получится. Но есть идея, как с этим помочь.


  1. BogPupsov
    31.03.2022 05:09

    Привет! Сделайте пожалуйста обратный перевод с русского на английский)


  1. kaindv
    01.04.2022 04:46

    Ну это же просто шикарно!