С тех пор мы развиваем перевод видео. Не писали здесь про каждое изменение, потому что
Осень: запуск перевода видео
Несколько слов о том, как вообще работает перевод видео. Если вы читали и запомнили наш предыдущий пост, то можно смело переходить к следующему разделу. Для всех остальных коротко напомним главное.
Для человека всё выглядит просто. Кликаешь по кнопке — слышишь перевод. Под капотом оно, конечно же, сильно сложнее. Перевод создаётся в несколько этапов, причём на каждом этапе за работу берётся своя нейросеть. Сначала Яндекс распознаёт речь в текст с указанием таймингов и спикеров (за это отвечает голосовая биометрия). Переводить такой текст сразу нельзя: он может быть нарезан не по границам предложений и абзацев. Только после предобработки в дело вступает наша технология машинного перевода. Ну а затем готовый перевод синтезируется в речь, причём с использованием разных голосов.
Схематично это выглядит так:
Каждый этап — достаточно прожорливый с точки зрения вычислительных ресурсов. К счастью, у нас есть суперкомпьютеры (и пост про них на Хабре), поэтому перевод свежих роликов занимает не часы, а минуты или того меньше.
Зима: новые языки и качество
Первые результаты — это хорошо, но нужно двигаться дальше. Когда вы запускаете что-то новое, у вас бесконечное множество возможных путей развития. И выбрать дальнейший путь — уже непростая задачка. Кто-то просит новые языки, для других важно качество перевода текущих. Мы не стали выбирать: всю осень и зиму двигались в обоих направлениях.
Добавили поддержку немецкого, французского и испанского языков. Теперь ролики и на этих языках можно смотреть в закадровом переводе на русский. При этом мы не гонимся за количеством: при выборе новых языков для поддержки ориентировались не только на запросы пользователей, но и на итоговое качество результата.
Кроме того, продолжаем совершенствовать технологию. Наиболее значимые изменения:
- Качество выросло: теперь наш переводчик допускает меньше ошибок, лучше удерживает контекст на протяжении ролика.
- Синхронизация голоса стала точнее: перевод лучше подстраивается под длительность оригинальной озвучки, поэтому его проще воспринимать.
- Скорость создания перевода увеличилась: при первом запуске перевод создаётся пока ещё не мгновенно, но уже быстрее.
Весна: субтитры и регулировка громкости
Другим популярным запросом со стороны пользователей оставались субтитры. Оно и понятно: не всегда получается смотреть видео со звуком, текстовые субтитры спасают в таких случаях. Технологически мы изначально переводим именно текст, а значит, оставалось научиться выводить перевод в субтитрах вместо звука. Но мы решили не идти простым путём и замахнулись на большее.
Наша цель — помочь людям преодолеть языковой барьер и узнать что-то новое. Перевод текста, картинок, видео в нашем Браузере — это лишь инструменты. Но лучший инструмент — это знание языка. Поэтому всё время существования как Яндекс Браузера, так и Яндекс Переводчика мы стараемся не просто переводить, но и помогать учить язык. Например, в Браузере можно переводить не только веб-страницы целиком, но и отдельные слова и фразы. По этой же причине в Переводчике вы видите не только перевод, но и примеры контекстного употребления тех или иных слов. В общем, мы решили сделать перевод субтитров полезным и для тех, кто уже знает язык, но хотел бы пополнить свой словарный запас и потренироваться в восприятии речи на слух.
Теперь, если вы включите субтитры на оригинальном языке, то сможете кликнуть на любое слово и увидеть его перевод.
Более того, мы дали возможность включить подсветку слов, которая синхронизируется с речью спикера в ролике. Эта опция поможет не терять смысл сказанного, что особенно важно для тех, кто изучает язык и пока ещё не владеет им достаточно уверенно.
Для тех, кому нужен только перевод, можно сразу выбрать сгенерированные нами субтитры на русском языке. Все настройки прячутся за кнопкой с тремя точками.
(Кстати, на скриншоте выше вы можете заметить возможность регулировать громкость оригинальной дорожки. По умолчанию мы и так приглушаем громкость оригинала, если включить голосовой перевод, но ряд пользователей просили нас о более персональной настройке.)
Сейчас опция доступна в Яндекс Браузере для Windows и macOS (версии для Linux, Android и iOS уже в работе). Поддерживается перевод субтитров на четырёх языках — английском, французском, немецком и испанском. Опция доступна для роликов на YouTube. В будущем поддержим и другие популярные сайты.
На этом наша работа, конечно же, не останавливается. Продолжим смотреть как в сторону качества перевода, так и в сторону новых возможностей (к примеру, работаем над переводом прямых эфиров, но это пока секрет). Присылайте идеи!
Комментарии (23)
amarao
30.03.2022 11:09+6у нас есть суперкомпьютеры
Правильно говорить, "у нас всё ещё есть компьютеры". У вас сервера на юрлицо в РФ оформлены же?
Caesare
30.03.2022 12:42+3А когда Ютуб заблокируют что вы переводить будете?
SiteCenter
31.03.2022 16:35+2Очевидно - будут переводить видео. Не одним YouTube едины, на том же Яндекс.Видео останутся материалы, требующие перевода.
Urvdmih
30.03.2022 14:21-2Я правильно понимаю, что опции перевода "только с субтитрами, но без озвучки" нет?
BarakAdama Автор
30.03.2022 14:45Есть :)
Можно оставить оригинальную озвучку (для этого достаточно не нажимать кнопку «Перевести видео»), но включить в менюшке созданные нами русские субтитры.
Akr0n
30.03.2022 15:23Наверняка же уже есть бот в Telegram, которому можно кинуть ссылку на зарубежный ролик, а в ответ получить переведенное Я.Браузером видео?
Rebeiro
30.03.2022 15:33-3кому это нужно непонятно, если только малому проценту
BarakAdama Автор
30.03.2022 16:33+2Думаю, вы правы в том, что субтитры будут менее востребованы, чем перевод с озвучкой. В целом же спрос на помощь с переводом любого контента (текст, картинки, видео) достаточно высокий. Тянуться к новым знаниям — вполне естественная потребность.
Krotolesya
30.03.2022 15:38Да, выглядит замечательно, но в примерах очень хорошо произносятся слова, хотя, даже в таком случае от фраз "... положу своё яйцо в центр ..." тяжело будет избавится (как в вашем примере), но вот для английского языка, когда носители "проглатывают" буквы (фразы навроде "catch 'em all"), как пример, здесь транскриптор от Google написал "not it says no swimming madame all" (0:57) переводчик от Яндекса способен такое правильно обработать?
TimurRyabinin
30.03.2022 18:04Здравствуйте! Спасибо вам за обратную связь, я показал пример перевода команде. Будем работать над нашими алгоритмами перевода :)
densan
30.03.2022 15:38Когда в Яндекс браузер для организаций сделают управление браузером, плагинами браузера через GPO?
BarakAdama Автор
30.03.2022 16:43Насколько я помню, групповые политики поддерживаются: https://yandex.ru/support/browser-corporate/policy/list.html. Но, возможно, там нет того, что нужно именно вам. Можете уточнить?
densan
31.03.2022 07:46В Chrome более 800 параметров которыми можно управлять через GPO + несколько десятков параметров которыми можно управлять процессом обновления хрома https://chromeenterprise.google/policies/. В Яндекс браузере всего несколько десятков параметров https://yandex.ru/support/browser-corporate/policy/list.html
soul32bit
30.03.2022 19:00+2Сильно не хватает опции «принудительный превод». Например есть ролик, где ведущий на русском представляет повара, который затем уже говорит на английском — кнопка перевода не появляется. Вообще интересно, по какому алгоритму происходит определение того, что язык не русский?
BarakAdama Автор
31.03.2022 08:23Да, сталкивались с таким. Если дорожка в начале содержит русский язык, то она может засчитаться русскоязычной и проскочить мимо перевода. Есть идея это поправить.
silinio
30.03.2022 19:21Добавьте в .deb установщик добавление apt sources — чтобы обновлять через «apt update && apt upgrade».
Сейчас скачал и установил стэйбл с сайта — теперь в меню два ярлыка, на стэйбл и на бету.silinio
02.04.2022 01:10+1отвечу сам себе — apt sources всё есть, но на debian'е автоматом не обновилось (на астре норм)
вообщем встречу подобные глюки — напишу в поддержку.
Jalart
30.03.2022 22:13+2А как дела с русской речи на русский текст для глухих? Лекции, например, некоторые послушать/прочитать субтитры.
13werwolf13
учитывая как долго ябрузер для linux был в стадии беты (стейбл появился вот только пару дней назад) я бы не надеялся дождаться когда можно будет пощупать..
BarakAdama Автор
После перехода в стейбл дело должно двигаться быстрее.