Иногда нам поручают подготовить какой-нибудь текст из видеоматериала, и когда мы начинаем задавать клиентам уточняющие вопросы, некоторые искренне удивляются: «Хосподи, ну это же субтитры/текст/статья, что там сложного?».

Я решил рассказать как про основной порядок действий, так и про сложности разных видов такой текстовой работы.

I. Подготовка субтитров из видео

Начнем с субтитров — это самая простая задача, потому что известна цель использования конечного текста.

Пример подготовленных и переведенных субтитров (из нашего портфолио). 
Пример подготовленных и переведенных субтитров (из нашего портфолио). 

Как делать?

  1. Автоматически генерируем субтитры (например, YouTube).

  2. Копируем субтитры с таймкодами в программу редактирования субтитров (например, Subtitle Edit).

  3. Обрабатываем субтитры: 
    а) . разбиваем на предложения,
    б) . редактируем текст)
    .

  4. Добавляем субтитры к видео (например, через Youtube, если есть доступ к редактированию видео, или через Wondershare Uniconverter).

Какие возникали сложности?

1. На этапе генерации субтитров

  • Субтитры генерируются не всегда. Например, если при загрузке файла на Youtube указан язык для субтитров, не соответствующий языку видео. Повторная загрузка проблему не решает.

Для решения этой проблемы можно воспользоваться условно-бесплатными сервисами генерации субтитров, например, VEEDEasySub и т. д. Если проблему решить не удается, остается самый трудоемкий вариант — набирать субтитры на слух.

  • Видео может размещаться на сервисе, который не позволяет скачать файл субтитров или сам видеофайл (например, vimeo).

Для решения этой проблемы можно воспользоваться записью экрана или набрать субтитры на слух.

2. На этапе обработки субтитров

  • Докладчик может говорить невнятно, неразборчиво или со странным акцентом.

Я как-то раз имел удовольствие разбирать полуторачасовое интервью индийского разработчика (для Хабра, кстати), который говорил очень тихо, со своеобразным английским акцентом и часто не договаривал/зажевывал предложения. В конечном итоге я выловил его в Твиттере, показал ему транскрипт записи, выяснилось, что в нескольких предложениях он сам не понял, о чем он хотел сказать. В итоге мы их убрали.

  • Строка на экране может получиться слишком короткой (т. е. текст меняется слишком быстро). Соответственно, зритель не может спокойно читать, мелькание текста его раздражает. Отмечу, что тут важно не столько количество символов, сколько то, как продолжительность показа текста на экране (т. е. докладчик может просто медленно говорить).

  • Строка на экране может получиться слишком длинной. Соответственно, зритель может зависнуть, у него может возникнуть желание перечитывать написанное.

Как разбить на предложения?

  • Специалисту постоянно приходится искать баланс между слишком короткими и слишком длинными строками, учитывая скорость речи докладчика, смысл и удобство зрителя. Разбивать строки, исходя только из времени, не рекомендуется.

  • В одной строке желательно оставлять одну значимую мысль, чтобы у зрителя при смене кадра не возникало желания поставить видео на паузу и перечитать.

  • В одной строке должна быть завершенное предложение или его смысловая часть.

Как редактировать текст?

  • Следить за логической завершенностью предложений. Транскрибатору каждый раз приходится принимать решение о том, является ли что-то сказанное оговоркой, ошибкой или все же незаконченным примером, которым может что-то объяснить зрителям;

  • Учитывать уровень владения докладчиком языком и уровень подготовленности речи (= не стоит буквально воспроизводить все используемые речевые обороты).

3. На этапе добавления субтитров

  • Если субтитры придется набирать на слух, например, в кабинете Youtube, то добавляться к видео они будут автоматически, не отходя от кассы.

  • Если будете готовить файл с субтитрами, то добавить его к видео можно с помощью сервисов, типа Wondershare.

  • Важно: при «прикручивании» субтитров к видео может возникнуть проблема рассинхронизации текста с видео, то есть когда текст появляется сильно раньше или позже речи докладчика. Такая проблема часто возникает, если субтитры в итоге пришлось набирать вручную. При автоматической генерации субтитров с тайм-кодами эта проблема возникает реже.

II. Подготовка «простого текста» из видео

Иногда клиенты обращаются с просьбой сделать «просто текст» из какого-нибудь видео.

Так вот там не все так просто. Основная сложность заключается в завышенных ожиданиях заказчика. Заказчик, как правило, предполагает, что можно просто убрать таймкоды из субтитров и подчистить ошибки. Однако на выходе мы получим, как правило, текст с логическими нестыковками, неряшливой грамматикой и хаотичными аргументами — всё это делает текст нечитабельным. И если для субтитров с таймкодами «рваное» повествование вполне допустимо, там всё же разговорная речь, то в «просто тексте», увы, нет.

Как бы то ни было, порядок выполнения тут предсказуемый — автоматически сгенерированные субтитры качаем без таймкодов, далее редактируем текст:

  • убираем оговорки, повторы и т. д.;

  • сглаживаем неудачные грамматические обороты и в крайнем случае выбираем более подходящие слова;

  • разбиваем на абзацы для удобства (докладчик не обязательно будет делать паузы там, где они напрашиваются).

Недостатки такой обработки для заказчика в том, что текст подвергается минимальной редактуре. Как следствие, осмысленность, логичность и аргументированность текста определяются только подготовкой докладчика к выступлению и тем, насколько поставлена его речь. В отличие от субтитров, которые максимально синхронизированы с видеорядом и эта синхронизация позволяет компенсировать недостатки логики, грамматики и т. д. иллюзией общения, — простой текст недостатки видео компенсировать не позволяет.

На скриншоте видна разница между субтитровой и текстовой версией доклада. 
На скриншоте видна разница между субтитровой и текстовой версией доклада. 

III. Подготовка статьи из видео

И, наконец, мы дошли до подготовки самого творческого варианта — статьи. Сложность этой задачи в том, что тут еще сложнее понять реальные ожидания заказчика относительно глубины переработки текста и требований к конечному результату. В отличие от «простого текста», статья предполагает более серьезную и значительную обработку текста, включая удаление не только повторов или огрехов, но и незначимой информации, чтобы статью можно было читать без опоры на видео.

Как правило, чтобы понять, какая информация некритична (= можно выкинуть), нужно четко проговорить с клиентом целевую аудиторию, — но это все равно ничего не гарантирует, у нас были случаи, когда заказчик был не согласен с нашим решением по поводу критичности и удаления информации, приходилось «вертать все взад» и переделывать.

Стоит также учесть, что клиент не будет все время на связи, чтобы отвечать на ваши вопросы, а значит, вам все равно придется принимать решения самостоятельно с учетом большого количества факторов, о которых я поведаю ниже.

Что может пойти не так

А. Язык

  • Невнятная речь, нечеткое произношение.

  • Интонация, которая часто не дает понять, где именно кончается предложение, или выделить значимую информацию.

  • Грамматика. Неносители языка могут строить предложения по правилам родного языка, что может затруднять понимание, например, менять местами тему и рему.

  • Неверно расставленные паузы. Докладчик может делать паузы при переключении слайдов или в местах, где пауза логична по правилам родного языка, однако в тексте такие паузы могут сильно повлиять на смысл или изменить его.

По мнению транскрибатора, пауза докладчика в этом месте означала, что “like this” относится к ожиданию показа слайда. Однако удаление этих слов привело к ошибке. При обсуждении с заказчиком выяснилось, что докладчик ничего не ждал, он просто хотел показать, что изменился формат отображения событий.
По мнению транскрибатора, пауза докладчика в этом месте означала, что “like this” относится к ожиданию показа слайда. Однако удаление этих слов привело к ошибке. При обсуждении с заказчиком выяснилось, что докладчик ничего не ждал, он просто хотел показать, что изменился формат отображения событий.

Б. План

  • План статьи может представлять проблему, если такого плана не было у заказчика. Соответственно, может быть сложно разбить статью на разделы, сделать многоуровневый список и т. д.

  • Докладчик не обязательно развивает мысли в том объеме, в котором необходимо даже для оформления абзаца. Такое возможно, если речь идет о каких-то понятных профессионалам в соответствующей области вещах, которые докладчик не считает нужным объяснять. В таком случае транскрибатору часто приходится начитывать материал по теме доклада, чтобы добавить недостающую информацию, которая позволит сделать мысль законченной, а текст читабельным.

  • Отдельного внимания заслуживают разделы, выделяемые докладчиком, например, список возможных проблем или ошибок ПО с описанием. Такие разделы для удобства можно оформить списком, однако докладчик не обязательно заботится о каком-то выделении, например, заголовков таких разделов. Соответственно, при написании статьи необходимо найти значимую информацию, которую можно выделить для удобства читателя.

В. Корректура

Корректура текста статьи — достаточно сложная и неблагодарная задача, в первую очередь, потому что заказчик, как правило, только по результатам такой корректуры может определиться, стоило ли текст корректировать.

При корректуре всегда возникают вопросы, ответ на которые остается достаточно субъективным.

  • Стоит ли заменять слова, используемые докладчиком, если в текст «просятся» другие?

  • Являются ли использованные слова оговоркой или результатом соответствующего словарного запаса или выбраны «для колорита»?

  • Стоит ли убирать разговорные обороты или они использованы, чтобы оживить доклад?

  • Стоит ли менять жаргонизмы на общепринятые термины?

  • Стоит ли убирать повторы или они использованы для усиления?

К сожалению, до начала работы у клиента зачастую ответов на такие вопросы нет.

На скриншотах ниже показываю разницу между 4 разными текстовыми форматами, полученными из одного и того же видео:

Изначальные и обработанные субтитры
Изначальные и обработанные субтитры
Оригинальный текст и текст для статьи
Оригинальный текст и текст для статьи

Спасибо за внимание, надеюсь, было полезно.

Комментарии (2)


  1. OlegIva
    21.04.2023 10:05
    +1

    Если проблему решить не удается, остается самый трудоемкий вариант — набирать субтитры на слух.

    Ещё Whisper.cpp выручить может. Как раз им снимаем текст с записей конференции сейчас, результат довольно неплохой. Хотя доводка напильником таки требуется.


  1. inkelyad
    21.04.2023 10:05
    +2

     набирать субтитры на слух

    А работает ли способ, когда какой-то человек с хорошо поставленной дикцией и привыкший к тому, как его комп понимает, повторяет все что слышит в программу распознавания?