Как такое могло получиться? (По состоянию на 1/12/2020, субтитры на YouTube так и не исправлены.)
Stenotype
Американские стенографисты уже больше сотни лет как используют специальные устройства с минимальной 22-клавишной клавиатурой — по две клавиши под каждый палец, чтобы минимизировать движения кистей:
Сто лет назад стенотайп был вариантом печатной машинки, и каждая клавиша оставляла оттиск на бумаге. Каретки не было: после каждого «аккорда» из одной или нескольких одновременно нажатых клавиш, бумага проматывалась на одну строчку вниз. Оттиск каждой литеры приходился всегда на одно и то же место в строке. Клавиши P, R, S, T присутствуют в двух экземплярах каждая — под левой и под правой рукой.
Каждый «аккорд», и каждая строчка в распечатке, соответствует одному слогу. Промежутков между словами нет, а сами слова передаются фонетически: на показанной выше распечатке застенографирована фраза «You should be able to read these short words». Поскольку клавиш меньше, чем букв в английском алфавите, и тем более — чем звуков в английской речи, то используется хитроумная система «кодирования», например [n] записывается как PB, [l] — как HR, дифтонг [e?] — как AEU, и т.п. При таком кодировании, например, слово gleam записывается как TKPWHRAOEPL — «аккорд» из одиннадцати одновременно нажатых клавиш!
После заседания стенографист должен был сидеть и перепечатывать свою стенограмму на обычной печатной машинке, потому что прочесть её неподготовленному человеку решительно невозможно. В приведённом примере фраза «absolutely one hundred percent» записана как SHRAOUT HRAOE WOPB HUPBD PERS, что означает [slju?tli? w?n h?nd p?rs] — пропущенные слоги должны восстанавливаться по контексту, а гласные не вполне соответствуют словарной транскрипции. Существуют разные системы обозначений и сокращений, так что даже самим стенографистам сложно читать записи один другого. Вот короткий отрывок из учебника стенографии, исправленного владельцем под другую систему:
Считается, что средний темп английской речи — 130 слов в минуту, а стенографист со стенотайпом может печатать до 300 слов в минуту, что позволяет записывать разговор даже тогда, когда собеседники перебивают друг друга. Есть аналогичная система Velotype, ориентированная на побуквенную запись вместо фонетической; она позволяет печатать до 200 слов в минуту. Разница вызвана тем, что в английских словах почти всегда букв больше, чем звуков — иногда вдвое, как в словах choose [t?u?z] или earth [???]. Велотайп был создан в 1939, когда расцвели табуляторы и автоматическая обработка данных; мотивацией для побуквенной записи была более простая расшифровка стенограмм, которую можно было бы поручить даже электромеханической машине. Вместе с прочей оргтехникой электрифицировались и сами стенографические машины: вместо механически соединённых клавиш и литер, печатающих на бумаге, с конца прошлого века используется электроника, удобные дисплеи, цифровое хранение и обработка стенограмм.
В начале этого века возможности компьютерной обработки естественных языков достигли того уровня, чтобы автоматически расшифровывать стенотайповые фонетические стенограммы и превращать «SHRAOUT HRAOE» в «absolutely». Затем поддержка лиц с ограниченными возможностями достигла того уровня, чтобы телеканалы сопровождали прямой эфир субтитрами в реальном времени для тех, кому читать проще, чем слушать. Это значит, что за эфиром следит стенографист со стенотайпом, он записывает речь диктора и других участников передачи, его компьютер расшифровывает стенограмму, при необходимости — автоматически переводит её на язык целевой аудитории, и передаёт получившийся текст в эфир и на YouTube.
Судя по всему, 12/11/2020 у CNN в этой сложной системе что-то засбоило, и вывод расшифровщика перемешался с кусками нерасшифрованной стенограммы. Даже если они во время передачи и обнаружили сбой, то решили ничего не трогать, чтобы не отломалось что-нибудь более важное. Случай на Fox News в 2013 наделал гораздо больше шума: в тот раз расшифровщик не справился с именем Джохара Царнаева, устроившего взрыв на Бостонском марафоне, и подставил вместо него в субтитры имя актрисы Зоуи Дешанель.
DrPass
Познавательно, но у меня возникает вопрос другого плана: одно дело, если там уличный корреспондент или интервью какое-то. Но диктор же не сочиняет отсебятину, перед ним там экран с видеосуфлёром, по которому он читает. Т.е. все его тексты и так уже оцифрованы и написаны. Зачем в этой схеме нужен стенографист?
И ещё момент вспомнил: я подобный бред в субтитрах видел ещё пару раз, причём оба раза — в сабах к музыкальным клипам на Ютубе. Поэтому подозреваю, что тот «стенографист» — не сотрудник CNN, а какой-то ютубовский робот, который преобразовывает речь в текст.
alchemist666
Думаю такие люди не только для ютуба работают, но и для внутренней кухни, собственные архивы и прыгание между филиалами или ещё как-то так. Особенно если дикторский текст ещё может заранее записан и можно его вставлять, то текст корреспондента в полях явно не пишется, так что поэтому есть такая профессия, которая пока логирует лучше, чем распознающие боты. Даже старые программы аля 70-х годов, сидит человек и расшифровывает интервью, кто чего сказал и на какой секунде. Нужно для будущих поколений и дальнейшего автоматического поиска по тексту.
drWhy
И если корреспондент всё-таки готовится к речи, то он периодически берёт интервью у случайных прохожих, которые говорят случайный текст (ведь правда?).
izogfif
Вы про прямое включение? Потому что большинство роликов, показываемых в новостях, довольно явно смонтированы (т.е. присутствуют монтажные склейки, в том числе с корреспондентом, читающим текст на камеру) и попадают на студию явно до начала выпуска новостей.
mitasamodel
Потому что репутация.
Выпуск новостей — это прямой эфир. Текст должен соответствовать тому, что говорит диктор. Если во время выпуска или прямо перед ним случается «breaking news», то текст всё равно должен соответствовать. А не продолжать транслировать фейковую телеметрию, когда ракетоноситель уже потерян.
Iv38
Да и без брейкинг ньюсов ведущие могут оговориться и исправиться или несколько от текста отойти. Ну и всякие диалоги с кореспондентами живьём могут быть непредсказуемы.
tyomitch Автор
Не дальше чем на прошлый День независимости было, что Трамп с телесуфлёра вместо «Our army rammed the ramparts» прочитал «Our army manned the airports», после чего добавил из головы: «it rammed the ramparts, it took over the airports, it did everything it had to do». Тут сразу и очитка, и исправление, и абсурдная отсебятина экспромтом.
mgremlin
Потерять ракетоноситель — это сильно.
Про такое не скажешь не только «с… дили», но даже и «про… бал».
Не подскажете, кто это так отличился и когда?
Naves
Аварийный пуск «Союз МС-10»
habr.com/en/post/426039
mgremlin
Случается такое с ракетами.
Но вот чтоб ракетоноситель потерять — не слыхал такого.
Naves
С протоном вроде такая же ситуация была в 2013, когда еще «датчик вверх-ногами заколотили».
TheShock
mgremlin говорит, что вы путаете ракету-носитель (Протон и Союз) и ракетоноситель (штука, переносит эту ракету)
muxa_ru
Увы, но эта битва проигран и давно.
Не просто давно, а с самого начала она проиграна.
Обзывание ракет-носителей словом "ракетоноситель" началось сразу при появлении слова ракета-носитель. Это зафиксировано в лингвистической литературе советских времён.
Есть примеры использования слова "ракетоноситель" в смысле "ракетоносец", но они погоды не делают :(
Tomasina
Это реально такое было?
tyomitch Автор
habr.com/ru/post/426039/#comment_19221105
tyomitch Автор
Любому СМИ нужны штатные стенографисты для пресс-конференций.
Раз они уже есть, почему ими не воспользоваться и для субтитров?
Ютубовский робот, который преобразовывает речь в текст, генерирует что-то такое:
Видите разницу между этим и «STILLEVELOP PLANANDEMIC, ILNG T»?