Коты – животные непростые, и хотя самым продвинутым спикером среди них считается Чеширский кот, наш Васька из Лукоморья сказки говорит не хуже британца. В этом посте мы расскажем вам о том, как мы выбирали CAT (Computer-Aided Translation — систему автоматизированного перевода) для синхроподкастов, какую выбрали и почему.
Сколько ни штудируй английскую грамматику, ни зубри слова, а понимать английскую речь на слух это не поможет. Чтобы научиться ловить смысл сказанного надо слушать, слушать и еще раз слушать английскую речь. Именно поэтому в конце 2017 мы выпустили новый продукт — синхроподкасты — обучающие ролики с видео, аудио и синхронизированным текстом.
Синхронные подкасты позволяют одновременно слушать английскую речь (текст читается очень разборчиво, в медленном темпе), видеть соответствующие события на экране и читать перевод текущего фрагмента речи.
Создание синхроподкастов — процесс сложный, но благодаря тому, что материал должен отвечать привычной учебной форме (типичные тембры, четкая артикуляция, произношение, близкое к эталонному), здесь удается применять технологию автоматизированного перевода. Для тех, кто не в теме: автоматизированный перевод и машинный перевод — это не одно и то же. Термином «машинный перевод» называют действие, когда текст переводится с одного естественного языка на другой с использованием специального программного обеспечения. Автоматизированный перевод отличается тем, что весь процесс перевода осуществляется человеком, компьютер лишь помогает ему произвести готовый текст либо за меньшее время, либо с лучшим качеством.
Приступая к созданию синхроподкастов, мы, конечно, обозрели широкий арсенал систем САТ. Если вы попробуете поискать такие программы в Гугле или Яндексе, то одной из первых в списке будет CAT-система Deja Vu.
Deja Vu. Это очень простая программа, без нагромождений и лишнего функционала, разработанная испанской компанией Atril Language Engineering, специализирующейся на разработке компьютерных систем для автоматизации работы переводчиков и переводческих агентств. Но и возможностей у нее не очень много. Достоинство – занимает мало места на компьютере.
Deja Vu X может создавать проекты и работать с форматами Microsoft Word, Rich Text Format, Windows Help, Microsoft Excel, Micosoft PowerPoint, Microsoft Access, OpenOffice/StarOffice, Adobe FrameMaker MIF, Adobe InDesign, Adobe PageMaker tagged text, QuarkXPress XTG, Interleaf ASCII, HTML, ASP/ASP.NET, PHP, JavaScript, VBScript, HTML Help, SGML, XML, RC, C/C++/Java, Java properties, IBM TM untranslated segments, Trados WorkBench documents, TradosTag TTX, Trados TagEditor BIF, Trados TagEditor TMX, GNU PO и POT files и файлами в кодах ASCII.
Версия Deja Vu Х Standard рассчитана на переводчиков-фрилансеров, желающих иметь простой и удобный инструмент для работы. Позволяет создавать полноценные проекты, однако в ней отсутствуют некоторые автоматизированные функции, которые есть в версии Professional.
Целевая группа профессиональной версии — те же переводчики-фрилансеры. Но Deja Vu Professional уже обладает такими автоматизированными функциями, как предперевод, автопоиск по базам данных, автоподстановка перевода по всем аналогичным сегментам на проекте, автопополнение баз данных, а также автосборка перевода из фрагментов, хранящихся в базах данных. Использование функций Лексикона позволяет создавать глоссарии на основе переводимых проектов, определить частотность употребления терминов и использовать полученные глоссарии для контроля качества.
Для агентств и отделов переводов выпущена версия Deja Vu Workgroup. Это достаточно мощный инструмент, включающий все функции версии Professional, и дополненный функционалом для организации коллективной работы, управлению проектами и интеграции.
Deja Vu X TeaM Server – еще более продвинутая система, дает возможность пользователям Deja Vu X2 Workgroup делиться базами данных в режиме реального времени по всему миру. Обеспечивает единообразие и производительность, уменьшает проектные затраты. Разные схемы лицензирования могут снизить или совсем исключить ручное администрирование проектов.
MemoQ — еще одна широко распространенная CAT-система. Ее любят локализаторы, поскольку в отличие от других она совместима с файлами Excel. В MemoQ можно загружать разные типы файлов, и она не привередлива к их объему и содержанию. Но у нее непривычный функционал, и многие пользователи, имеющие опыт работы с другими системами, на первых порах испытывают трудности в настройке.
MultiTerm — программа, которую переводчики используют для создания базы переводов, популярна в узкоспециализированных сообществах, которые занимаются переводами текстов по определенным тематикам. Одно из достоинств MultiTerm — возможность создавать глоссарии для использования в CAT-системах, которые впоследствии вручную можно подключить к автоматизированным системам. Но есть и недостатки. Программа не отличается дружественным интерфейсом, и новичкам довольно сложно разобраться в настройках.
Across — также достаточно популярная система с простым интерфейсом. Но отношение к ней неоднозначно. Все дело в «прозрачности»: проектные данные находятся в открытом доступе. Такой системой можно пользоваться, если вопрос о защите данных не актуален.
XTM — сложная система, используемая крупными компаниями в промышленных целях. Рассчитана на масштабные проекты и большие объемы данных. Главное — суметь правильно ее настроить. Тогда пользователям будет удобно с ней работать, они сэкономят массу времени. А вот переводчикам эта программа вряд ли подойдет.
TRADOS. Все перечисленные выше системы по тем или иным параметрам уступают яркому лидеру среди коммерческих систем – Trados. Этот продукт разработан немецкой компанией Trados GmbH, и является одним из мировых лидеров в данном классе. У системы огромное количество достоинств. Среди ключевых — на данный момент Trados поддерживает 93 языка (больше, чем все остальные системы). И по объему базы памяти переводов она лучше всех известных нам систем. Из недостатков можно отметить специфичный интерфейс. Впрочем, удобство интерфейса – дело вкуса и привычки. Есть проблемы с поддержкой некоторых форматов. Она привередлива к объему и типу файлов (например, уступает по этому параметру MemoQ). И Trados совсем не умеет извлекать текст из картинок.
SmartCAT. Это бесплатная облачная браузерная среда, обеспечивающая совместную работу целой команды переводчиков. Разумеется, SmartCAT — не первая в своем классе. Но по многим параметрам она опережает аналоги, как платные, так и бесплатные. Почему так получилось, становится понятно, если мы поинтересуемся происхождением этой системы. Изначально разработчиком SmartCAT была компания ABBYY, она-то и заложила в продукте широкие функциональные возможности. Сегодня Smartcat — самостоятельная фирма.
Рассмотрим подробнее функционал системы. Ее главный козырь – многочисленные лингвистические ресурсы, облегчающие работу переводчиков с однотипными текстами, содержащими стандартные фразы и предложения. Как правило, это общепринятые термины — технические, юридические, экономические, научные и т.д., описания товаров и услуг, деловая документация и многое другое. Тут ключевую роль играют базы Translation Memory — базы памяти переводов. В них хранятся когда-то переведенные тексты. Понятно, что эти базы постоянно пополняются новыми переводами.
Другой важный ресурс — глоссарии, которые содержат термины и понятия, принятые в какой-то конкретной отрасли, или компании. SmartCAT позволяет накапливать и поддерживать в актуальном состоянии корпоративные глоссарии и обеспечивает исполнителей правильными данными. А автоматические проверки гарантируют контроль качества перевода, обнаруживая несоответствия в терминах и датах, и отмечая орфографические, пунктуационные и другие ошибки.
Само собой, SmartCAT способна также выполнять и машинный перевод.
Указанные ресурсы системы облегчают работу человека, использующего CAT. Система предлагает варианты перевода отдельных фрагментов, опираясь на имеющиеся тексты из баз памяти переводов и глоссарии с корпоративной терминологией. Переводчик может просто воспользоваться предложенным вариантом, либо отредактировать его, либо, в крайнем случае, перевести текст по собственному разумению.
Особо следует остановиться на форматах файлов, поддерживаемых системой SmartCAT. Их список весьма внушителен: bmp, dcx, pcx, png, jp2, jpc, jpg, jpeg, jfif, tif, tiff, gif, pdf, djvu, djv, jb2, docx, doc, txt, rtf, odt, xlsx, xls, ppt, pptx, potx, pps, ppsx, odp, ttx, sdlxliff, xlf, xliff, srt. Обращает внимание то, что в приведенном списке немало графических форматов. Это приятное наследие ABBYY. Нередко переводчикам приходится работать с документами не в виде текста, а в виде изображений. Чтобы извлечь текст, его необходимо сначала распознать. SmartCAT интегрирован с OCR-технологиями ABBYY: достаточно загрузить графический файл, и система извлечет текст для перевода. Если вам хоть раз приходилось вручную вбивать текст, глядя на картинку, вы по достоинству оцените прелесть использования OCR-технологии.
Еще один комплимент от ABBYY — возможность использования словарей Lingvo. Небольшое, но все же удобство, когда все необходимое для перевода у вас под рукой.
Когда в описании системы встречаются слова «облачная среда», многие потенциальные пользователи рефлекторно напрягаются: «А как обстоят дела с безопасностью? Не украдут ли мои данные?» Ответим честно: взломать можно что угодно. Просто целесообразность взлома определяется соотношением затраченных времени и сил, и полученным результатом. В системе SmartCAT данные хранятся в дата-центре уровня Tier 4 и передаются по защищенным каналам, а уровень доступа к материалам регулируется с помощью системы распределения прав.
Заканчивая краткое описание SmartCAT, добавим, что интерфейс системы интуитивно понятен любому, кто когда-либо работал с CAT-инструментами: вы увидите на привычном месте оригинальный текст и перевод, окно совпадений с памятью переводов и глоссарием. Имеется отдельное окно для поиска в памяти, глоссариях и словарях, и еще одно окно — для результатов проверки качества, истории изменений фрагмента текста и комментариев.
Хорошенько проанализировав весь арсенал достойных внимания систем САТ, в финале мы выбирали из двух: Trados и SmartCAT. Сравнение их функциональных возможностей показало, что примерно на 95% (это субъективная оценка автора) данные системы идентичны. С одной стороны, большее число поддерживаемых языков и больший объем базы памяти переводов Trados, с другой, дружелюбный интерфейс, поддержка графических форматов и способность извлекать текст из изображений, меньшая требовательность к объему файлов, масса полезных дополнительных функций и бесплатность SmartCAT.
В итоге мы выбрали SmartCAT. И хотя британец Тrados (сегодня система принадлежит британской компании SDL International) хорош и в моде, российская система CAT по ряду параметров превосходит зарубежный аналог и при этом проста в использовании, удобна и не капризна.
Константин Геращенко, редактор образовательного онлайн-ресурса Puzzle English
Сколько ни штудируй английскую грамматику, ни зубри слова, а понимать английскую речь на слух это не поможет. Чтобы научиться ловить смысл сказанного надо слушать, слушать и еще раз слушать английскую речь. Именно поэтому в конце 2017 мы выпустили новый продукт — синхроподкасты — обучающие ролики с видео, аудио и синхронизированным текстом.
Синхронные подкасты позволяют одновременно слушать английскую речь (текст читается очень разборчиво, в медленном темпе), видеть соответствующие события на экране и читать перевод текущего фрагмента речи.
Создание синхроподкастов — процесс сложный, но благодаря тому, что материал должен отвечать привычной учебной форме (типичные тембры, четкая артикуляция, произношение, близкое к эталонному), здесь удается применять технологию автоматизированного перевода. Для тех, кто не в теме: автоматизированный перевод и машинный перевод — это не одно и то же. Термином «машинный перевод» называют действие, когда текст переводится с одного естественного языка на другой с использованием специального программного обеспечения. Автоматизированный перевод отличается тем, что весь процесс перевода осуществляется человеком, компьютер лишь помогает ему произвести готовый текст либо за меньшее время, либо с лучшим качеством.
Какие CAT-системы мы анализировали при выборе
Приступая к созданию синхроподкастов, мы, конечно, обозрели широкий арсенал систем САТ. Если вы попробуете поискать такие программы в Гугле или Яндексе, то одной из первых в списке будет CAT-система Deja Vu.
Deja Vu. Это очень простая программа, без нагромождений и лишнего функционала, разработанная испанской компанией Atril Language Engineering, специализирующейся на разработке компьютерных систем для автоматизации работы переводчиков и переводческих агентств. Но и возможностей у нее не очень много. Достоинство – занимает мало места на компьютере.
Deja Vu X может создавать проекты и работать с форматами Microsoft Word, Rich Text Format, Windows Help, Microsoft Excel, Micosoft PowerPoint, Microsoft Access, OpenOffice/StarOffice, Adobe FrameMaker MIF, Adobe InDesign, Adobe PageMaker tagged text, QuarkXPress XTG, Interleaf ASCII, HTML, ASP/ASP.NET, PHP, JavaScript, VBScript, HTML Help, SGML, XML, RC, C/C++/Java, Java properties, IBM TM untranslated segments, Trados WorkBench documents, TradosTag TTX, Trados TagEditor BIF, Trados TagEditor TMX, GNU PO и POT files и файлами в кодах ASCII.
Версия Deja Vu Х Standard рассчитана на переводчиков-фрилансеров, желающих иметь простой и удобный инструмент для работы. Позволяет создавать полноценные проекты, однако в ней отсутствуют некоторые автоматизированные функции, которые есть в версии Professional.
Целевая группа профессиональной версии — те же переводчики-фрилансеры. Но Deja Vu Professional уже обладает такими автоматизированными функциями, как предперевод, автопоиск по базам данных, автоподстановка перевода по всем аналогичным сегментам на проекте, автопополнение баз данных, а также автосборка перевода из фрагментов, хранящихся в базах данных. Использование функций Лексикона позволяет создавать глоссарии на основе переводимых проектов, определить частотность употребления терминов и использовать полученные глоссарии для контроля качества.
Для агентств и отделов переводов выпущена версия Deja Vu Workgroup. Это достаточно мощный инструмент, включающий все функции версии Professional, и дополненный функционалом для организации коллективной работы, управлению проектами и интеграции.
Deja Vu X TeaM Server – еще более продвинутая система, дает возможность пользователям Deja Vu X2 Workgroup делиться базами данных в режиме реального времени по всему миру. Обеспечивает единообразие и производительность, уменьшает проектные затраты. Разные схемы лицензирования могут снизить или совсем исключить ручное администрирование проектов.
MemoQ — еще одна широко распространенная CAT-система. Ее любят локализаторы, поскольку в отличие от других она совместима с файлами Excel. В MemoQ можно загружать разные типы файлов, и она не привередлива к их объему и содержанию. Но у нее непривычный функционал, и многие пользователи, имеющие опыт работы с другими системами, на первых порах испытывают трудности в настройке.
MultiTerm — программа, которую переводчики используют для создания базы переводов, популярна в узкоспециализированных сообществах, которые занимаются переводами текстов по определенным тематикам. Одно из достоинств MultiTerm — возможность создавать глоссарии для использования в CAT-системах, которые впоследствии вручную можно подключить к автоматизированным системам. Но есть и недостатки. Программа не отличается дружественным интерфейсом, и новичкам довольно сложно разобраться в настройках.
Across — также достаточно популярная система с простым интерфейсом. Но отношение к ней неоднозначно. Все дело в «прозрачности»: проектные данные находятся в открытом доступе. Такой системой можно пользоваться, если вопрос о защите данных не актуален.
XTM — сложная система, используемая крупными компаниями в промышленных целях. Рассчитана на масштабные проекты и большие объемы данных. Главное — суметь правильно ее настроить. Тогда пользователям будет удобно с ней работать, они сэкономят массу времени. А вот переводчикам эта программа вряд ли подойдет.
TRADOS. Все перечисленные выше системы по тем или иным параметрам уступают яркому лидеру среди коммерческих систем – Trados. Этот продукт разработан немецкой компанией Trados GmbH, и является одним из мировых лидеров в данном классе. У системы огромное количество достоинств. Среди ключевых — на данный момент Trados поддерживает 93 языка (больше, чем все остальные системы). И по объему базы памяти переводов она лучше всех известных нам систем. Из недостатков можно отметить специфичный интерфейс. Впрочем, удобство интерфейса – дело вкуса и привычки. Есть проблемы с поддержкой некоторых форматов. Она привередлива к объему и типу файлов (например, уступает по этому параметру MemoQ). И Trados совсем не умеет извлекать текст из картинок.
SmartCAT. Это бесплатная облачная браузерная среда, обеспечивающая совместную работу целой команды переводчиков. Разумеется, SmartCAT — не первая в своем классе. Но по многим параметрам она опережает аналоги, как платные, так и бесплатные. Почему так получилось, становится понятно, если мы поинтересуемся происхождением этой системы. Изначально разработчиком SmartCAT была компания ABBYY, она-то и заложила в продукте широкие функциональные возможности. Сегодня Smartcat — самостоятельная фирма.
Почему мы выбрали SmartCAT
Рассмотрим подробнее функционал системы. Ее главный козырь – многочисленные лингвистические ресурсы, облегчающие работу переводчиков с однотипными текстами, содержащими стандартные фразы и предложения. Как правило, это общепринятые термины — технические, юридические, экономические, научные и т.д., описания товаров и услуг, деловая документация и многое другое. Тут ключевую роль играют базы Translation Memory — базы памяти переводов. В них хранятся когда-то переведенные тексты. Понятно, что эти базы постоянно пополняются новыми переводами.
Другой важный ресурс — глоссарии, которые содержат термины и понятия, принятые в какой-то конкретной отрасли, или компании. SmartCAT позволяет накапливать и поддерживать в актуальном состоянии корпоративные глоссарии и обеспечивает исполнителей правильными данными. А автоматические проверки гарантируют контроль качества перевода, обнаруживая несоответствия в терминах и датах, и отмечая орфографические, пунктуационные и другие ошибки.
Само собой, SmartCAT способна также выполнять и машинный перевод.
Указанные ресурсы системы облегчают работу человека, использующего CAT. Система предлагает варианты перевода отдельных фрагментов, опираясь на имеющиеся тексты из баз памяти переводов и глоссарии с корпоративной терминологией. Переводчик может просто воспользоваться предложенным вариантом, либо отредактировать его, либо, в крайнем случае, перевести текст по собственному разумению.
Особо следует остановиться на форматах файлов, поддерживаемых системой SmartCAT. Их список весьма внушителен: bmp, dcx, pcx, png, jp2, jpc, jpg, jpeg, jfif, tif, tiff, gif, pdf, djvu, djv, jb2, docx, doc, txt, rtf, odt, xlsx, xls, ppt, pptx, potx, pps, ppsx, odp, ttx, sdlxliff, xlf, xliff, srt. Обращает внимание то, что в приведенном списке немало графических форматов. Это приятное наследие ABBYY. Нередко переводчикам приходится работать с документами не в виде текста, а в виде изображений. Чтобы извлечь текст, его необходимо сначала распознать. SmartCAT интегрирован с OCR-технологиями ABBYY: достаточно загрузить графический файл, и система извлечет текст для перевода. Если вам хоть раз приходилось вручную вбивать текст, глядя на картинку, вы по достоинству оцените прелесть использования OCR-технологии.
Еще один комплимент от ABBYY — возможность использования словарей Lingvo. Небольшое, но все же удобство, когда все необходимое для перевода у вас под рукой.
Когда в описании системы встречаются слова «облачная среда», многие потенциальные пользователи рефлекторно напрягаются: «А как обстоят дела с безопасностью? Не украдут ли мои данные?» Ответим честно: взломать можно что угодно. Просто целесообразность взлома определяется соотношением затраченных времени и сил, и полученным результатом. В системе SmartCAT данные хранятся в дата-центре уровня Tier 4 и передаются по защищенным каналам, а уровень доступа к материалам регулируется с помощью системы распределения прав.
Заканчивая краткое описание SmartCAT, добавим, что интерфейс системы интуитивно понятен любому, кто когда-либо работал с CAT-инструментами: вы увидите на привычном месте оригинальный текст и перевод, окно совпадений с памятью переводов и глоссарием. Имеется отдельное окно для поиска в памяти, глоссариях и словарях, и еще одно окно — для результатов проверки качества, истории изменений фрагмента текста и комментариев.
Ну и еще несколько функций и особенностей, которые нельзя обойти молчанием
- Панель управления проектами позволяет в любой момент отслеживать текущие проекты, дедлайны, объемы переводов и назначенных исполнителей. В системе отсутствуют ограничения по количеству проектов или объемам баз памяти перевода и глоссариям. Поэтому мы можем подключать неограниченное количество исполнителей на проекты.
- Реализована интеграция с корпоративными системами. Можно отправлять материалы на перевод и получать готовые тексты прямо на корпоративных порталах или в системах управления информацией, внедренных на предприятии.
- Функция чата. Переводчики, редакторы и менеджеры, работающие над проектом, могут оперативно обсуждать текущие вопросы. Сообщения отображаются в окне комментариев.
- Использование облака обеспечивает независимость от операционной системы, которой пользуется переводчик.
- Система представлена в двух версиях: для корпоративных пользователей и для переводчиков-фрилансеров. Фрилансерская версия бесплатна: чтобы начать работу, достаточно зарегистрироваться на сайте ru.smartcat.ai.
Итого
Хорошенько проанализировав весь арсенал достойных внимания систем САТ, в финале мы выбирали из двух: Trados и SmartCAT. Сравнение их функциональных возможностей показало, что примерно на 95% (это субъективная оценка автора) данные системы идентичны. С одной стороны, большее число поддерживаемых языков и больший объем базы памяти переводов Trados, с другой, дружелюбный интерфейс, поддержка графических форматов и способность извлекать текст из изображений, меньшая требовательность к объему файлов, масса полезных дополнительных функций и бесплатность SmartCAT.
В итоге мы выбрали SmartCAT. И хотя британец Тrados (сегодня система принадлежит британской компании SDL International) хорош и в моде, российская система CAT по ряду параметров превосходит зарубежный аналог и при этом проста в использовании, удобна и не капризна.
Константин Геращенко, редактор образовательного онлайн-ресурса Puzzle English
Комментарии (2)
scalywhale
17.08.2018 15:55Спасибо за подробное исследование и выбор Smartcat. Нам приятно, что наш продукт подошёл для ваших задач! Пара уточнений:
- Smartcat бесплатен вообще для всех без ограничений, не только для фрилансеров;
- Ну и пишемся мы теперь Smartcat, а не SmartCAT, но это мелочи
Lazytech
Сдается мне, для создания синхроподкастов подошла бы бесплатная CAT-программа OmegaT.
P.S. Пардон, был невнимателен: оказывается, требовалось приложение, поддерживающее совместную работу нескольких переводчиков.