Привет, Хабр! Представляю вашему вниманию перевод статьи «Are Online Transcription Services Safe and Private?» автора Matthew Hughes.
Транскрипция когда-то была ручным, утомительным процессом. Врачи, журналисты и целая толпа профессионалов записывали свои записи и разговоры на диктофон, а затем садились перед компьютером, чтобы набрать их на клавиатуре.
В 2020 году есть целый ряд услуг, которые вы можете использовать, чтобы превратить аудиозапись в текст. Однако остается вопрос: Безопасны ли они? Например, вы можете загружать записи деликатных разговоров и частной голосовой почты.
Давайте посмотрим на эти службы, и на то как вы можете защитить свою информацию.
Автор иллюстрации: Yangard
Это изображение доступно по лицензии Creative Commons «Attribution-ShareAlike» («Атрибуция — На тех же условиях») 4.0 Всемирная.
Сервисы аудио-транскрипции, как правило, распределяются по трём категориям. Первая – полностью управляется компьютером и использует существующие модели ИИ и машинного обучения для обработки разговора. Вторая – самая дорогая, это когда люди выполняют весь процесс. Третья – это сочетание компьютерной обработки и человека.
Скорее всего, вы больше всего знакомы с первой категорией. Службы транскрипции голоса – такие как Google, Apple и Otter.ai, преобразуют аналоговые волны, создаваемые вашим голосом, в цифровое представление. Затем их разбивают на небольшие (иногда тысячную долю секунды) сегменты и сопоставляют с известными «фонемами» или элементами языка.
Затем эти алгоритмы пытаются рассмотреть их в контексте других фонем и пропустить через статистические и ИИ-модели, которые в конечном счёте производят текст. Поскольку эти транскрипционные сервисы полностью управляются компьютером, они, как правило, являются самыми недорогими. Тем не менее, точность не всегда на высоте, особенно когда дело доходит до извлечения текста из шумной или многопользовательской среды.
Транскрипция, выполняемая человеком, включает в себя специальные платформы, такие как Rev, которые соединяют клиентов с пулом предварительно одобренных транскрипторов. Вы также можете нанять кого-нибудь из внештатных сотрудников, например в Upwork или Fiverr.
Наконец, есть смесь этих двух. Чтобы ускорить процесс транскрипции, некоторые сайты позволяют ИИ выполнять предварительную работу, а затем кто-то убирает выходные данные и исправляет любые ошибки.
В последние годы многие транскрипционные сервисы стали субъектами нарушений и скандалов.
Пожалуй, самым старым (и, возможно, самым вопиющим) был SpinVox, который в «нулевых» предлагал услугу, превращающую голосовую почту в SMS-сообщения. В то время это считалось технологическим прорывом. Фирма быстро привлекла положительные отзывы прессы, клиентов и обширное финансирование.
В чём же проблема? Скрытно от клиентов, их голосовые сообщения обрабатывались людьми, работающими из офисов находящихся в Пакистане, Маврикии и ЮАР. Одна инсайдерская компания утверждала, что только 2% голосовой почты обрабатывалось машинно, а остальные обрабатывались примерно 10-ю тысячами эксплуатируемых работников.
Когда сотрудникам пакистанского офиса SpinVox не заплатили, они стали отправлять сообщения непосредственно клиентам в знак протеста. В итоге правда вышла наружу, и SpinVox потерял большую часть своей ценности, а остатки компании были проданы компании Nuance, одному из крупнейших поставщиков услуг по распознаванию голоса в мире.
Совсем недавно журналист по вопросам кибербезопасности Брайан Кребс (Brian Krebs) обнаружил серьезное нарушение, произошедшее в MEDantex, канзасском провайдере услуг транскрипции голоса для медицинских работников. Произошла утечка данных (некоторые из которых датируются 2007-м годом), содержащих конфиденциальную медицинскую документацию. Их содержимое можно было загрузить с небезопасного портала в виде файлов Microsoft Word.
Даже услуги полностью цифровой транскрипции небезопасны. Вы заказываете такую компьютеризированную услугу, а фирма может использовать для осуществления контроля качества людей, работающих по контракту.
В 2019-м году бельгийский новостной сайт VRT NWS обнаружил, что подрядчики Google прослушивают разговоры между людьми и их «умными» помощниками в Google Home. Один из подрядчиков даже предоставил VRT NWS доступ к разговорам, многие из которых носили глубоко деликатный, а в некоторых случаях и сексуально-интимный характер.
Amazon, Apple и Microsoft также использовали подрядчиков. Иначе говоря, кто-то мог прослушивать голосовые записи вашего виртуального помощника.
Ответ на этот вопрос немного сложен.
На данный момент рынок в значительной степени созрел для транскрипционных сервисов, а самые вопиюще плохие игроки были отсеяны.
Тем не менее, когда вы доверяете свои данные (в данном случае частные разговоры) третьей стороне, вы расчитываете что они достаточно защищены. Независимо от того онлайн-сервисы это, или сервисы использующие работников-транскрипторов.
Но в любом случае задайте себе два вопроса: Доверяете ли вы данному сервису и насколько деликатны ваши разговоры?
Если вы изучаете сервис транскрипции, всегда стоит провести какое-то исследование. Имеет ли эта компания хорошую репутацию? Хорошо ли она зарекомендовала себя? Были ли у неё в прошлом нарушения? Существует ли политика конфиденциальности, в которой чётко прописано, как будут обрабатываться ваши данные и обеспечиваться их защита?
Ранее упоминалось, службы, основанные на ИИ, часто полагаются на сотрудников и сторонних подрядчиков для проведения проверок качества. Хотя эти проверки представляют собой только часть от всех заказов, всегда есть вероятность, что кто-то может прослушать ваши записи.
Но во многих случаях, это не помешает сделке. Однако, если ваш разговор глубоко приватный или коммерчески чувствительный, подумайте об открытии текстового редактора и стенографировании своими силами.
Транскрипция когда-то была ручным, утомительным процессом. Врачи, журналисты и целая толпа профессионалов записывали свои записи и разговоры на диктофон, а затем садились перед компьютером, чтобы набрать их на клавиатуре.
В 2020 году есть целый ряд услуг, которые вы можете использовать, чтобы превратить аудиозапись в текст. Однако остается вопрос: Безопасны ли они? Например, вы можете загружать записи деликатных разговоров и частной голосовой почты.
Давайте посмотрим на эти службы, и на то как вы можете защитить свою информацию.
Автор иллюстрации: Yangard
Это изображение доступно по лицензии Creative Commons «Attribution-ShareAlike» («Атрибуция — На тех же условиях») 4.0 Всемирная.
Как работают сервисы аудио-транскрипции
Сервисы аудио-транскрипции, как правило, распределяются по трём категориям. Первая – полностью управляется компьютером и использует существующие модели ИИ и машинного обучения для обработки разговора. Вторая – самая дорогая, это когда люди выполняют весь процесс. Третья – это сочетание компьютерной обработки и человека.
Скорее всего, вы больше всего знакомы с первой категорией. Службы транскрипции голоса – такие как Google, Apple и Otter.ai, преобразуют аналоговые волны, создаваемые вашим голосом, в цифровое представление. Затем их разбивают на небольшие (иногда тысячную долю секунды) сегменты и сопоставляют с известными «фонемами» или элементами языка.
Затем эти алгоритмы пытаются рассмотреть их в контексте других фонем и пропустить через статистические и ИИ-модели, которые в конечном счёте производят текст. Поскольку эти транскрипционные сервисы полностью управляются компьютером, они, как правило, являются самыми недорогими. Тем не менее, точность не всегда на высоте, особенно когда дело доходит до извлечения текста из шумной или многопользовательской среды.
Транскрипция, выполняемая человеком, включает в себя специальные платформы, такие как Rev, которые соединяют клиентов с пулом предварительно одобренных транскрипторов. Вы также можете нанять кого-нибудь из внештатных сотрудников, например в Upwork или Fiverr.
Наконец, есть смесь этих двух. Чтобы ускорить процесс транскрипции, некоторые сайты позволяют ИИ выполнять предварительную работу, а затем кто-то убирает выходные данные и исправляет любые ошибки.
Транскрипционные сервисы плохо себя ведут
В последние годы многие транскрипционные сервисы стали субъектами нарушений и скандалов.
Пожалуй, самым старым (и, возможно, самым вопиющим) был SpinVox, который в «нулевых» предлагал услугу, превращающую голосовую почту в SMS-сообщения. В то время это считалось технологическим прорывом. Фирма быстро привлекла положительные отзывы прессы, клиентов и обширное финансирование.
В чём же проблема? Скрытно от клиентов, их голосовые сообщения обрабатывались людьми, работающими из офисов находящихся в Пакистане, Маврикии и ЮАР. Одна инсайдерская компания утверждала, что только 2% голосовой почты обрабатывалось машинно, а остальные обрабатывались примерно 10-ю тысячами эксплуатируемых работников.
Когда сотрудникам пакистанского офиса SpinVox не заплатили, они стали отправлять сообщения непосредственно клиентам в знак протеста. В итоге правда вышла наружу, и SpinVox потерял большую часть своей ценности, а остатки компании были проданы компании Nuance, одному из крупнейших поставщиков услуг по распознаванию голоса в мире.
Совсем недавно журналист по вопросам кибербезопасности Брайан Кребс (Brian Krebs) обнаружил серьезное нарушение, произошедшее в MEDantex, канзасском провайдере услуг транскрипции голоса для медицинских работников. Произошла утечка данных (некоторые из которых датируются 2007-м годом), содержащих конфиденциальную медицинскую документацию. Их содержимое можно было загрузить с небезопасного портала в виде файлов Microsoft Word.
Даже услуги полностью цифровой транскрипции небезопасны. Вы заказываете такую компьютеризированную услугу, а фирма может использовать для осуществления контроля качества людей, работающих по контракту.
В 2019-м году бельгийский новостной сайт VRT NWS обнаружил, что подрядчики Google прослушивают разговоры между людьми и их «умными» помощниками в Google Home. Один из подрядчиков даже предоставил VRT NWS доступ к разговорам, многие из которых носили глубоко деликатный, а в некоторых случаях и сексуально-интимный характер.
Amazon, Apple и Microsoft также использовали подрядчиков. Иначе говоря, кто-то мог прослушивать голосовые записи вашего виртуального помощника.
Актуальный вопрос: Безопасны ли транскрипционные онлайн-сервисы?
Ответ на этот вопрос немного сложен.
На данный момент рынок в значительной степени созрел для транскрипционных сервисов, а самые вопиюще плохие игроки были отсеяны.
Тем не менее, когда вы доверяете свои данные (в данном случае частные разговоры) третьей стороне, вы расчитываете что они достаточно защищены. Независимо от того онлайн-сервисы это, или сервисы использующие работников-транскрипторов.
Но в любом случае задайте себе два вопроса: Доверяете ли вы данному сервису и насколько деликатны ваши разговоры?
Если вы изучаете сервис транскрипции, всегда стоит провести какое-то исследование. Имеет ли эта компания хорошую репутацию? Хорошо ли она зарекомендовала себя? Были ли у неё в прошлом нарушения? Существует ли политика конфиденциальности, в которой чётко прописано, как будут обрабатываться ваши данные и обеспечиваться их защита?
Ранее упоминалось, службы, основанные на ИИ, часто полагаются на сотрудников и сторонних подрядчиков для проведения проверок качества. Хотя эти проверки представляют собой только часть от всех заказов, всегда есть вероятность, что кто-то может прослушать ваши записи.
Но во многих случаях, это не помешает сделке. Однако, если ваш разговор глубоко приватный или коммерчески чувствительный, подумайте об открытии текстового редактора и стенографировании своими силами.
Gourry_aka_pm
Являются ли сервисы транскрипции безопасными? Ну не знаем, ищите какой-нибудь с хорошей репутацией.