image

Китайский телекоммуникационный гигант Baidu разработал систему перевода, которая, возможно, позволит в скором времени забыть о неудобствах при общении с носителем языка, который не знаешь. Подразделение Baidu Research представило платформу STACL, которая способна помочь с переводом в любое время и в любом месте.

При этом ИИ-технология, на основе которой построен переводчик, способна предсказать, что собирается сказать собеседник в ближайшие несколько секунд, система, если можно так выразиться «думает наперед». Работу STACL (Simultaneous Translation with Anticipation and Controllable Latency) можно сравнить с работой наиболее эффективных синхронных переводчиков-людей.

Когда переводом занимается человек, ему необходимо одновременно слушать, переводить в уме и говорить, причем все это — на другом языке.Работа эта настолько сложная, что «синхронисты» действуют в команде, заменяя друг друга каждые 10-30 минут.

Если же взять компьютеры, то они могут без проблем выполнять все необходимые задачи, безе перерывов на отдых и обед. До настоящего момента многие возможности оставались для компьютерных систем недоступными. Лучшие из лучших системы перевода делали то, что называется последовательным переводом. Они прослушивали все сказанное, переводили в необходимый формат и через время выдавали перевод на другой язык. Все это работает хорошо и корректно, но медленно.

Интересно, что в некоторых случаях синхронным переводчикам придется ждать появления ключевых элементов сказанного. В немецком языке это, например, глаголы — они идут в конце предложения, не так, как в английском. Так что для понимания сказанного переводчику приходиться некоторое время находиться «в режиме ожидания». На практике это проявляется в виде пауз.

Если говорить о китайской разработке, то она в состоянии предсказать, какой глагол должен появиться, так что никаких пауз нет. Перевод при этом очень точный — проблем с ним не слишком много. На данный момент STACL все еще обучают, «скармливая» компьютеру газетные статьи. Результат обучения — достаточно точное предсказание, как будет идти повествование далее, без ознакомления с ним.

Кроме всего прочего, китайская система «понимает» специфические особенности языков, с которыми она работает, и использует это для перевода. Например, синхронные переводчики иногда ошибаются, когда переводят с китайского на европейские языки и обратно — это связано со спецификой самого языка. Машина же справляется отлично.

Конечно, STACL тоже делает ошибки, причем просить прощения за них робота еще не научили. Синхронный переводчик может извиниться за неудачную попытку перевода, а вот компьютерный — просто смолчит. На данный момент система не умеет замечать и поправлять собственные ошибки.

Тем не менее, разработанную систему можно настраивать, например устанавливать параметры скорости и точности — чем быстрее будет работать ИИ-переводчик, тем больше он станет допускать ошибок. Если нужна скорость — с этим можно смириться (ошибок, насколько можно понять, не так и много).

Кроме того, программную платформу можно дополнительно обучать, «натаскивать» на определенную тематику. К примеру, STACL можно обучить медицине, так что электронный переводчик практически не будет делать ошибок, занимаясь своей работой на какой-либо медицинской конференции. «Как и в случае любого переводчика — человека, наша система должна подготовиться к работе перед самим мероприятием, где нужен перевод», — говорит один из представителей проекта.

Представят электронного переводчика впервые на конференции Baidu World 1 ноября. На мероприятии система от Baidu будет переводить выступления некоторых спикеров. Разработчики утверждают, что STACL не предназначается для замены людей-переводчиков, особенно в ситуациях, когда точный перевод крайне важен. В конце концов, никому не хочется попасть в центр международного конфликта из-за того, что компьютерная система ошиблась и не заметила ошибки.

Цель разработки — предоставить пользователям личного синхронного переводчика, который всегда с собой. Ранее компания представила прототип пользовательского устройства, которое осуществляет перевод текста по предложениям, с новой платформой, надо думать, разработка гаджета ускорится.

Сейчас STACL умеет осуществлять перевод text-to-text и speech-to-text translation. Разработчики хотят добавить еще и направление speech-to-speech, чтобы все было уже совсем по-взрослому. Конечно, в этом случае все немного сложнее, но задача интересная, надо думать, инженеры Baidu могут решить проблему.

Комментарии (37)


  1. Vadem
    25.10.2018 14:21

    Skype, вроде, года три-четыре назад заявлял, что такое умеет.
    Я, правда, не слышал, чтобы кто-то этим пользовался.
    Возможно, в скайпе качество перевода плохое.
    Будем надеяться, что у Baidu лучше.


  1. GeMir
    25.10.2018 14:37

    не слышал, чтобы кто-то этим пользовался.
    На западе нет особой потребности — большинство хоть немного да говорит на английском. Но при этом почти никто не говорит на китайском, так что предприимчивым китайцам сервис будет как раз кстати.


    1. Lofer
      25.10.2018 17:36

      так что предприимчивым китайцам сервис будет как раз кстати.

      Китайский вариант «Эшелона» получил апдейт? Полагаю что китайская разведка будет просто в восторге от новой фичи:)


    1. aapazhe
      26.10.2018 00:42

      «На западе нет особой потребности — большинство хоть немного да говорит на английском.»

      Это не так.


  1. ni-co
    25.10.2018 14:37

    Голосовой переводчик c Т9 от Байду.
    " И пусть земля теперь тебе будет пуховик".
    Теперь голосом. :)


    1. Alcpp
      26.10.2018 02:33

      Теперь он это скажет даже не дослушав источник :)


      1. OnelaW
        26.10.2018 13:36

        Теперь он это скажет даже не дослушав источник, перебивая своими домыслами.


  1. agat000
    25.10.2018 15:24

    Интересно, как оно понимает жаргоны и сленги? И может ли на них ботать? Мат, опять же, которым некоторые не ругаются, а разговаривают. В китайском есть мат?


    1. Angmarets
      25.10.2018 15:58

      В китайском есть мат?

      Мне почему-то кажется, что языков, в которых нет мата, не существует. Хотелось бы услышать мнение экспертов на этот счет


      1. Here_and_Now
        25.10.2018 17:22

        А дайте определение «мат», общее для всех языков


        1. aapazhe
          26.10.2018 00:56

          …«Mat» is the term for vulgar, obscene, or profane language in Russian and some other Slavic language communities»…


          1. Here_and_Now
            27.10.2018 09:29

            Тогда, по определению, любые языки не входящие в группу «Russian and some other Slavic language communities» не будут иметь мата


      1. vitaliy2
        26.10.2018 15:36

        Наоборот. Русский мат есть только в русском языке. Ну и ещё в некоторых славянских. В других языках мата нет. Китайский вообще никакого отношения к русскому не имеет, поэтому мата в нём нет. Аналогично и с английским, японским, корейским и всеми другими языками.

        В Вашем случае хорошо срабатывает ошибка экстраполяции информации. Вы привыкли, что мат есть в Вашем языке, и думаете, что он есть во всех языках. А в реальности больше нет ни одного языка, в котором он есть =) (ну точнее есть в украинском и может ещё в каких-то славянских).


        1. stamir
          26.10.2018 16:25

          Речь шла не про русский мат в китайском языке, а про мат вообще (или скорее про обсценную лексику). Если уж так привязываться к слову мат, то как минимум есть латинский мат, а значит и в языках-наследниках (романская группа) тоже что-то есть.


          1. vitaliy2
            26.10.2018 17:31

            Даже название приведённой статьи неопределено. Наверху написано «Латинская нецензурная лексика», а чуть ниже «Латинский мат». Так нецензурная лексика или мат? На самом деле там просто опечатка, правильно «нецензурная лексика». Естественно, если посмотреть названия на других языках, то никакого мата там нет. Я исправил заголовок статьи на «Латинская брань».

            Речь шла не про русский мат, а про мат вообще
            В том то и дело, что мат бывает только русским.


        1. Angmarets
          26.10.2018 17:12

          Какой-то странный аргумент. Тогда у англичан и колен нет, у них есть только knees.


          1. vitaliy2
            26.10.2018 17:38

            Такое теоретически вполне может быть. Представьте, что knees обозначает область чуть ниже колен (колен в русском понимании). Тогда будет глупо говорить, что колени и knees — одинаковые понятия, ведь они обозначают разные вещи.

            Если кто хочет удивлений — в японском языке, кстати, нет слова Бог. А в русском нет слова «ками».

            Какой-то странный аргумент.
            Не вижу ничего странного. Как русский мат может быть, допустим, в английском языке? Это как «английское аниме», когда аниме — анимация, сделанная в Японии. Или как «временная прописка», когда прописка — это «постоянная регистрация». Выходит «временная постоянная регистрация», что немного бред, т.?к. непонятно, она в итоге временная или постоянная. Ну я понимаю, что люди ошибаются, просто нужно знать такие вещи =)


            1. Angmarets
              26.10.2018 19:05

              Тем не менее, из контекста вполне можно понять, что когда японец говорит «ками» в разговоре о Православной церкви(а она есть и в Японии), он имеет в виду наше понятие бога, а когда рассказывает сказку про золотой топор, который тоже достает «ками» из реки, то имеется в виду дух реки. Точно также здесь из контекста можно понять, что под матом имееться ввиду ненормативная лексика как таковая, а можно попытаться поумничать на пустом месте вместо того чтобы привести пример языков без ненормативной лекики, если такие существуют.


              1. vitaliy2
                26.10.2018 19:25

                имеется ввиду ненормативная лексика

                Дело в том, что мат и ненормативная лексика — сильно разные вещи. Мат имеет намного более экспрессивную окраску, намного сильнее табуирован. К примеру, мы не можем перевести «f**k» как «б***ь» (по крайней мере если хотим следовать оригиналу, а не сочинять свою интерпретацию произведения. Тем не менее, это не значит, что своя интерпретация — это плохо. Просто это другое. Это локализация, а не перевод).

                Когда кто-то говорит о «мате», он может иметь ввиду две вещи:

                1. Именно русский мат. Т.?е. мы чётко следуем определению «мат». В этом случае он есть только в русском и некоторых других славянских языках.
                2. Просто что-то похожее на мат. Возможно, такие языки существуют, но я их не знаю (скажите, кто знает). Английский, естественно, — не то. Там есть только аналог нашей ненормативной лексики (на ступень ниже мата).


                Поэтому более полно ответить на вопрос о мате можно так:

                1. Чисто формально мат присутствует только в русском и некоторых других славянских языках.
                2. Что-то похожее на мат, вероятно, тоже нет ни в одном другом языке, но я могу ошибаться. Если знаете примеры языков, я послушаю.
                3. Ненормативная лексика, скорее всего, присутствует в большинстве языков.
                4. Тем не менее, есть языки, в которых нет даже ненормативной лексики. Примером такого языка может служить японский. Тем не менее язык содержит некультурные слова (но, кстати, не содержит слов-оскорблений, которых в русском можно насчитать много десятков). Язык содержит грубые слова (например, «кисама» — очень грубое «ты»). Также язык содержит стили, непоощряющиеся обществом (язык гяру, язык янки).


                вместо того чтобы привести пример языков без ненормативной лекики, если такие существуют
                Я же привёл — японский.


                1. Angmarets
                  26.10.2018 19:42

                  К примеру, мы не можем перевести «f**k» как «б***ь» (по крайней мере если хотим следовать оригиналу, а не сочинять свою интерпретацию произведения. Тем не менее, это не значит, что своя интерпретация — это плохо. Просто это другое. Это локализация, а не перевод).

                  Я в таком случае не понимаю, что вы называете переводом? Дословное воспроизведение оригинала? Но в таком случае перевод не возможен в принципе, ну может между очень близкими языками. А ваш пример вполне себе годен при переводе восклицания человека, который попал по пальцу вместо гвоздя.

                  Английский, естественно, — не то

                  Не понимаю почему. Единственное чему там нет аналога — это х*й. Pr*c, c*ck или d*ck гораздо менее экспресивные. Однако c*nt и f*ck уже вполне на уровне.

                  но, кстати, не содержит слов-оскорблений, которых в русском можно насчитать много десятков

                  А как же «бака»?


                  1. vitaliy2
                    26.10.2018 19:54

                    Я в таком случае не понимаю, что вы называете переводом? Дословное воспроизведение оригинала? Но в таком случае перевод не возможен в принципе
                    А кто говорил, что он возможен? Правильный перевод в большинстве фраз невозможен. Ну конечно, как Вы и говорите, между близкими языками всё будет проще. Вы абсолютно правы.

                    А ваш пример вполне себе годен при переводе восклицания человека, который попал по пальцу вместо гвоздя.
                    Понимаете, он сказал именно «f**k», а не «б***ь». Это совсем разные слова.

                    Конечно, мы можем включить воображение и представить, а что же сказал бы русский человек на его месте. Взять какую-то условную выборку, например, 60% русских, и в своём воображении представить их реакцию. Но это уже будет локализация. Вместо того, чтобы говорить, что изначально написал автор, мы даём свою собственную интерпретацию произведения. Я не говорю, что это плохо. Часть людей могут любить перевод, часть локализацию, это субъективно. Лично я приверженец перевода, т.?к. хочу читать/слушать оригинал, а не собственную интерпретацию каких-то людей.

                    «Английский, естественно, — не то.» Не понимаю почему.
                    Я же объяснил, в английском есть только аналоги нашей ненормативной лексики (типа «с**а», «п***р», «х*р», «чёрт», «тр***ь»). Естественно, это тоже очень некультурные слова, и такие слова присутствуют как в английском, так и в русском. Но мат находится на ступень выше по некультурности.

                    А как же «бака»?
                    А это оскорбление?) Во многих случаях, наоборот, говорят с тёплым оттенком. Я бы перевёл это слово как «глупый». Ну или представьте влюблённых, которые никогда не говорили это слово =) Даже как-то неромантично выходит =) Но конечно зависит от интонации. Можно сказать с такой интонацией, что будет очень неприятно (в т.?ч. да, это уже будет оскорблением). Но само по себе «бака» всё-таки не оскорбление.

                    Если вспоминать оскорбления, может быть:

                    • «гедо:» — гад, плохой человек. Лёгкое оскорбление (как в русском гад).
                    • «биччи» — от англ. bitch, но здесь обычно чаще обозначает черту характера и используется как прилагательное. Оскорблением не является. При использовании как существительное тоже не так просто назвать оскорблением, т.?к. это скорее просто тип человека. Ну и нужно обратить внимание, что это слово с английского.


                    1. Angmarets
                      26.10.2018 20:17

                      Лично я приверженец перевода, т.?к. хочу читать/слушать оригинал, а не собственную интерпретацию каких-то людей.

                      Да ладно? Прям вот любите, когда «I'm going to kill you» — это «Я иду убить тебя», а «Я собираюсь убить тебя» — это «I'm compiling myself to kill you»? Потому что именно это, если я правильно понял, и есть перевод. А «I'm going to kill you»<->«Я собираюсь убить тебя» — это локализация, так как в английской версии нет ничего про собирание, а в русской — про хождение.

                      Но мат находится на ступень выше по некультурности.

                      Объясните, в каких ситуациях неуместна п**да, но уместна c*nt? И почему to f*ck someone это именно тр*хнуть кого-либо, а не вы*бать?

                      А это оскорбление?)

                      В той же мере, что и русское «дурак». Да, влюбленные иногда могут его использовать с нежностью, используя суфиксы — дурачок, дурашка. В Японии можно так же, не интонацией, а суфиксом(окончанием? Не знаю как эта часть слова у них называется) добавить явно негативную окраску — бакаяро.


                      1. vitaliy2
                        26.10.2018 21:22

                        Да ладно? Прям вот любите, когда «I'm going to kill you» — это «Я иду убить тебя», а «Я собираюсь убить тебя» — это «I'm compiling myself to kill you»? Потому что именно это, если я правильно понял, и есть перевод.
                        Нет, Вы неправильно поняли. В данном случае первый вариант — это неверный перевод, а второй — неплохо так верный. Под переводом я не имел ввиду «дословно». Дословный перевод — как раз таки абсолютно неверный. Я говорил о совсем других вещах — когда в оригинале написано одно, а в переводе совсем другая мысль — это уже не перевод, а локализация. А я люблю, когда передаётся одна и так же мысль, когда фраза несёт одни и те же оттенки, когда сохраняется интонация (а не так, что была интонация «я люблю тебя», а стало «я убью тебя» (ну это я конечно преувеличиваю)) и т.?д.

                        Просто зачастую переводчик хочет изменить произведение, можно сказать написать своё произведение. Как раз таки перевод «f**k» матом — это один из таких случаев. Кому-то нравится такое изложение автора, даже если в оригинале этого не было, а кому-то нет.

                        Объясните, в каких ситуациях неуместна п**да, но уместна c*nt?
                        Я не знаю слово c*nt, но f**k много где уместно, где б***ь неуместно. Аналогично т****ь много где уместно, где е***ь неуместно. Конечно, вы пытаетесь подловить на хитром. Потому что в немалой части будет неуместно как т****ь, так и е***ь. Но это же не значит, что это слова с одинаковой экспрессивной окраской.

                        В той же мере, что и русское «дурак».
                        Нет. Ну для начала какой у Вас уровень японского, чтобы понять, кто из нас лучше знает язык? У меня N3 (N2 не пробовал). Baka — глупый (можно смещать значение в разные стороны с помощью интонации).

                        бакаяро
                        Да, это грубее, чем бака. Но и даже это можно использовать без негативного оттенка. А можно ли использовать без негативного оттенка «дурак»?

                        PS. Я бы перевёл «бакаяро» как «дурень» (т.?е. засчитывается за оскорбление). Ну т.?е. да, какие-то оскорбления в японском есть (гедо:, бакаяро, биччи), но они достаточно лёгкие. Естественно, в культурном обществе даже лёгкие ругательства и оскорбления неприемлимы (даже цакать очень некультурно — люди не поймут XD).

                        суфиксом
                        Я бы сказал, это два разных слова.


                        1. Angmarets
                          26.10.2018 21:56

                          А я люблю, когда передаётся одна и так же мысль, когда фраза несёт одни и те же оттенки, когда сохраняется интонация (а не так, что была интонация «я люблю тебя», а стало «я убью тебя» (ну это я конечно преувеличиваю)) и т.?д.

                          Значит вы любите локализацию. Ведь если герой ударяет молотком по пальцу и говорит f*ck!, то бл*дь! как раз и будет сохранять все, что и в оригинале, кроме прямого значения — короткое, максимально нецензурное восклицание в ответ на боль. Но вы ранее называли это локализацией. А вот правильным переводом, по вашему, было бы восклицание «еб*ть!», которое вроде как несет тот же смысл, но не такое короткое, емкое и очень редко(если не никогда) используеться в данном контексте.

                          Возможно, я все еще путаюсь, что для вас перевод, а что локализация, но как вообще можно любить то, что невозможно?
                          А кто говорил, что он возможен? Правильный перевод в большинстве фраз невозможен.

                          Лично я приверженец перевода


                          Аналогично т****ь много где уместно, где е***ь неуместно. Конечно, вы пытаетесь подловить на хитром. Потому что в немалой части будет неуместно как т****ь, так и е***ь.

                          Я конечно пытаюсь подловить, но в то же время правда пытаюсь понять, что не так. Тут я конечно сужу по себе, но у меня есть по сути два круга людей — в обществе одних я не позволяю себе ни слова еб*ать ни т*рахать и т.д., в обществе других могу позволить все. Поэтому и допытываюсь, где та конкретная грань, когда одно уже нельзя, а другое — можно

                          Нет. Ну для начала какой у Вас уровень японского

                          Стремящийся к 0 :). Несколько запомнившихся слов из аниме — коничива, итадакимас, оиси, умаи, бака, комбава, иттекимас, иттерашай, ски, домо аригато гозаимас(и все комбинации), ну а также оманко, очинчин и прочие из ряда «вынь из меня это щупальце»

                          Ну т.?е. да, какие-то оскорбления в японском есть (гедо:, бакаяро, биччи), но они достаточно лёгкие.

                          С этим соглашусь

                          Я бы сказал, это два разных слова.

                          Тут уж вам точно виднее.


                          1. vitaliy2
                            26.10.2018 22:14

                            Но вы ранее называли это локализацией. А вот правильным переводом, по вашему, было бы восклицание «еб*ть!», которое вроде как несет тот же смысл, но не такое короткое, емкое и очень редко(если не никогда) используеться в данном контексте.
                            Нет, Вы абсолютно не поняли. е***ь было бы ещё в 100 раз хуже переводом. Правильно было бы «чёрт», «фак», «су*а», «твою мать». На самом деле нет, но намного лучше, чем б***ь. Переводить не мат матом я не приемлю. Потому что в оригинале не было мата. Я не спорю, что многие русские бы в этой ситуации сказали бы «б***ь», но ведь в оригинале чувак сказал другое.

                            Вы пытаетесь сказать, что я люблю дословный перевод. Конечно же нет, я его ненавижу) Если Вы до сих пор не поняли меня, я не знаю, как объяснить.

                            как можно любить то, что невозможно?
                            Ну в некоторых фразах возможно. А так приходится выбирать меньшее из зол (т.?е. фраза должна иметь самый хороший возможный перевод). А вообще любить невозможное можно, почему нет?

                            где конкретная грань, когда одно уже нельзя, а другое — можно
                            Ну вот даже здесь на Хабре я могу свободно написать слово «чёрт», а вот слово «т*****ь» уже вроде бы как и некультурно. Каждое слово имеет свой уровень культурности.

                            ну а также оманко, очинчин
                            Заметьте, добавлен префикс вежливости «о». Хороший перевод для этих слов «вагина», «пенис». Как в русском языке, от них лучше воздерживаться. Мало кто юзает в обычной жизни слово «пенис» — считается некультурно. Тем не менее, ругательством или нецензурным не является.

                            У меня уровень японского стремящийся к 0 :)
                            Ну вот. А как Вы тогда можете утверждать, как переводится слово?


                            1. Angmarets
                              26.10.2018 22:38

                              К примеру, мы не можем перевести «f**k» как «б***ь»

                              Но это уже будет локализация

                              Правильно было бы «чёрт», «фак», «су*а», «твою мать».

                              Я сейчас звездочким начну убирать из слов :). Это ж в какой вселенной черт, фак, твою мать — правильный перевод «f*ck»? Черт — эта та же самая локализация, только хуже, т.к. слово черт вообще не являеться нецензурным(возможно является богохульным). Фак — это вообще не перевод. Я конечно понимаю, что в наш век глобализации все знают что это, но мы так скатимся до клининг менеджеров, реплейсящих мерчандайзеров на найтшифте. Сука — возможно, но опять таки это не перевод а локализация. Переводом это было бы, если бы в оригинале было bitch

                              Тот же черт и твою мать воспитаный человек(но не пуританин) может сказать при своих детях, а вот f*ck — не может. Я бы сказал черт будет хорошим переводом для God damn it — сохраняеться и цензурность и богохульство.

                              Ну вот даже здесь на Хабре я могу свободно написать слово «чёрт», а вот слово «т*****ь» уже вроде бы как и некультурно. Каждое слово имеет свой уровень культурности.

                              Я это понимаю. Я пытаюсь придумать или вышаманить из вас эти уровни культурности. Особенно между тр*хать и еб*ть, а также между п**да и c*nt. Какой нибудь пример из жизни, что есть вот такая категория людей, которым я одно могу сказать, а другое нет.

                              Тем не менее, ругательством или нецензурным не является.

                              Об этом я знаю, поэтому и не привел их в качестве ругательств. Просто похвастался знанием.

                              Ну вот. А как Вы тогда можете утверждать, как переводится слово?

                              из субтитров и контекста


                              1. vitaliy2
                                26.10.2018 22:54

                                Это ж в какой вселенной черт, фак, твою мать — правильный перевод «f*ck»?
                                А я и не сказал, что это правильный. Цитирую:
                                На самом деле нет
                                А в какой вселенный правильный перевод «б***ь»? Почему у Вас герой стал вдруг материться?
                                Сука — возможно, но опять таки это не перевод а локализация.
                                Перечитайте мой коммент, я сам отметил, что это всё неверные переводы. Просто из нескольких зол выбрал наименьшие. А что делать? :(
                                Поэтому я и сказал, что правильный перевод обычно невозможен.

                                Я пытаюсь придумать или вышаманить из вас эти уровни культурности. Особенно между тр*хать и еб*ать
                                Между тр**ать и е**ть огромная пропасть. Как минимум первое — не мат, а второе — мат. Если Вы её не чувствуете, значит у Вас не до конца хорошее понимание русского.

                                Какой нибудь пример из жизни, что есть вот такая категория людей, которым я одно могу сказать, а другое нет.
                                Примеры — печатная литература, чаты в интернете, комментарии в интернете, телевидение, радио. Во многих таких местах мат недопустим вообще, а вот нецензурная лексика может быть, к примеру «крайней нежелательной», «нежелательной» или даже «разрешённой» или с меньшим наказанием.

                                Может влиять на возрастные рейтинги.

                                Другой пример — если бы моя девушка сказала бы «е***ь», я бы её бросил (по крайней мере если это регулярно), а если бы «т****ь», то нет.

                                А как Вы тогда можете утверждать, как переводится слово?
                                — из субтитров и контекста
                                А я могу из многолетнего знания японского. Впрочем, у нас и в русском есть разногласия — как я понял, Вы не можете в обычной речи отличить мат от не мата. Для меня эта разница колоссальна.


                                1. Angmarets
                                  26.10.2018 23:43

                                  Почему у Вас герой стал вдруг материться?

                                  потому что вы так и не привели пример ситуации, в которой бл*дь — слишком грубое, а f*ck — допустимое.

                                  Как минимум первое — не мат, а второе — мат.

                                  Итого разница в определении?

                                  Примеры — печатная литература, чаты в интернете, комментарии в интернете, телевидение, радио.
                                  О, вот так уже интересней.
                                  Так тогда f*ck это мат, т.к. во всех этих местах он недопустим вообще.

                                  Другой пример — если бы моя девушка сказала бы «е***ь», я бы её бросил (по крайней мере если это регулярно), а если бы «т****ь», то нет.

                                  ок. А вот теперь такой вопрос. Если вы вдруг станете жить в англоязычной стране(может вы кончно уже там) и она будет часто говорить f*ck — бросите или нет?

                                  А я могу из многолетнего знания японского.

                                  А я с вами и не спорил по поводу значения этого слова.


                                  1. vitaliy2
                                    26.10.2018 23:52

                                    ок. А вот теперь такой вопрос. Если вы вдруг станете жить в англоязычной стране(может вы кончно уже там) и она будет часто говорить f*ck — бросите или нет?
                                    Шансы в несколько раз ниже. Но остаются высоки чисто из моих вкусовых предпочтений — я люблю каваии, а если мы говорим об Америке, то там и без всяких факов кавай менее распространён. Но если представить, что она будет кавайная, но будет говорить f**k, то вряд ли брошу. Точнее я бы просто попросил, чтобы она так не говорила. А вот с «б***ь» шансов на успех уже точно мало.


    1. vitaliy2
      26.10.2018 15:35

      В китайском языке нет мата. Русский мат существует только в русском и некоторых других славянских языках (например, украинском). Ни в одном другом языке русского мата нет (не даром же ведь он называется «русский мат»).

      Конечно может быть ненормативная лексика — некультурные слова, которые к мату никакого отношения не имеют, но во многих случаях произносить их будет неуместно и некультурно. Впрочем, существуют языки, в которых даже ненормативной лексики нет или почти нет (японский). Про другие не скажу. Ну в английском, естественно, есть.


  1. Lazytech
    25.10.2018 15:31

    Нашел статью на английском, где более подробно освещается реализованный способ перевода:
    Baidu Announces Breakthrough in Simultaneous Translation


  1. barbanel
    25.10.2018 16:44

    А как будет зваться ИИ от Baidu русской локализации?

    — Ну чо, Обалдуй, поехали домой!
    — Моя твоя не пониматинама!
    /сарказм =)


  1. saboteur_kiev
    26.10.2018 00:49

    А как этот ИИ будет переводить анекдоты, у которых обычно встречается неожиданный конец?


    1. GeMir
      26.10.2018 01:42

      А как этот ИИ будет переводить анекдоты
      Что-то мне говорит о том, что на переговорах, на которых присутствуют упомянутые в статье «синхронисты» (которых предлагается заменить AI), мат и анекдоты не так часто встречаются.


      1. roscomtheend
        26.10.2018 13:07

        Не шибко любимая мной, но часто упоминаемая фраза Лаврова будет переведена как «наши партнёры».


  1. Alcpp
    26.10.2018 02:37

    Даже не указано какие языки лучше всего переводит.


  1. scifinder
    26.10.2018 06:37

    speech-to-speech

    Вот это я жду с нетерпением.