Программа использует передовые ИИ-технологии, но простейшие тесты говорят о том, что ей ещё далеко до реального понимания




Автор статьи — Дуглас Ричард Хофштадтер — американский физик и информатик; сын лауреата Нобелевской премии по физике Роберта Хофштадтера. Получил всемирную известность благодаря книге «Гёдель, Эшер, Бах: эта бесконечная гирлянда», опубликованной в 1979 году и в 1980 году получившей Пулитцеровскую премию в категории «Нехудожественная литература».

Как-то в воскресенье на еженедельных занятиях сальсой мой друг Фрэнк привёл с собой гостью из Дании. Я знал, что Фрэнк неплохо говорит на датском, поскольку его мать родом оттуда и он ребёнком жил в Дании. Подруга его бегло говорила по-английски, что для скандинавских стран считается нормой. Однако, к моему удивлению, в процессе общения выяснилось, что эта парочка обычно обменивается электронными письмами, переведёнными Google Translate (GT). Фрэнк пишет сообщение на английском, прогоняет через GT, чтобы получить текст на датском; она, наоборот, пишет по-датски, а затем позволяет GT перевести текст на английский. Как странно! Зачем же двум умным людям, говорящим на языке друг друга, заниматься такими вещами? Мой опыт использования ПО для машинных переводов всегда приводил меня к скептическим оценкам его возможностей. Но эти двое явно не разделяли мой скептицизм. Многие интеллигентные люди очарованы возможностями программ-переводчиков, и находят мало поводов для их критики. Это меня поражает.

Я люблю языки и со всей страстью занимаюсь переводами. Я специалист по когнитивистике и всю жизнь интересовался тонкостями работы человеческого разума, поэтому уже десятилетиями слежу за механизацией переводов. Впервые я заинтересовался этим вопросом в середине 1970-х, когда наткнулся на письмо от 1947 года, написанное математиком Уорреном Уивером, ранним сторонником машинных переводов, адресованное основоположнику кибернетики Норберту Винеру, в котором Уивер сделал интересное заявление, довольно знаменитое в наши дни:
Когда я смотрю на русскую статью, я говорю: «Это на самом деле написано по-английски, просто зашифровано при помощи странных символов. А теперь я перейду к расшифровке».
Через несколько лет он предложил уже другую точку зрения: «Ни один разумный человек не будет считать, что машинный перевод когда-нибудь сможет достичь элегантности и стиля. Пушкину не стоит бояться». Я вспоминаю один незабываемый напряжённый год жизни, потраченный мною на перевод блестящего романа в стихах Александра Пушкина «Евгений Онегин» на свой родной язык (я радикально переработал величайшее русское произведение, превратив его в английскую повесть в стихах), и нахожу это замечание Уивера гораздо более верным, чем первое, демонстрировавшее до странности упрощённое представление о языках. Тем не менее, его взгляд от 1947 года на перевод как расшифровку стал девизом, долгое время направлявшим область машинного перевода.

С тех пор машинные переводы постепенно улучшались, а недавно использование т.н. «глубинных нейросетей» даже привело некоторых наблюдателей к мысли (см. статьи "Великое пробуждение ИИ" и "Машинный перевод: за пределами Вавилона"), что люди-переводчики — это вымирающий вид. При таком развитии событий люди, работающие переводчиками, через несколько лет превратятся в простых контролёров качества и корректоров мелких ошибок, и не будут выдавать свежие тексты целиком.

Такой сценарий вызвал бы у меня сокрушительный духовный переворот. Хотя я понимаю стремление научить машины хорошо переводить тексты, я вовсе не хочу увидеть, как людей-переводчиков заменят мёртвые машины. Эта идея пугает меня и вызывает отвращение. По-моему, перевод — невероятно утончённое искусство, постоянно требующее многих лет опыта и творческого воображение. Если в один «прекрасный» день люди-переводчики станут реликвиями прошлого, моё уважение к человеческому разуму будет поколеблено, и этот шок оставит меня в невероятном смятении и грусти.

Каждый раз, читая статью о том, как гильдия людей-переводчиков вскоре будет вынуждена склонить голову перед страшно быстрым мечом той или иной новой технологии, я чувствую необходимость проверить эти заявления самостоятельно, в частности из-за боязни того, что этот кошмар уже подошёл очень близко, а также из-за надежды и стремления убедить себя в том, что он не так уж и близок, и, наконец, из-за моего давнего убеждения в необходимости бороться с преувеличением достижений ИИ. Поэтому, почитав про то, как старая идея искусственных нейросетей, недавно принятая на вооружение подразделением компании Google под названием Google Brain, и улучшенная при помощи «глубинного обучения», привела к появлению программы нового типа, якобы произведшей «революцию» в машинных переводах, я понял, что мне нужно проверить последнюю версию GT. Правда ли она изменила область переводов так, как удалось это сделать Deep Blue и AlphaGo в области таких почтенных игр, как шахматы и го?

Я узнал, что хотя старая версия GT работала с очень большим ассортиментом языков, новая сначала работала всего с девятью — правда, потом расширила набор до 96. Я ограничил свои исследования такими поддерживаемыми языками, как английский, французский, немецкий и китайский [для интереса добавим и русский язык / прим. перев.]

Перед демонстрацией открытий стоит упомянуть двусмысленность слова «глубинный». Когда человек слышит о том, как Google купила компанию DeepMind, выпускавшую «глубинные нейросети» с «глубинным обучением», он сразу же воспринимает эти названия в значениях вроде «выдающийся», «способный на многое», «проницательный», «мудрый». При этом слово «глубинный» обозначает лишь тот факт, что у этих нейросетей слоёв больше (допустим, 12), чем у более старых вариантов, у которых их могло быть два или три. Следует ли из такой глубины, что такая сеть обладает какой-то мудростью? Навряд ли. Это словесный пиар.

Я с большим подозрением отношусь к GT, особенно из-за окружающей его шумихи. Но, несмотря на неприязнь, я признаю существование удивительных фактов, связанных с этим нелюбимым мною продуктом. Он доступен любому человеку на Земле совершенно бесплатно, и может преобразовывать текст на любом из почти сотни языков в текст на любом другом языке. Это достойно уважения. Если я с гордостью называю себя «пи-язычным» (то есть, в сумме количество известных мне языков немного превышает три — это мой шутливый способ отвечать на вопрос, «Сколько языков ты знаешь»), тогда насколько же сильнее может гордиться собой GT, если он может называть себя «бай-язычным» («бай» на мандаринском означает 100). Пиязычного человека весьма впечатляет байязычность. Более того, Если я скопирую страничку на языке А в GT, то на получение странички из слов на языке Б уйдёт всего несколько секунд. И всё это происходит постоянно, на экранах по всей планете, на десятках языков.

Практическую пользу GT и похожих технологий нельзя отрицать, и в принципе, они приносят нам пользу, но в таком подходе всё же чего-то явно не хватает, и это можно описать одним словом: понимание. Машинный перевод никогда не концентрировался на понимании языка. Вместо этого в этой области всегда пытались заниматься «расшифровкой» — то есть, справиться с задачей, не заморачиваясь тем, что такое понимание и смысл. Может ли оказаться так, что для осуществления хорошего перевода понимание не нужно? Может ли некто, человек или машина, выдавать перевод высокого качества, не обращая внимания на смысл языка? Чтобы пролить свет на этот вопрос, обратимся к проделанным мною экспериментам.

* * *

Начну свои изыскания со скромных примеров — с короткой ремарки, которая сразу вызывает чёткое представление у человека:
In their house, everything comes in pairs. There’s his car and her car, his towels and her towels, and his library and hers.

Перевод GT:
В их доме все приходит парами. Там его машина и ее машина, полотенца и полотенца, а также его библиотека и ее.

Перевод человека:
В их доме у всего есть своя пара. Есть его машина, и её машина, его полотенца и её полотенца, его библиотека и её.
Задача перевода кажется недвусмысленной, но в французском языке (и других романских языках) слова «его» и «её», обозначающие вещи, ставятся не в роде владельца, а в роде самой вещи. Вот что выдал мне GT:
Dans leur maison, tout vient en paires. Il y a sa voiture et sa voiture, ses serviettes et ses serviettes, sa bibliotheque et les siennes.
Программа попалась в мою ловушку, не поняв, как понял бы любой человек, что я описывал пару, у которой для каждой его вещи была и её вещь. К примеру, нейросеть с глубинным обучением использовала слово sa как для его машины, так и для её машины, поэтому о поле владельца машины мы ничего сказать не можем. Точно так же она использовала бесполое слово ses для множественного числа «его полотенец» и «её полотенец», а в последнем случае, с библиотеками, её сбила с толку последняя буква s в hers, и она как-то решила, что тут s обозначает множественное число (les siennes). Предложение, переведённое GT на французский, потеряло смысл.

Затем я сам перевёл эту фразу на французский, так, чтобы в ней сохранился первоначальный смысл. Вот моя версия:
Chez eux, ils ont tout en double. Il y a sa voiture a elle et sa voiture a lui, ses serviettes a elle et ses serviettes a lui, sa bibliotheque a elle et sa bibliotheque a lui.
Фраза sa voiture a elle обозначает «её машину», а sa voiture a lui — его машину. После этого я решил, что для GT будет тривиальной задачей перевести мой французский перевод обратно на английский и получить правильную английскую версию — но я жестоко ошибался. Вот, что он мне выдал:
At home, they have everything in double. There is his own car and his own car, his own towels and his own towels, his own library and his own library.
Что, простите? Даже несмотря на то, что входное предложение недвусмысленно заявляет о поле владельцев, переводящая машина проигнорировала эти заявления и приписала всё мужскому полу. Почему она выбросила самую важную информацию из предложения?

Людям известно много всякого о парах, домах, личных вещах, гордости, соперничестве, ревности, личной жизни, и множестве других неосязаемых вещей, приводящих к таким капризам, как полотенца с вышивкой «его» и «её». GT такие тонкости неизвестны. GT вообще неизвестны тонкости. Ему знакомы только строчки, состоящие из слов, состоящих из букв. Он занимается сверхбыстрой обработкой кусков текста, он не думает, не представляет, не вспоминает, не понимает. Он даже не знает, что слова обозначают вещи. Спешу заявить, что в принципе, компьютерная программа могла бы узнать, зачем нужен язык, и у неё могли бы быть идеи, память и опыт, и она могла бы их использовать — но GT разработана не для этого. Таких целей не было в планах его разработчиков.

В общем, я посмеялся над результатами, с облегчением увидев, что мы ещё не подошли близко к тому, чтобы заменить переводчиков машинами. Но мне всё же казалось, что стоит изучить машину подробнее. Одним глотком жажды не утолить.

И кстати, как насчёт этой фразы — «одним глотком жажды не утолить» (намекающей, конечно, на поговорку «одна ласточка весны не делает»? [англ. one swallow does not a summer make — слово swallow переводится и как «глоток», и как «ласточка». В английском варианте одна ласточка не делает лета. / прим. перев.] Не мог удержаться, чтобы не проверить. И вот, что мне выдал GT: " Une hirondelle n’aspire pas la soif" [по-русски GT выдал «одна ласточка не утоляет жажду» / прим. перев.]. Грамматически это предложение французское, но понять его тяжело. Сначала там упоминается птица (une hirondelle — ласточка), затем говорится, что птица не вдыхает, или не всасывает (n’aspire pas), и наконец, указывается, что то, что не всасывает птица — это жажда (la soif). GT явно не понял смысла фразы — просто выдал кучу бычьего дерьма. “Il sortait simplement avec un tas de taureau.” “He just went out with a pile of bulls.” “Il vient de sortir avec un tas de taureaux.” Простите мой французский — или, точнее, псевдо-французский GT.

* * *

Из огня французского прыгнем в полымя немецкого. В последнее время я погружён в книгу Sie nannten sich der Wiener Kreis (Они называли себя Венским кружком) австрийского математика Карла Зигмунда. Она описывает группу идеалистов-интеллектуалов из Вены 1920-1930-х, серьёзно повлиявших на философию и науку во второй половине XX века. Я выбрал небольшое предложение из книги Зигмунда и дал его GT. Вот оно, сначала по-немецки, затем идёт мой перевод, потом — GT. (Я, кстати, проверил мой перевод у двух носителей немецкого, включая Карла Зигмунда — так что можно считать его точным).
Зигмунд:

Nach dem verlorenen Krieg sahen es viele deutschnationale Professoren, inzwischen die Mehrheit in der Fakultat, gewisserma?en als ihre Pflicht an, die Hochschulen vor den “Ungeraden” zu bewahren; am schutzlosesten waren junge Wissenschaftler vor ihrer Habilitation. Und Wissenschaftlerinnen kamen sowieso nicht in frage; uber wenig war man sich einiger.

Хофштадтер:

After the defeat, many professors with Pan-Germanistic leanings, who by that time constituted the majority of the faculty, considered it pretty much their duty to protect the institutions of higher learning from “undesirables.” The most likely to be dismissed were young scholars who had not yet earned the right to teach university classes. As for female scholars, well, they had no place in the system at all; nothing was clearer than that.

Google Translate:

After the lost war, many German-National professors, meanwhile the majority in the faculty, saw themselves as their duty to keep the universities from the “odd”; Young scientists were most vulnerable before their habilitation. And scientists did not question anyway; There were few of them.

GT, русский:

После проигранной войны многие немецко-национальные профессора, теперь большинство на факультете, считали своим долгом защищать университеты от «странных»; наиболее уязвимыми были молодые ученые до их абилитации. И женщины-ученые все равно не сомневались; их было несколько.

Человеческий русский:

После поражения многие профессора, склонные к немецкому национализму (а их к тому времени в руководстве факультета было большинство), сочли своим долгом защищать высшие учебные заведения от «нежелательных элементов». Вероятнее всего могли получить отказ молодые научные работники, пока не заслужившие права преподавать. Для научных работников женского пола места в этой системе вообще не было; это было яснее ясного.
Перевод GT состоит из английских слов (пусть, по непонятным причинам, парочка из них почему-то начинается с большой буквы). Пока неплохо! Но вскоре весь перевод начинает расплываться, и чем дальше, тем он становится расплывчатее.

Возьмём сначала the “odd” [англ. odd — странный, нечётный, непарный]. Это соответствует немецкому die 'Ungeraden', означающему «люди, нежелательные по политическим мотивам». Но у GT была причина — чистая статистика — использовать слово «odd». А именно: в его огромной двуязычной базе данных слово ungerade почти всегда переводится, как odd. Хотя машина и не понимает, почему так, я могу объяснить. Всё оттого, что ungerade — буквально означающее «непрямой» или «неровный» — почти всегда означает «нечётный». А мой выбор слова undesirables [нежелательные элементы] не имеет ничего общего со статистикой слов, а происходит из моего понимания ситуации — понимания идеи, не указанной в тексте напрямую, и не присутствующей в списке вариантов перевода слова ungerade ни в одном из немецких словарей.

Перейдём к Habilitation, обозначающий статус преподавателя, напоминающий штатного сотрудника института. Английская калька habilitation [получивший квалификацию] существует, но используется крайне редко, и уж точно не напоминает о штатных сотрудников. Поэтому я кратко пояснил эту идею, а не стал просто использовать редкое слово, потому что такой механический подход ничего не дал бы англоязычным читателям. Конечно, GT никогда такого не сделает, у него нет модели знаний его читателей.

Последние два предложения чётко демонстрируют критическую важность понимания для правильного перевода. Немецкое слово из 15 букв Wissenschaftler означает «учёный» или «научный работник» [“scientist” / “scholar”]. Я выбрал последний вариант, так как он обозначает всех интеллектуалов в общем. GT не распознал этих тонкостей. Связанное с ним слово из 17 букв Wissenschaftlerin в заключительном предложении, стоящее во множественном числе, Wissenschaftlerinnen — последствие употребления родов в немецких существительных. Короткое существительное грамматически относится к мужскому роду, поэтому означает мужчину-научного работника, а длинное — к женском, и применимо только к женщинам. Поэтому я написал «научных работников женского пола». GT, тем временем, не понял, что главным в предложении был женский суффикс -in. Поскольку он не понял, что женщин исключили из рассмотрения, машина просто ещё раз использовала слово «учёный», совершенно упустив весь смысл предложения [интересно, что GT на русский перевёл это более верно / прим. перев.]. Как и в случае с французским, у GT не было ни малейшего представления о том, что единственной целью немецкого предложения было выявить контраст между мужчинами и женщинами.

Ну и кроме этой ошибки, остаток последнего предложения — это полный кошмар. Возьмём первую часть. Неужто “scientists did not question anyway” правда будет переводом “Wissenschaftlerinnen kamen sowieso nicht in frage”? Они совершенно не совпадают по смыслу. Предложение просто состоит из английских слов, понадёрганных на основании немецких. И что, этого достаточно для того, чтобы описать некий выходной текст, как «перевод»? [в варианте перевода на русский кошмар сохраняется / прим. перев.]

Вторая часть настолько же ошибочна. Последние шесть слов по-немецки буквально означают «мало над чем были более объединены», или, более гладко, «мало существовало тем, по поводу которых согласие людей было сильнее» [“over little was one more united” / “there was little about which people were more in agreement”] — однако GT превратил эту ясную идею в «их было несколько» [в английском и русском примерно одинаково / прим. перев.]. Озадаченные люди могут спросить «кого было несколько?», но для механического слушателя этот вопрос не имел бы смысла. У GT нет идей о происходящем за кулисами, и он никак не смог бы ответить на такой, вроде бы простой, вопрос. Программа перевода не представляла себе большие или малые количества или числа или вещи. Она просто швырялась символами, без малейшего понятия о том, что они могут что-то символизировать.

* * *

Человеку, всю жизнь набиравшему опыт, понимание, и использовавшему слова осмысленно, очень сложно понять, насколько лишены содержимого слова, выбрасываемые на экран машиной GT. Людям почти невозможно устоять перед предположением, что ПО, так хорошо работающее со словами, должно понимать их значение. Эта классическая иллюзия, связанная с ИИ, называется "эффектом Элизы", поскольку одной из первых программ, заставивших людей поверить в то, что она вроде бы понимает английский, ещё в 1960-х годах стала бесполезный манипулятор фразами «ELIZA», притворявшийся психотерапевтом. У многих людей, взаимодействовавших с программой, создавалось сверхъестественное ощущение того, что она понимает их глубинные чувства.

Десятилетиями умные люди — даже исследователи ИИ — попадали под влияние эффекта Элизы. Чтобы мои читатели не попали в эту ловушку, позвольте мне процитировать некоторые фразы из текста выше — «GT не понимал», «не осознавал», «У GT не было ни малейшей идеи». Парадоксально, что, хотя эти фразы твердят об отсутствии понимания, они почти что намекают на то, что GT может, хоть иногда, понимать значение слова, фразы или предложения. Но это не так. GT просто обходит вопрос понимания языка.

Для меня слово «перевод» обладает загадочной аурой, навевающей воспоминания. Оно обозначает чрезвычайно человеческий вид искусства, грациозно превращающий чёткие идеи языка А в чёткие идеи языка Б. Это налаживание контактов не только должно поддерживать ясность, но и передавать оттенки, нюансы и отличительные особенности стиля письма изначального автора. Когда я занимаюсь переводом, я сначала тщательно читаю оригинальный текст, усваиваю идеи как можно яснее, позволяю им побултыхаться в моём сознании. В сознании бултыхаются не слова — идеи, вызывающие всяческие связанные с ними идеи, создающие богатое гало из сопутствующих сценариев в моей голове. Большая часть этого гало, конечно, находится в бессознательном. Только когда гало в моём сознании достаточно пробудится, я начинаю пытаться его выразить — «выдавить» — на втором языке. Я пытаюсь сказать на языке Б то, что мне кажется естественным для языка Б способом говорить о таких ситуациях, из которых состоит гало смысла, о котором идёт речь.

В общем, я не перехожу от слов и фраз языка А в слова и фразы языка Б. Вместо этого я бессознательно вызываю образы, сцены, идеи, имеющийся у меня опыт (или опыт, о котором я читал, видел в кино, слышал от друзей), и только когда это невербальное, образное, опытное, мысленное «гало» — только тогда я запускаю процесс формулирования слов и фраз в целевом языке, а потом редактирую, редактирую и редактирую. Этот процесс, посредником которого служит смысл, может казаться медлительным — и, разумеется, по сравнению с двумя секундами на страницу у GT он такой и есть — но именно его использует любой серьёзный переводчик. Что-то подобное я представляю себе, когда слышу фразу «глубинный разум».

* * *

Учтя всё это, перейду к китайскому — языку, гораздо сильнее напрягающему ПО с глубинным обучением, чем это делают два европейских языка. Для проверки я избрал трогательные мемуары Women Sa («Мы втроём») — китайского драматурга и переводчика Ян Цзян, недавно умершей в возрасте 104 лет. В книге она вспоминает переплетения жизней её самой, её мужа Цянь Чжуншу (тоже писателя и переводчика) и их дочки. Написана она не особенно замысловато, но использует живой и высокообразованный китайский язык. Я выбрал небольшой пассаж и натравил на него GT. Вот результаты, вместе с моим переводом:
Ян:

??????????,????????????,????,????? ????????
??????????????????????????????????????
????,???,?????????????????????,????????:

??????“?????”??????????,????,?????

Хофштадтер:

After Zhongshu had worked at Tsinghua University for a year, he was transferred to the committee that was translating selected works of Chairman Mao. He lived in the city, but each weekend he would return to school. He also was still supervising his graduate students.
The leader of the translation committee of Mao’s works was Comrade Xu Yongying, and the person who had arranged for Zhongshu to do this work was his old Tsinghua schoolmate, Comrade Qiao Guanhua.
On the day this appointment was decided, after dinner, an old friend specially hired a rickshaw and came all the way from the city just to congratulate Zhongshu. After our guest had left, Zhongshu turned to me uneasily and said:
“He thought I was going to become a ‘South Study special aide.’ This kind of work is not easy. You can’t hope for glory; all you can hope for is to do it without errors.”

Google Translate:

After a year of work at Tsinghua, he was transferred to the Mao Translating Committee to live in the city and back to school on weekends. He is still a graduate student.
The leadership of the Mao Tse Translation Committee is Comrade Xu Yongjian. Introduction to the book to do this work is Tsinghua students Qiao Guanhua comrades.
On the day of the event, after dinner, an old friend hired a rickshaw from the city to congratulate. Guest to go, the book of fear in the book said to me:
He thought I had to do “South study walking.” This is not a good thing to do, not for meritorious service, but for nothing.

GT, русский:

После одного года работы в Университете Цинхуа Чжун Шу был переведен в комиссию по переводу Мао, чтобы жить в городе и вернуться в школу по выходным. Он по-прежнему занимает пост аспиранта.
Лидером избранного Комитета перевода Мао является товарищ Сюй Юнлян. Представляя Чжун Шу, чтобы выполнить эту работу, является одноклассник Цинхуа Цяо Гуанхуа.
В назначенный день, после обеда, старый друг нанял рикшу, чтобы приехать из города, чтобы поздравить. После того, как гости ушли, книга Чжун сказала мне в страхе:
Он подумал, что мне нужно сделать «южную прогулку». Это нехорошо.

Человеческий:

Когда Чжуншу год проработал в университете Цинхуа, его перевели в комитет, занятый переводами работ председателя Мао. Он жил в городе, но каждые выходные возвращался в школу. Кроме того, он всё ещё руководил своими аспирантами.
Лидером комитета по переводу работ Мао был товарищ Сюй Юнлян, а устроил Чжуншу на эту должность его старый однокурсник по Цинхуа, товарищ Цинхуа Цяо Гуанхуа.
В день, когда это назначение было утверждено, после ужина старый друг специально нанял рикшу и приехал из города только для того, чтобы лично поздравить Чжуншу. После ухода гостя Чжуншу повернулся ко мне, и сказал обеспокоенно:
Он думал, я стану «особым помощником из Южного кабинета». Это сложная работа. Надеяться на славу не приходится; остаётся только надеяться на отсутствие ошибок.
Кратко опишу странности. Во-первых, GT ни разу не упомянул Чжуншу по имени, хотя его имя (“??”) трижды встречается в оригинале. Сначала машина использует местоимение «he», второй раз пишет the book [книга], а третий — the book of fear in the book [книга страха в книге]. Поди догадайся! [в русском варианте загадочная «книга» появляется один раз / прим. перев.]

Вторая странность — в первом параграфе чётко указано, что Чжуншу руководит аспирантами, однако GT его самого сделал аспирантом.

Третья странность — в фразе Mao Tse Translation Committee [комитет перевода Мао Цзэдуна] треть имени председателя Мао [Mao Tse Tung] куда-то отвалилась.

Четвёртая странность — имя Yongying заменено на Yongjian.

Пятая странность — after our guest had left [после ухода нашего гостя] заменили просто на guest to go [гость идти].

Шестая странность — последнее предложение вообще лишено смысла.

Шести этих странностей уже хватает для того, чтобы пристыдить GT, но простим их и забудем. Лучше сфокусируемся на сбивающей с толку фразе, которую я встретил в тексте — фразе из пяти символов, заключённых в кавычки из последнего параграфа (“?????”). Посимвольно её можно перевести как «южная комната книг идти прогуляться», но это явно неприемлемо, особенно поскольку по контексту это должно быть существительное. GT изобрёл «ходящий южный кабинет», и это не помогло.

Признаю, что китайская фраза для меня была совершенно непонятной. Буквально она значила что-то вроде движения пешком в кабинете на южной стороне некоего здания, но я знал, что это неверно — в контексте это не имело смысла. Для перевода мне нужно было найти что-то неизвестное мне в китайской культуре. И куда я обратился за помощью? К Google! (Но не к Google Translate). Я ввёл китайские символы, окружил кавычками, запустил поиск по точному совпадению. И на экран сломя голову выскочила куча веб-страниц на китайском, после чего я мучительно продирался через первые параграфы парочки первых сайтов, пытаясь понять смысл фразы.

Я обнаружил, что этот термин восходит к династии Цин (1644–1911), и обозначает работника умственного труда, помогавшего императору составлять стильные официальные сообщения, и работавшего в южном кабинете императорского дворца. Два символа, якобы обозначающие «идти прогуляться», на самом деле обозначают помощника. Поэтому, с помощью информации из поиска Google, я придумал фразу «особый помощник из южного кабинета».

Жаль, что GT сам не может воспользоваться сервисом Google Search, как это сделал я. Но опять-таки, GT не способен понять веб-страницы, хотя способен перевести их в мановение ока. Или может? Дальше я привожу удивительный фрагмент текста, который GT мгновенно выбросил мне на экран после того, как я скормил ему начало веб-сайта, с которого я получил нужную информацию:
“South study walking” is not an official position, before the Qing era this is just a “messenger,” generally by the then imperial intellectuals Hanlin to serve as. South study in the Hanlin officials in the “select chencai only goods and excellent” into the value, called “South study walking.” Because of the close to the emperor, the emperor’s decision to have a certain influence. Yongzheng later set up “military aircraft,” the Minister of the military machine, full-time, although the study is still Hanlin into the value, but has no participation in government affairs. Scholars in the Qing Dynasty into the value of the South study proud. Many scholars and scholars in the early Qing Dynasty into the south through the study.
Это вообще по-английски? Мы, конечно, все можем согласиться с тем, что текст состоит из английских слов (по большей части), но следует ли из этого, что это английский текст? По-моему, раз в приведённом параграфе нет смысла, это не английский; это просто беспорядочно расставленные английские ингредиенты — случайный салат из слов, бессвязная мешанина.

На случай, если вам интересно — вот моя версия данного пассажа (я корпел над ней несколько часов):
Должность «нан шу фан сяон зу» (особый помощник из Южного кабинета) была не официальной, но в ранней династии Цин это была особая роль, которую обычно играл текущий придворный учёный. Группа учёных, работавших в южном кабинете имперского дворца, выбирала из своей среды человека великих талантов и хорошей репутации, дабы он писал речи для императора и всегда был у него на посылках; поэтому эта роль называлась «особый помощник из Южного кабинета». Помощник, будучи приближен к императору, очевидно был способен влиять на его политические решения. Однако, после того, как император Юнчжэн основал военное министерство, с министром и различными его подчинёнными, помощник из Южного кабинета, несмотря на службу императору, перестал играть главную роль в принятии правительственных решений. Тем не менее, учёные мужи династии Цин изо всех сил стремились к славе этой должности, и в ранние годы династии особыми помощниками были несколько знаменитых учёных.
Некоторые читатели могут заподозрить, что я, в целях жёсткой критики GT специально подбирал такие пассажи, на которых он активно спотыкался, и что на самом деле он гораздо лучше справляется с большинством текстов. Это звучит правдоподобно, но это не так. Почти каждый параграф, выбранный мною из книг, которые я сейчас читаю, приводил к ошибкам перевода всех видов и мастей, включая и такие бессмысленные и непостижимые фразы, какие были приведены выше.

Конечно, я признаю, что иногда GT выдаёт несколько предложений, звучащих вполне неплохо (хотя они и могут вводить в заблуждение или просто ошибаться). Может даже случиться так, что параграф или два получатся прекрасно, создавая иллюзию того, что GT понимает, что делает, понимает, что значит «читать». В таких случаях GT выглядит впечатляюще — почти человеком! И все хвалы однозначно относятся к его создателям и их тяжёлой работе. Но в то же время не забывайте, что GT сделал с этими двумя китайскими пассажами, а ранее — и с французскими, и с немецкими. Чтобы понять эти ошибки, стоит не забывать про «эффект Элизы». Байязычная машина ничего не читает — не в человеческом смысле глагола «читать». Она обрабатывает текст. Обрабатываемые символы не связаны с мирским опытом. У неё нет ни памяти, из которой можно что-либо черпать, ни воображения, ни понимания, ни смысла, скрывающегося за словами, которыми она так быстро оперирует.

* * *

Один друг спросил меня, можно ли считать умения GT простой функцией базы данных. Он прикинул, что если увеличить базу данных в миллион или миллиард раз, в итоге она в принципе сможет переводить всё, что дают, и по сути идеально. Я так не думаю. Увеличение количества «больших данных» не приблизит вас к пониманию, поскольку понимание зависит от наличия идей, а отсутствие идей — корень всех проблем современного машинного перевода. Так что я уверен, что базы данных большего размера — даже сильно большего — тут не помогут.

Другой естественный вопрос: не приблизит ли использование в GT нейросетей — имитации мозга — нас к настоящему пониманию машинами языка. Сначала это звучит правдоподобно, но до сих пор никто не предпринимал попыток пробраться за поверхностный уровень слов и фраз. Всяческие статистические данные по поводу огромных баз данных внедряются в нейросети, но эта статистика просто связывает одни слова с другими, а не с идеями. Нет попыток создать внутренние структуры, которые представляли бы собой идеи, образы, воспоминания или опыт. Такие умственные конструкции слишком неуловимы для вычислительных методов, и поэтому вместо них используются быстрые и сложные алгоритмы по статистическому накапливанию слов. Но результаты таких техник не идут в сравнение с тем, чтобы на самом деле обладать идеями, появляющимися, когда кто-либо читает, понимает, создаёт, изменяет и судит о тексте.

Но несмотря на мой негативизм, GT предоставляет сервис, ценимый многими: он на скорую руку производит преобразования осмысленных предложений, записанных на естественном языке А в не обязательно осмысленные строки слов на языке Б. И пока текст на языке Б более-менее можно понять, многих людей полученный результат полностью удовлетворяет. Если они могут получить «основную идею» предложения, написанного на незнакомом им языке, они и рады. Для меня это вовсе не то, что означает слово «перевод», но для некоторых людей это прекрасный сервис, и для них это перевод. Что ж, могу понять, что им надо, и что они довольны этим. Повезло им!

Недавно я наблюдал столбцовые диаграммы, нарисованные технофилами, заявляющими, будто они представляют качество перевода, сделанного людьми и компьютерами, и что эти графики показывают, насколько близко машинный перевод приблизился к человеческому. С моей точки зрения такая квантификация понятий, которые невозможно выразить количественно, попахивает псевдонаукой, или, если хотите, нёрдами, пытающимися привести к математике те вещи, чья неосязаемая, тонкая, артистическая природа ускользает от них. По-моему сегодняшний вывод GT колеблется от отличного до гротескного, но свои чувства по этому поводу я не могу оценить численно. Вспомните мой первый пример, с использованием понятий «его» и «её». Бездумная программа перевела почти все слова правильно, но несмотря на этот успех, совершенно не поняла смысл. И как в таком случае выразить качество работы численно? Использование наукообразных столбцовых диаграмм для представления качества перевода — это просто злоупотребление внешними признаками науки.

Вернёмся к грустной картине, в которой люди-переводчики вскоре останутся позади, станут старомодными, и в итоге будут заниматься корректурой. В лучшем случае в результате получится некая заурядность. Серьёзный художник не начинает работать с китчевого мусора, полного ошибок, чтобы, внеся парочку изменений, выдать произведение искусства. Это не природа искусства. А перевод — это искусство.

В своих работах, написанных в течение многих лет, я всегда поддерживал точку зрения, по которой человеческий мозг — это машина; очень сложная машина; и я энергично спорил с теми, кто говорил, что машины по сути своей не способны на понимание. Есть даже философская школа, заявляющая, что компьютеры никогда не будут «обладать семантикой», поскольку они состоят «не из того материала» (кремния). Как по мне, так это поверхностная ерунда. Здесь я не буду пускаться в дебаты, но я не хочу произвести на читателя впечатление, что я верю, будто интеллект и понимание никогда не будут доступны компьютерам. Если данное эссе наталкивает на подобные мысли, то это лишь оттого, что обсуждаемые мною технологии не делают никаких попыток воспроизвести человеческий интеллект. Наоборот: они пытаются обойти интеллект, и получающиеся на выходе пассажи демонстрируют эти зияющие пробелы.

С моей точки зрения, нет никакой фундаментального запрета на то, чтобы машины, в принципе, когда-нибудь начали думать, стали творческими, забавными, ностальгическими, радостными, испуганными, восторженными, покорными, полными надежд, и в результате, смогли бы делать хорошие переводы между языками. Нет фундаментальных причин, по которым когда-нибудь они бы не смогли успешно переводить шутки, игру слов, сценарии, романы, поэмы, и эссе вроде этого. Но всё это появится только когда машины наполнятся идеями, эмоциями и опытом, как люди. А этого пока не видно. Я верю, что до этого ещё очень далеко. По крайней мере, на это горячо надеется этот человек, всю жизнь восхищавшийся глубиной человеческого разума.

Когда, в один прекрасный день, механический переводчик составит искусный роман в стихах на английском языке, используя чёткий ритмичный четырёхстопный ямб, богатый мыслями, чувственностью и живыми строками, я пойму, что пришло время мне откланяться.

Комментарии (119)


  1. cicatrix
    07.02.2018 11:38

    Хорошо говорить полиглоту о тонкостях перевода с марийского на навахо, но что делать человеку, не знакомого с языком? Да, многие знают английский, чуть меньше — французский и немецкий. Мне лично регулярно приходится пользоваться GT для китайского, недавно ещё и эстонский понадобился. И GT здесь оказался незаменим. Да, тонкости уходят, иногда искажаются, но в целом, GT — отличный инструмент для таких случаев. Он (пока ещё) не может заменить переводчика-человека, но, как мне кажется, не в этом его предназначение.


    1. Dmitry_10
      08.02.2018 18:38

      Некоторых переводчиков (не будем показывать пальцем на того, кого все и так ругают) он вполне может заменить.


  1. BlackMokona
    07.02.2018 11:46
    +1

    Можно потратить всю жизнь на изучение языков и понимать их немного лучше чем GT, а можно просто открыть на смартфоне GT.


    1. Alek_roebuck
      07.02.2018 21:35

      Или пользоваться немашиннообученными переводчиками типа промта, которые как минимум не уступают GT. Предыдущая же, статистическая версия гугль-переводчика в паре русский-английский и русский-французский была настолько плохой, что я не понимаю людей, хоть чуть-чуть владевших языком, но пользовавшихся ею: чтобы перевести незнакомые слова, гораздо лучше взять словари, а если синтаксис предложения слишком сложен для Васи, закончившего советскую школу с четверкой по английскому, то GT тем более облажается.


      1. Temtaime
        08.02.2018 01:26

        Не-не-не, только не надмозг.


  1. Marwin
    07.02.2018 11:52

    -Ты всего лишь машина, только имитация жизни. Робот сочинит симфонию? Робот превратит кусок холста в шедевр искусства?
    -А Вы?
    (с) Я, Робот.

    человеку умение видеть контекст так же не даруется на генном уровне, а приходит с жизненным опытом, а точнее в процессе обучения. А умение красиво и грамотно излагать мысли даже на родном языке так вообще даётся далеко не всем. Но как учить детей — мы примерно представляем, как обучить GT до уровня среднего человека — пока вопрос, и скорее всего вопрос времени. Всё будет… просто надо отдавать себе отчёт на каком этапе мы находимся на сегодняшний день.
    И с каждым днём GT будет становиться продвинутее и полезнее для всё более требовательных групп людей.
    Более того, я считаю, что у разработчиков GT даже не стояло задачи сразу выпустить идеальный продукт. Как обычно, сначала стоит выпустить продукт, удовлетворяющий 90% нужд населения, а затем, проведя анализ, выбрав эффективный путь, углубляться в дебри, дабы уменьшить вероятность попадания в тупиковые варианты развития.

    С моим upper-intermediate в английском я часто пользуюсь GT в качестве начального грязного перевода текста набора фраз, а затем навожу лоск в смысловой части. Это намного быстрее, особенно когда в тексте есть редко используемые слова, за переводом которых всё равно надо было лезть в словарь.


    1. gmini
      07.02.2018 17:46
      +3

      Раньше, когда мне надо было переводить с/на английский(ого) я раньше тоже поступал как Вы — прогонял через машинный переводчик, а потом правил полученный текст. Со временем, я заметил, что практически полностью переписываю (меняю слова, части предложения, переставляю местами) этот полуфабрикат — иначе все равно в нем остается какая-то механистичность. Носитель языка так, как машина, никогда не написал бы. В результате работы становится только больше.


      1. Camrad_RIP
        08.02.2018 14:07

        Не нужно так делать. Переводите как переводиться, когда видите странное, подозрительно слово/предложение — лезьте в ГТ. Но не ленитесь У меня частенько ывает, ааа, я знаю(думаю что знаю) как это надо перевести, а потом хоба.


      1. andyshark1974
        08.02.2018 22:58

        Гонять текст через переводчик удобно когда маленький словарный запас. Когда слов в голове становится больше — проще прочитать самому. Ну да — можно напутать со временами иногда, но постепенно исправляешься.


        P.S. Вы это детям докажите… Они книги читать не умеют, а информацию получают из ютуб каналов… Жесть...


    1. kryvichh
      08.02.2018 13:04

      Тут как много где принцип Паретто. Получить правильный в 80% случаев перевод стоит 20% усилий. А остальные 80% усилий уйдут на достижение 100% правильного перевода.


  1. Javian
    07.02.2018 11:55

    Недавно попался старый советский словарь омонимов русского языка для иностранных студентов. Просто не ожидал увидеть русский язык с такой стороны. Google Translate такие нюансы еще долго не поймет.


  1. bars_arseniy
    07.02.2018 12:10

    [для интереса добавим и русский язык / прим. перев.]

    Отличный пример искусства перевода. Спасибо!


    1. tyomitch
      07.02.2018 16:34
      -1

      На самом деле, не совсем. Отличный переводчик бы заменил рассматриваемые переводы переводами на русский. Потому что тот, кто способен оценить тонкости перевода на английский — пойдёт читать эту статью в оригинале; а тот, кому ценен именно её русскоязычный перевод — всё равно промотает параграфы с обсуждением англоязычных тонкостей.


      1. NeuroHunter
        08.02.2018 13:18

        Как переводчик — я не соглашусь.
        Перевод — это, все-таки, передача содержания материала на другом языке.
        Когда вы заменяете основной материал статьи другим (пусть и релевантным) — это уже не перевод, а что-то другое.
        Поэтому, например, перевод всевозможной поэзии правильнее назвать переложением.


        1. tyomitch
          08.02.2018 15:15

          Но ведь основной материал статьи — это не конкретные строки, сгенерированные GT, а разбор допущенных им ляпов, не сильно меняющийся при переходе от английских строк к русским.


          1. NeuroHunter
            08.02.2018 15:18

            Основной материал статьи — разбор ляпов, допущенных GT на конкретных языковых парах.
            Если в этих парах заменить конечный язык на русский — статья, конечно, получится интересная. Только другая. И переводчик внезапно превратится в автора статьи.


  1. Camrad_RIP
    07.02.2018 12:38

    GT — не заменит хорошего переводчика, тут автор абсолютно прав. Но переводчика-надмозга — запросто.


    1. DerBad
      07.02.2018 16:53
      +2

      Удивляюсь, почему до сих пор никто ещё не сделал по этой теме табличку «Вы находитесь здесь», также известную как «Тогда и поговорим») По ней, мы должны сейчас находиться где-то между «Вот когда начнется широкое практическое использование переводческих систем, тогда и поговорим» и «Вот когда сделают высококачественный перевод текстов широкой тематики, тогда и поговорим»…


      1. dimm_ddr
        08.02.2018 11:51

        Прогресс слишком медленный и не всегда очевидный, а ярых фанатов отрицателей — нет. Неинтересно такую табличку делать.


    1. mspain
      08.02.2018 18:39

      Читал интересную статью (автор немного психически болен, но знание английского зашкаливающее), дык в итоге, ВСЕ переводы Дюны Фрэнка Герберта это мусор с грубейшими ошибками почти в каждом предложении. И это классика НФ, пожалуй, из TOP20.

      Если переиначить «90% людей считают себя умнее среднего», то «все со знанием английского выше Advanced наверняка считают себя хорошими переводчиками»… а по факту имеем?


      1. NeuroHunter
        09.02.2018 10:59

        Я правильно понимаю, что читали вы послесловие Павла Вязова к его же переводу «Дюны»?


        1. mspain
          10.02.2018 19:20

          НЕТ! ВязНИКов всех обругал, а по существу сам даже лучшим не оказался. Чего стоит его Пауль вместо Пол. Автор статьи некий Сергей, сходу не нашёл ссылку, так что показываю копию на моем сервере (если интересно)
          94.177.190.72/dune/1.html
          читать снизу вверх :) с «Дюна» «Трудности перевода 1»

          анализ в ключе:
          balances are correct; Bene Gesserit; Shaddam

          A beginning is the time for taking the most delicate care that the balances are correct. This every sister of the Bene Gesserit knows. To begin your study of the life of Muad'Dib, then, take care that you first place him in his time: born in the 57th year of the Padishah Emperor, Shaddam IV.

          Соколов:

          Начиная любое дело, следует точнейшим образом определить известные факты. Это знает любая из Дочерей Гессера. Чтобы понять Myад'Диба, следует сперва точно определить время его жизни — он родился на 57-ом году правления падишах-императора Шаддама IV

          Новый:

          Начало любого дела — это тот этап, когда вы должны с особой тщательностью уравновесить свои весы. Об этом знает каждая сестра из школы Бен-Джессерит. Сейчас вы начинаете изучать жизнь Муад-Диба. Пожалуйста, прежде всего попытайтесь представить, когда он родился: пятьдесят седьмой год правления Падишаха-Императора Саддама IV.

          Вязников:

          Начало есть время, когда следует позаботиться о том, чтобы все было отмерено и уравновешено. Это знает каждая сестра Бене Гессерит. Итак, приступая к изучению жизни Муад'Диба, прежде всего правильно представьте время его: рожден в пятьдесят седьмой год правления Падишах-Императора Шаддама IV.

          Мой комментарий:

          Что тут означает “balances are correct”? «Весы» будет “balance” – в единственном числе. В бухгалтерских и банковских делах можно иногда встретить “balances are correct” в смысле правильности остатков по счетам. Перевод Соколова тут хоть и не точен, но удачен. Во всей книге много мутноватых выражений, которые точно на другой язык перевести просто невозможно.

          Bene Gesserit (Бинэ Гессерит) – см. пункт 70.

          На иврите (Hebrew) Shaddai означает «Всемогущий, Бог», а Shaddam звучит примерно как “shut damn”, что можно перевести как «заткнись, чёрт побери». В общем лёгкий юмор и ирония начинается уже с самого начала – имя императора не Shaddai, а Shaddam. И на русский правильно переводить конечно же «Шаддам». Новый скорее всего перевёл как «Саддам» для аналогии с Саддамом Хусейном. Встречается мнение, что Дюна – аналогия ближнего востока, а спайс (специя, меланж) – аналогия нефти. Очевидно, что хотя аналогия уместна, но очень несовершенна. Множество арабизмов в тексте и соответствующий ландшафт – это вероятно намеренный ход по улучшению шансов на популярность романа в арабском мире. И как показало время, там роман тоже стал очень популярным. Когда Герберт в своей статье 1980 года «Генезис Дюны» говорит “CHOAM is OPEC”, т.е. «КООАМ это ОПЕК», он намеренно упрощает этот аспект. «Спайс» – это то, что люди потребляют непосредственно и нефть тут ни при чём. Скорее, правильнее сказать, что из-за большой популярности романа и существующих определённых ассоциаций с богатым нефтью арабским миром, теперь иногда в сленговой семантике «нефть» может обозначать «спайс», а вернее нечто с ним непосредственно связанное – см. пункт 5 и многие др.


        1. mspain
          10.02.2018 19:35

          Самое главное забыл написать: про скрытый сексуальный контекст Дюны и семантическое напряжение — это вообще у всех переводчиков за кадром осталось.
          Хотя, насколько мне моего ин.яза хватает, выводы автора статьи совершенно закономерные. Возможно Херберт на наркотиках каких сидел (дело было в 60-е).


  1. hdfan2
    07.02.2018 12:44

    Спасибо, по большей части весьма приличный перевод, но…
    Оригинал:

    Alexander Pushkin’s sparkling novel in verse

    Перевод в статье:
    блестящей новеллы Александра Пушкина

    Гуглоперевод:
    Сверкающий роман Александра Пушкина в стихах

    Тот неловкий момент, когда гуглоперевод оказался правильней, т.к. не выкинул «ненужные» слова.
    В основном использую Google Translate как словарик. К сожалению, как переводчик он всё ещё довольно слаб; особенно часто буксует на различных идиоматических выражениях (их он почти совсем не знает). Для знающих английский и желающих прочитать текст на каком-то третьем языке лучше использовать перевод на английский, он как правило качественней и понятней перевода на русский.


    1. tyomitch
      07.02.2018 16:39
      +1

      Как словарик он тоже не годится, потому что переводит через английский, и при переводе путает слова, которые омонимичны в английском, но различаются в языках перевода. (Из недавних примеров: слово «уехал» он переводит на иврит как "????", что на самом деле значит «лево» — потому что на английском и то и другое будет «left».)


      1. alix_ginger
        07.02.2018 16:44

        Ему в таких случаях нужен контекст. «Он уехал» уже переводится как "??? ???", что правильно


        1. tyomitch
          07.02.2018 17:03
          +1

          Сколько контекста ему нужно? «красная площадь» превращается в "????? ????" («красный квадрат»), потому что «red square».


          1. alix_ginger
            07.02.2018 17:09
            +1

            А «Красная площадь» с большой буквы — "???? ?????". Тоже контекст :). А если в кавычках, то вообще "????? ??????" с определенным артиклем


            1. tyomitch
              07.02.2018 17:34
              +1

              И вот пользование «словариком» уже превращается в занимательную игру «пойми меня» :)
              «Площадь трапеции» -> "???? ???????" («район кости-трапеции»), потому что «trapezium area». Какого контекста ему не хватает в этот раз?


              1. alix_ginger
                07.02.2018 17:46
                +2

                Да я согласен, как словарь GT тоже не очень (для иврита рекомендую ИРИС, хотя Вы о нём скорее всего уже знаете)


                1. tyomitch
                  07.02.2018 17:53
                  +1

                  Дело-то не в иврите, он на все языки так переводит: по-польски предлагает «уехал» -> «lewo» и «красная площадь» -> «czerwony kwadrat».


                  1. ToshiruWang
                    08.02.2018 15:54

                    Plac Czerwony, «красная площадь» != «Красная площадь».


                  1. kepDnepr
                    08.02.2018 18:38

                    А у меня переводит как Plac Czerwony:)


      1. F0iL
        07.02.2018 19:08

        Судя по всему, не во всех случаях переводит через английский, потому что на практике, к примеру, обнаружилась очень странная и действительно поразительная штука: перевод по цепочке корейский -> японский -> английский часто получается гораздо качественнее чем прямой вариант корейский -> английский.


        1. kryvichh
          08.02.2018 13:20

          Перевод русский — белорусский так точно идёт напрямую. «уехал» переводит «з'ехаў» (что правильно).


    1. Temtaime
      08.02.2018 01:31
      +1

      Есть прекрасная вещь — мультитран. Намного лучше гт для словарика.


  1. astono0
    07.02.2018 12:47
    +1

    Сначала думал, что перевод GT — это перевод geektimes :D

    Google translate отлично переводит научную литературу и позволяет в большинстве случаев правильно понять смысл обычных текстов.

    А делать художественный перевод сможет лишь с появлением настоящего ии, ибо понимания культурного контекста иначе не добиться.

    И как сервис проживет, я считаю, достаточно недолго, лишь в период адаптации. Дальше у ИИ как у вида будет абсолютное преимущество, что вытеснит человека в его текущей форме (и я в этом не вижу ничего страшного, просто следующая ступень эволюции). А дальше необходимость во множестве языков отпадет :)

    Так что как ни парадоксально, но сейчас мы уже практически на пике развития переводчика как софта.


    1. tyomitch
      07.02.2018 16:43
      +1

      Google translate отлично переводит научную литературу и позволяет в большинстве случаев правильно понять смысл обычных текстов.

      Прикол в том, что в меньшинстве случаев он искажает смысл текста на противоположный (как в приведённом примере, «руководил аспирантами» превратилось в «был аспирантом»), и если вы результат перевода не просто читаете для удовольствия как худлитературу, а полагаетесь на него как на научный текст — то он вас может очень неудачно подвести.


    1. kryvichh
      08.02.2018 13:26

      Когда сможет переводить не хуже подстрочника, тогда поговорим.
      Когда сможет переводить технические тексты, тогда поговорим.
      Когда сможет переводить художественную литературу, тогда поговорим.
      Когда сможет переводить стихи, тогда поговорим.

      — Эй, хватит пичкать меня этими скучными текстами, давай лучше поговорим! :)


  1. ed007
    07.02.2018 12:55

    Не скажу про англо-русский перевод от гугла, но качество перевода менее популярных языков после введения технологии ИИ-перевода резко упало. Легко получить прямо противоположный смысл.


    1. JTG
      07.02.2018 14:55

      image


      1. silveruser
        07.02.2018 16:35
        -3

        Непонятно, почему тупые ксенофобские шутки пользуются тут успехом.

        P.S. Хотя, впрочем, вполне понятно :(


        1. totally_nameless
          07.02.2018 22:48

          Роботы на ГТ?


        1. Wolframium13
          08.02.2018 11:40

          Потому что вы видите ксенофобию в баге Гуглотранслейта, а остальные нет. В текстах Корчевателя сексисткие шутки не замечали?


      1. AlexeiZavjalov
        07.02.2018 21:31

        Похоже, монгольский язык — непрост :)


      1. kolyan222
        08.02.2018 09:43

        Сомалийский тоже не плох)
        «ooo ooo oo oo oooo ooo o ooo o o oooo oooo ooo o»

        Перевод
        «Он Тот, Кто Он должен быть»


    1. metric_ghost
      08.02.2018 11:23

      Англо-русский тоже способен удивить!=)
      imagehabrastorage.org/webt/hx/cx/j_/hxcxj_rtijg4tfbyp_xd4l5meme.png


  1. DaneSoul
    07.02.2018 13:02

    Следует учитывать еще один момент, кроме эволюции ИИ компьютерных переводчиков идет и сильная паралельная эволюция человеческих языков в основном в сторону уменьшения их витеватости и неоднозначности.
    С ускорением жизни и желанием быстро передать информацию, люди начинают общаться более простыми и четкими фразами, а привыкая к такому стилю в собственном общении они ожидают такой же стиль и в читаемых текстах. Посмотрите, например, каким витиеватым языком писали классики лет 200 назад и как пишется современная литература.
    Так что, с учетом этих двух идущих на встречу процессов у компьютерных переводчиков светлое будущее для массового применения, а сонеты Шекспира не каждый человек-переводчик адекватно переведет, это узкая ниша по которой нет смысла равнятся.


    1. Eldhenn
      07.02.2018 13:19

      Ага, вот пример уменьшения витиеватости и неоднозначности: "На инсте гейта минусовый хуррик, в бубле, в агре".


      1. DaneSoul
        07.02.2018 14:35

        А в чем тут витиеватость?
        Тут просто специфический сленговый словарь используется, после добавления слов которого в базу будет вполне адекватно переводится.
        А без знания значения сленговых слов тут и человек не поймет, я вот только очень приблизительно понял общий смысл.


        1. Eldhenn
          07.02.2018 15:02

          Так вот в живой речи всегда используется специфический словарь.


          1. DaneSoul
            07.02.2018 15:21

            Так а в чем принципиальная разница этого словаря со словарем используемым скажем в газетах? Что мешает расширять словарь?
            А вот теперь сравните пример из Достоевского с обычными словами:


            "Разумихин, сконфуженный окончательно падением столика и разбившимся стаканом, мрачно поглядел на осколки, плюнул и круто повернул к окну, где и стал спиной к публике, с страшно нахмуренным лицом, смотря в окно и ничего не видя. "

            Сколько тут граматических моментов должен компьютер проанализировать чтобы правильно согласовать разные части предложения и не получить в итоге кашу?


            1. 3aicheg
              08.02.2018 05:45

              Razumikhin, embarrassed finally by the fall of the table and a broken glass, gloomily looked at the fragments, spat and turned sharply to the window, where he turned his back on the audience, with a terribly frowning face, looking out the window and not seeing anything.


              Не сказать что перевод хорош, но единственный, пожалуй, смысловой косяк в нём — это «embarrassed finally».


    1. mx2
      07.02.2018 16:29
      +1

      Дело не в витиеватости. Гуглопереводчик — крайне примитивная штука. Одна из основных его проблем в том, что он все пары пропускает через английский уничтожая все артикли, роды и грамматику, которых нет в английском, но есть в оригинале. Кроме того, если в этой цепочке (оригинал — английский — результат) присутствует, например, слово, имеющее несколько значений, то он тупо подставляет первое по популярности, если слово многозначное и на втором этапе — действует так же, не пытаясь анализировать сочетания или вообще совместимость слов. В итоге некоторые простые фразы могут менять смысл на противоположный или в переводе появляются новые части речи, которые даже не синонимы (и точно так же исчезают местоимения, частицы (например, «не») и пр.). Надо хотя бы базово знать грамматику, чтобы пользоваться гуглопереводчиком в письменной речи.


      1. BlackMokona
        07.02.2018 16:44
        -1

        Он гонит всё через придуманный им самим язык, а не через английский


        1. mx2
          07.02.2018 17:37

          Английский внутри легко вычисляется на омонимах, потере родов или полном непонимании некоторой грамматики.
          Близкие грамматически языки типа русского и украинского, вполне возможно, объединяет.


          1. tyomitch
            07.02.2018 17:55
            +2

            Поскольку у него механизм перевода чисто статистический, то дело не в близости грамматик, а в количестве доступных двуязычных текстов. По очевидным причинам, русско-украинских текстов намного больше, чем русско-польских — вот и выходит, что русско-украинские переводы делаются напрямую, а русско-польские — через английский, хотя грамматически все три языка одинаково близки.


            1. mx2
              07.02.2018 21:13

              Довольно очевидно, что ценность перевода русский => английский => польский на порядки ниже, чем русский => польский. Та же история с другими европейскими.


          1. user343
            07.02.2018 21:31

            Так?
            image


      1. tyomitch
        07.02.2018 16:58
        +1

        Не все пары переводятся через английский: например, в русско-украинских переводах род сохраняется, а в русско-польских — уже нет.


    1. tyomitch
      07.02.2018 16:53

      Посмотрите, например, каким витиеватым языком писали классики лет 200 назад и как пишется современная литература.

      Это особенность конкретно литературного стиля, который поменялся.
      Посмотрите реплики героев Шекспира — ничего в них витьеватого нету.


  1. Firelander
    07.02.2018 13:49

    Для технических статей гугловский переводчик более чем неплох. Понятно, что доверять ему на сто процентов не стоит, но лично мне гораздо больше пришёлся по вкусу гугловский перевод документа на английский с японского, чем на русский, сделанный нашим штатным переводчиком.


    1. InChaos
      07.02.2018 14:33

      Подозреваю что это обычная проф.деформация. Сейчас много версий проф. софта для разработки и администрирования, причем многоязычные, в том числе русские версии. Ну не могу до сих пор работать в русских версиях, чувствую себя как баран у новых ворот. Не оттого что нет адекватного перевода терминов, хотя это тоже местами есть, и даже не по привычке. А как-то слух режет, например, «Полный экран» вместо FullScreen, или «Обозреватель решений» вместо Solution Explorer.


      1. juray
        08.02.2018 21:06
        +1

        Это еще ладно, а то ведь и надмозговые переводы встречаются — пока не переведёшь обратно на английский, не поймёшь.
        Самое запомнившееся: «оставленная вершина» (в чертёжной программе при выборе точки привязки) — в оригинале Top Left.

        Но да, даже адекватный перевод слух таки режет иногда — хотя для меня в других случаях («полный экран» нормально воспринимаю, а вот Обозреватель вместо Explorer — тут я солидарен).


  1. PastorGL
    07.02.2018 14:20

    Майкрософтовский переводчик зачастую даёт лучшее качество, чем гугловый. При множественных вариантах значения слова он как-то правильнее контекст угадывает.

    Недавно я столкнулся с необходимостью перевода с японского, так гугловый выдал несогласованный набор слов (даже при выборе английского целевым, не говоря уже о русском), а этот — относительно связный текст, не без косяков, но по нему хотя бы удалось восстановить смысл.


    1. mayorovp
      07.02.2018 17:31
      +3

      Это тот самый, которым на msdn документацию портят?


      1. PastorGL
        08.02.2018 03:08

        Все б так портили. По сравнению с тем, что ещё пару лет назад было, продвинулись очень заметно.


        1. mayorovp
          08.02.2018 09:05

          Не знаю куда они продвинулись, но они до сих пор теряют отрицательные частицы и переводят названия классов. А иногда «переводят» даже фрагменты кода.


    1. kvarkicn
      07.02.2018 18:45
      +1

      Не раз сталкивался с тем, что читая статью на течнете только к середине отличаю машинный перевод. Хотя и у них иногда перлы попадаются, что без слез не взглянешь


      1. mayorovp
        08.02.2018 09:06

        В смысле человеки-переводчики у них переводят как роботы? Я это тоже заметил.


  1. spax555
    07.02.2018 16:02

    А кто-нибудь тестировал разные онлайн переводчики, кто лучше переводит?
    К примеру, по-моему мнению, translate.ru лучше GT справляется с it-текстами.


    1. ru1z
      07.02.2018 16:44

      Время от времени сравниваю на разных текстах, обычно GT сильно лучше. Но особенность — то что слова переводятся в более частотном значении, то есть специализированный под тематику переводчик может справиться лучше. Если текст большой, то GT может догадаться какой перевод слова лучше подходит в этом случае. С другой стороны, короткие фразы переводчики переводят лучше, а на длинных начинается жуткая путаница. Еще нужно помнить, что перевод на английский намного более качественный чем на другие языки. Особенно, если перевод с близкого к английскому языку.
      В некоторых случаях другие переводчики бывают неплохи. Например яндексовский получше формулирует текст на русском.
      Бинг переводит более упрощенными текстами, не всегда дотягивает до GT. Babylon обычно слабый перевод, мало направлений перевода, размер текста для перевода меньше других. Промт/babylon иногда бывают удобны в качестве словаря.


  1. tyomitch
    07.02.2018 16:18

    GT явно не понял смысла фразы — просто выдал кучу бычьего дерьма.

    Редактор GT переводит не лучше автоматического GT. Английское слово bullshit означает просто «чепуха».


    1. SLY_G Автор
      07.02.2018 17:35
      +1

      Там дальше игра слов идёт насчёт кучи, поэтому напрямую переводить было не совсем верно.


      1. tyomitch
        07.02.2018 18:00
        +1

        Вот именно, что дальше обыгрывается тот факт, что GT переводит «heap of bull» на французский так же буквально, как вы — на русский. Автор потешается над недалёкостью GT — а вышла шутка над излишне буквальным переводом, сделанным редактором GT. Прямо нарочно не придумаешь.


  1. Azlentor
    07.02.2018 16:19
    -1

    А он вообще развивается, а то в Chrome расширение указано 2015, а при переходе в расширение 2016? На дворе уже 2018.

    Copyright
    1
    2


  1. Kriminalist
    07.02.2018 17:05

    Но всё это появится только когда машины наполнятся идеями, эмоциями и опытом, как люди.


    Что это, друзья, дебюты, и в чем смысл друзей? Дебюты и товарищи — «Quasi una fantasia». Что это значит для друзей? Идея состоит в том, что муж — логичный шахматист.

    На монгольский туда и обратно. Вот примерно так машины идеями и наполнятся :)

    Ааа, еще один прогон :)
    В чем смысл друзей, дебютов и друзей? Дебюты и товарищи — «Quasi una fantasia». Что это значит для друзей? Ее муж — логичный шахматист.


  1. MUTbKA98
    07.02.2018 17:44
    +1

    Признавая правоту автора и презирая "гуглопереводы", я все же не могу не вспомнить, когда в начале 90-х в страну попали тонны западной литературы (фантастики), а машинных переводчиков, результатом которых можно было бы воспользоваться — тогда точно не было, и можно было утверждать, что все переводы сделаны людьми — и тогда было немало мест в книгах, для понимания которых было необходимо сообразить, как это выглядело в оригинале и тогда уж только понять.


    1. tyomitch
      07.02.2018 18:03
      -1

      Если бы только в начале 90-х...


  1. Alek_roebuck
    07.02.2018 17:44
    +2

    Слово Habilitation не очень просто объяснить американцу: наверно, ближайший аналог — это действительно тенюр. Вещи совершенно разные, но в некотором роде обе свидетельствуют о схожем уровне научного сотрудника. Но вот на русский язык слово Habilitation перевести можно проще: это примерно доктор наук.

    Рассуждения о его и её полотенцах и связанных культурных фактах, о которых машина не имеет представления, напомнили старый пример простого диалога, смысл которого машине вряд ли будет понятен в ближайшие десятилетия:
    Она: Я ухожу.
    Он: Кто он?


    1. idiv
      07.02.2018 21:39

      Но вот на русский язык слово Habilitation перевести можно проще: это примерно доктор наук.

      Я бы сказал, что это и есть доктор наук. Сначала PhD, потом хабилитация с получением титула Dr. habil., система была скопирована, но названия стали кандидат наук и доктор наук.


  1. dbagaev
    07.02.2018 17:46
    +3

    Критиковать Гугл-переводчик, который и не должен знать контекст перевода, за неправильный перевод фразы, вырванной из контекста — это пять. Он и не создавался для литературного перевода, впихнуть в машину культурную базу поддерживаемых языков — это намного более сложная задача, чем статистически сопоставить векторные базы слов.

    У меня кум технический переводчик с техническим же образованием. Так вот он говорит, что технические тексты люди без образования переводить не могут. Знания терминов мало, нужно иметь хорошее представление об области знаний в целом и понимать принципы работы конкретных устройств. Поэтому такие люди как он на вес золота, если надо переводить документацию к, например, электронике, потому что он в ней хорошо разбирается. А выпускники факультетов лингвистики выдают на-гора такой текст, что надо каждое второе слово править.

    Так чего же ожидать от машины, которой предложили перевести кусок фразы, не предложив контекста?


    1. Cront
      07.02.2018 19:18

      Ну статья в целом о том, что GT в принципе не всегда способен распознавать контекст. Отличный пример с поговоркой про ласточек/жажду. Там как раз-таки дан конектст, поговорка, устойчивый оборот, который обозначает [например] вполне конкретное отношение собеседника к объекту разговора. Контекст в самой поговорке.
      Речь как раз о том, что на данный момент мы имеем достаточно примитивный, механический подход к т.н. машинному переводу, который сравним с переводом «слово в слово» и не распознает простейших языковых отличий, таких как рода слов, не говоря уже о историческом и территориальном контексте.


  1. proxy3d
    07.02.2018 17:46
    +2

    Всегда делаю обратный перевод.
    Помню в свое время покупал на taobao одежду и общался об этом с китайцами через QQ.
    Написал им «Мне нравиться, ваш ассортимент обуви», через Google Translate
    Делаю обратный перевод — «Я любил вас во всех позах в обуви».
    Хорошо, что не отправил. Поэтому на форумах жаловались, что не всегда могут найти язык с китайцами))
    С тех пор, всегда пишу только простыми предложениями типа «цена товара?» и т.д. И всегда делаю обратный перевод.
    Был случай, когда гугл мне из списка стран то ли убрал одну страну Баларусь, то ли заменил ее на другую совсем типа «Гундурас» (точно не помню). Долго чесал репу, пытаясь понять как это. перепроверял много раз тогда. Беларусь отдельно нормально переводил, а вот в списке тех стран то ли вычеркивал то ли заменял на другую.


    1. F0iL
      07.02.2018 19:13
      +1

      Та же фигня. Я когда пишу письма на английском (сам, без переводчика), прогоняю их в обратную сторону в GT — если перевод обратно на русский четкий и однозначный, то все ок, если же что-то где-то перевелось криво — то вполне возможно, что в исходном тексте ошибка, либо сформулировано не совсем корректно.


    1. VJean
      07.02.2018 19:47

      «Мне нравиться, ваш ассортимент обуви»
      Делаю обратный перевод — «Я любил вас во всех позах в обуви».

      Это была месть Google Translate за вытекшие глаза слои нейросети.


    1. famiak
      07.02.2018 20:53

      Если вы серьезно пишете «мне нравиться, ваш ассортимент обуви» — я боюсь, Гугл переводчик не самая ваша большая проблема на пути поиска взаимопонимания с внешним миром.


      1. proxy3d
        08.02.2018 03:26

        Вы (и комментатор выше) правы, и про «ь» и запятую. Изначально фраза была без запятой и мягкого знака. Комментарий писал на работе, в конце рабочего дня, поэтому голова плохо соображает уже (грамматика не мой конек, особенно, когда перестаю за ней следить).
        Сейчас гугл транслайт нормально переводит эту фразу (проверял сегодня). Кстати с ошибками тоже хорошо справляется. Но форс-мажоры с переводом все равно бывают часто.
        Смысл моего комментария был в том, что порой он переводит текст не отдельно словами, а целыми выражениями (нейронка ?). И иногда эти выражения имеют совсем другой смысл. Как это было с пропаданием «Беларусь» в списке стран. При этом, сокращая список стран, в какой-то момент Беларусь появилась в переводе.


  1. Alcpp
    07.02.2018 18:24
    +4

    В переводе «Властелина колец».

    «И Боромир, превозмогая смерть, улыбнулся.»
    Перевод В. Муравьева, А. Кистяковского.

    «Тень улыбки промелькнула на бледном, без кровинки, лице Боромира.»
    Перевод Н. Григорьевой, В. Грушецкого.

    «Уста Боромира тронула слабая улыбка.»
    Перевод М. Каменкович, В. Каррика.

    «Boromir smiled.»
    Оригинал.

    Отсюда

    Так что иногда ГТ переводит лучше :)


    1. Cront
      07.02.2018 20:28
      +2

      Это крайне интересный пример, я даже поискал оригинал.
      Он тут .

      Приведенная фраза описывает последнее действие Боромира перед смертью. Английский текст самой фразы не позволяет понять интонацию улыбки, но диалог перед ней — позволяет. Если кратко — Боромир призывает Арагорна идти в Минас Тирит и спасти его народ. Арагорн говорит, что Боромиру не о чем жалеть и он может быть спокоен, город будет спасен. То есть Боромир, умирает с улыбкой в которой читается сожаление и облегчение. Сожаление от того, что он не смог сам (он говорит об этом) и облегчение от обещания Арагорна. Таков контекст.

      [Boromir] Farewell, Aragorn! Go to Minas Tirith and save my people! I have failed.'
      'No!' said Aragorn, taking his hand and kissing his brow. 'You have conquered. Few have gained such a victory. Be at peace! Minas Tirith shall not fall!'”. Boromir smiled.

      Давайте теперь посмотрим переводы:

      1. Прощай, Арагорн! Иди в Минас Тирит, спаси мой народ! Я проиграл сражение.
      – Нет! – с жаром возразил Арагорн, схватив руку гондорца и касаясь губами его лба. – Нет, Боромир! Ты выиграл! Немногим доводилось одержать такую победу. Усни с миром! Минас Тирит выстоит!
      Уста Боромира тронула слабая улыбка.

      2. Прощай, Арагорн! Иди в Минас-Тирит, спасай наших людей. А я… Меня победили.
      — Нет! — воскликнул Арагорн, взяв его за руку и целуя холодеющий лоб. — Ты победил. И велика твоя победа. Покойся с миром! Минас-Тирит выстоит.
      И Боромир, превозмогая смерть, улыбнулся.

      3. Прощай Арагорн. Иди в Минас Тирит, защищай мой народ. Я побежден.
      -Нет, — горячо ответил Следопыт, взяв воина за руки и поцеловав его в лоб, ты победил. Немногим выпала на долю такая победа. Будь спокоен. Минас Тирит не покорится врагу.
      Тень улыбки промелькнула на бледном, без кровинки, лице Боромира.

      И конечно же GT:
      Прощай, Арагорн! Идите в Минас Тирит и спасите моих людей! Мне не удалось.'
      «Нет!» — сказал Арагорн, беря его за руку и целуя его лоб. «Вы победили. Немногие получили такую победу. Быть в мире! Минас Тирит не упадет! ». Боромир улыбнулся.

      Вы серъезно считаете перевод гугла лучшим? При всех огрехах переводчиков, любой из переводов лучше отражает картину происходящего. И этого не говоря о том, что половина из переведенного машиной — вообще не русский язык.
      Вся статья о том, что перевод — это осознанный и переработаный текст с учетом языковых особенностей, а не тупой перевод слово в слово.


  1. Arxitektor
    07.02.2018 20:49

    Как я понимаю сильно улучьшить качество перевода мешают…
    Вычислительные мощности. Их просто не хватит на всех.
    Даже простые предложения порой переводит с косяками.
    Думаю если отойти от словарного запаса уровень GT чуть выше чем A2.
    И если я что-то перевожу то сразу 2-3 переводчиками.
    GT и Microsoft Translator и яндекс переводчик.
    Говорят у Microsoft Translator тоже уже нейронки работают.
    А нельзя научить мощную сетку переводить как обучали играть в ГО?
    на максимально доступном количестве примеров. Ведь литературы очень много.
    Составить миллиарды пар фраз — перевод. С разными словами.
    Просто думаю на текущем уровне качество можно поднять раза в 2 а то и в 4.
    Да я согласен ждать хоть 1 минуту на страницу. Но пусть это будет более хороший перевод.


    1. mx2
      08.02.2018 13:53

      Надо не учить мощные тупые сети перебирать коэффициенты, а составлять связи, анализировать синтаксис, искать части речи, пытаться некий контекст в оперативке держать — делать то, чем дети в школе и детсаде занимаются, тогда и толк выйдет. Но это сложно и долго всё.


      1. tyomitch
        08.02.2018 15:31

        Эти два подхода не взаимоисключающие; но «мощные тупые сети» гораздо проще масштабировать, чем команды экспертов-лингвистов. В предел «вычислительных мощностей» экспертов, составляющих лингвистические алгоритмы, разработчики автопереводчиков уткнулись гораздо раньше, чем в предел вычислительных мощностей «мощных тупых сетей».


        1. mx2
          08.02.2018 15:37

          Безусловно проще масштабировать, но там и результат упирается в фундаментальные проблемы.


  1. maxwolf
    07.02.2018 21:56

    Предлагаю в качестве заглавной КДПВ свой скриншот работы GT, сделанный около года назад:


    Зефир по-английски
    Google Translate


    1. MockBeard
      08.02.2018 11:59

      так же как «голый проводник бежал по стене» :)


      1. mayorovp
        08.02.2018 13:23

        «Голый кондуктор бежал по двору» же…


        1. juray
          08.02.2018 21:16
          +1

          А не по автобусу?
          В том варианте, что я слышал, речь шла о проводнике в шине (bus).

          Какое «правильное слово» имелось в виду в случае двора и стены — я что-то не догадываюсь.


          1. mayorovp
            08.02.2018 21:22

            Кстати да, с автобусом еще лучше.

            PS двор и стена переведены правильно, там никаких хитрых слов не имелось в виду. Почему двор мне нравится больше стены — так потому что люди по стенам не бегают, подвох слишком очевиден.


            1. juray
              08.02.2018 22:17
              +1

              Ну, основной вопрос же возникает — а какова была исходная фраза, в каком контексте?

              Если речь шла про некий оголённый (неизолированный) электрический проводник — то причём тут двор? Стена выглядит логичнее, проводка по стенам делается. И иногда даже таки неизолированная.

              Надо сказать, с шиной тоже исходный контекст не очень понятен — зачем было подчеркивать неизолированность.

              Сейчас погуглил — по инету ходит куча разных вариантов, и похоже, первоисточник вот:

              — Он перелистал несколько страниц и ткнул пальцем в одну из фраз: — Переведи вот это, например.
              — «Naked conductor runs under the carriage», — прочла Валя и тут же перевела: — «Голый кондуктор бежит под вагоном...» Неприлично и глупо!
              Инженеры так и покатились со смеху.
              — Послушай, как нужно правильно, — сказал Юра, отсмеявшись: — «Неизолированный провод проходит под тележкой крана». Американский технический язык — это тебе, Валечка, не английский литературный. Здесь навык нужен...
              Е. Войскунский, И. Лукодьянов. Экипаж «Меконга».
              Год издания — 1962.

              Остальное — «испорченный телефон». А вариант с шиной до меня дошёл через профессиональный круг общения (электроника, электрика).


              1. tyomitch
                08.02.2018 23:54

                Если речь шла про некий оголённый (неизолированный) электрический проводник — то причём тут двор?

                Я так понимаю, что в этой версии байки обыгрывается двузначность слова «yard» — «двор» и «сортировочная станция».


  1. LorDCA
    08.02.2018 01:09

    Сколько мнений…
    Слова и обьединения слов есть набор звуков описывающих совершенно конкретные вещи и ситуации. Вполне логично что в разных языках эти вещи и ситуации были разные. Из за массы нюансов, места жительства, приоритетных занятий и прочего… например у эскимосов куча слов описывает снег.
    То есть для адекватного перевода нужно прочитать, представить ситуацию и описать эту ситуацию звуками другого языка.
    Технически это реализуемо в рамках доступных технологий. По сути это задача множеств и их отношений.
    И нейросети со своим статистическим анализом не решают задачу.


    1. tyomitch
      08.02.2018 11:14

      Пожалуйста, не нужно в приличном обществе вспоминать городскую легенду про снег у эскимосов.


      1. LorDCA
        08.02.2018 19:50
        +1

        1. tyomitch
          08.02.2018 20:04

          Из первого же абзаца русской версии этой статьи: «в эскимосско-алеутских языках для обозначения твёрдого состояния воды (снега и льда) используется примерно столько же корней, сколько и в английском языке; при этом морфология эскимосско-алеутских языков позволяет более свободное словообразование»


          1. juray
            08.02.2018 21:19
            +1

            Да можно и на русскую не ходить, вот прямо по приведённой LorDCA
            ссылке —

            Eskimo–Aleut languages have about the same number of distinct word roots referring to snow as English does, but the structure of these languages tends to allow more variety as to how those roots can be modified in forming a single word.


          1. LorDCA
            08.02.2018 23:37

            the idea that a language's grammar shapes its speakers' view of the world.


  1. Exchan-ge
    08.02.2018 04:41

    В сети есть книга Д.Ю.Панова «Автоматический перевод», изданная в 1958 году АН СССР.

    Там даны примеры текста на английском языке, и перевод, сделанный на ЭВМ 50х годов.

    Я взял часть текстов на английском языке из этой книги и перевел их с помощью Переводчика гугл.

    Результаты просто обескураживающие: за 60 лет качество перевода заметно лучше не стало, а в некоторых текстах — получилось хуже, чем было 60 лет назад.

    Сомневающиеся могут проверить сами.

    «Перед учеными всех стран стоит огромная задача ознакомления с научной литературой, написанной на других языках, и вот эту задачу, безусловно, можно надеяться разрешить при помощи автоматического перевода. Первые шаги в этом направлении сделаны, и можно ожидать серьезного прогресса в данной области уже в ближайшие годы» (с) 1958


  1. Anilexis
    08.02.2018 08:15

    Вы знаете, по-всякому бывает. Не стоит идеализировать человека-переводчика. Машина по крайней мере стабильна и улучшается.

    Вот была у меня книга в двух экземплярах: один — английский оригинал, и один — перевод от издательства «Эксмо» 2009го года, где указан вполне себе заслуженный переводчик-профессионал Владимир Симонов. И перевод просто ужасающий. Встретилась одна достаточно сложная фраза. И я вижу что на русском она вообще в сюжет никак не вписывается. Читая оригинал, я примерно понимаю на английском она означает, но переводчик-человек ее переводит с полным искажением смысла. Забив фразу в GT получаю практически идеальный перевод, главное — с правильным смыслом. И в этой книге такое — не единичный случай.

    Так что, да, гениальный труд машина может пока что заменить не может. А вот уровень халтурщиков их российских изданий уже, похоже, переплюнула.


  1. vitaliy2
    08.02.2018 09:14

    с облегчением увидев, что мы ещё не подошли близко к тому, чтобы заменить переводчиков машинами
    Это серьёзно? Не, ну для некоторых очень похожих языков, я полагаю, машина может адекватно перевести. Но для некоторых языков даже через 100 лет человек не научится переводить, потому что это в принципе невозможно (если мы говорим о более-менее адекватном переводе), а что уж говорить про машину.

    Ну возьмём, к примеру, фразу, которую невозможно перевести с одного языка на другой. Как машина переведёт её? (имеется ввиду без добавления десятистраничного комментария)

    Когда упоминается машинный перевод, нужно сразу вводить оговорки, что это даже теоретически возможно только для некоторых языков и не для всех фраз (либо зависит от типа текста).


  1. miga
    08.02.2018 10:03

    Вся беспомощность машинного перевода уже не мешает переводческим агентствам давать переводчикам машиннопереведенные тексты на отчитку вместо оригинала на перевод (за меньший прайс, разумеется). А то и просто без обиняков нанимать «редакторов машинного перевода».


  1. jehy
    08.02.2018 10:30

    Машинный перевод неплохо работает на простых задачах — например, когда вам нужно перевести ассортимент магазина с тысячами товаров на десяток языков, и при этом цена казуса мала. Хотя мне вот каждый раз приходится переводить Aliexpress на английский, чтобы понять, что имел в виду автор… В художественной и научной литературе его не будет ещё очень много лет хотя из-за безумного багажа контекста, который существует только в головах у людей.


  1. Vlad_fox
    08.02.2018 11:20

    мнение експертов об языках:
    — версия гугл перводчика 1.0 — отстой
    — версия 2.0 гул переводчика отстой

    — версия 5.0 гулгл переводчика отсстой, потому что я лучше перевел строчку из Онегина чем он
    — вы находитесь здесь
    — версия гугл переводчика 6.0 отстой потому что я страдательный залог 3-го лица в 25-ом абзаце на таджикском перевел более лучше (как мне кажется)
    — версия гугл 7.0 отстой потому что in Ukraine переводит «в Украине», а я упорно пишу «на», как научили великий дедушка ленин и маленький дедушка путин


    1. slavap
      08.02.2018 18:39

      Напомнило Пелевинское: объяснить разницу между «в Украине на подвале» и «на Украине в подвале» :-)


  1. sumanai
    08.02.2018 12:20
    +1

    Самая фигня новой версии- это то, что нельзя изменить отдельное слово или фразу, как раньше. На выбор даётся 2-3 варианта, и оба по своему неверные. А сидеть набирать в гугл просто неохота, так что он остаётся без моих данных о переводе.
    А уж его попытки «помогать» при переводе, когда набранные при переводе с русского латиницей транслитерируется в не пойми чего, убивают весь ввод терминов, которые нужно писать на английском.


  1. we1
    08.02.2018 13:15

    Google Translate действительно работает очень странно: иногда выдает совершенно шикарные предложения, с не самыми простыми оборотами, а иногда меняет смысл слов на обратный, причем это могут быть устоявшиеся термины в которых все очевидно («mirrorless» переводит как «зеркальный»). И это стало заметно в последний год. До того таких явных косяков не было, хотя и «красивых» предложений тоже не получалось.


  1. DmitrySpb79
    08.02.2018 13:26

    По личному опыту использования 3х иностранных языков — Google Translate очень эффективен при знании языка хотя бы на уровне А2, когда грамматические конструкции уже знаешь, а со словарным запасом не очень. Тогда одно хорошо дополняет другое. Ну и если не ошибаюсь, GT поддерживает не все пары языков, например «русский-немецкий» переводится через промежуточный «английский». В итоге иногда из-за наличия синонимов и неоднозначностей таакая фигня получается.

    По теме статьи в целом — синхронных переводчиков и переводчиков художественной литературы Google Translate (пока) не заменит, да. Но для рынка технического перевода, нишу платных переводов GT однозначно подпортил весьма сильно. Это еще одна копилка к тому, что роботы когда-нибудь заберут до 70% работы…


  1. commanderxo
    08.02.2018 13:55
    -1

    Начал читать не посмотрев кто автор, и только в середине статьи понял, что человечество сразу зашло с козырей. Одной из главных тем великолепной книги "Гёдель, Эшер, Бах" является понятное объяснение теоремы о неполноте Курта Гёделя.

    У Дугласа природный талант, солидная научная база и многолетний опыт нахождения контрпримеров, способных сломать вроде бы стройные системы знаний, причём он точно знает что такой приводящий к противоречию пример можно найти всегда.

    PS: От Хофштадтера и его отца происходит фамилия Леонарда из «Теории Большого Взрыва» — автор статьи крайне неглупый человек.


  1. wickated
    08.02.2018 20:23
    +1

    Статья переведена с помощью ГТ бадумтсс
    Слай конечно молодец, по опечаткам видно, что переводит вручную, но он афаик давно живёт "там", и статью, написанную в американском стиле изложения, оставляет в этом же стиле. Ему — нормально, а мне, думающему на другом родном языке, подобные конструкции совершенно неудобно читать. И ГТ этому тоже сейчас никак не поможет.