Компания DeepL сообщила о том, что она запускает новую систему перевода при помощи искусственного интеллекта, которая дает гораздо более качественный результат. Ее можно бесплатно протестировать.
DeepL Переводчик вышел в 2017 году. Как отметили в компании, сейчас сервис используют более полумиллиарда человек. Версия DeepL Translator для Windows и Mac вышла в 2019 году. Сервис подписки DeepL Pro доступен для частных лиц, команд и разработчиков, а тарифные планы начинаются с €5,99.
Первая версия позволяла выполнять безошибочный перевод даже больших фрагментов текста. Сейчас исследователи ИИ внедрили новую систему, которая позволила усилить критерии перевода. Теперь, обещает разработчик, оригинальное значение предложений передается более точно на языке перевода, а система часто находит более профессиональные формулировки.
При помощи слепого метода было переведено 119 длинных фрагментов текстов различной тематики при помощи DeepL Переводчик и конкурирующих систем. Переводчики вслепую выбирали именно переводы DeepL в четыре раза чаще, чем тексты других систем.
«Мы предполагаем, что такие компании, как Google или Microsoft, также располагают очень хорошими данными для обучения нейронных сетей переводу. С другой стороны, мы внедрили много инновационных разработок в математику и методологию нейронных сетей, с помощью которых мы можем упрочить наши лидерские позиции», — говорит команда DeepL.
Теперь компания планирует расширить число предлагаемых языков.
См. также: «Подборка: 5 полезных сервисов для написания статей на английском
Andrey_Dolg
Хм документацию и правда хорошо переводит. Если бы не определённая особенность, что в документации часть слов это команды или обозначения, а не часть предложения, то я бы сказал почти идеально.
sshikov
Хорошо? Я вот засунул, как обычно, первый попавшийся фрагмент из первой попавшейся книги (машинное обучение в Spark, что самое смешное) — и на выходе получил вполне обычный для известных уже систем треш.
sshikov
Не знаю как вам, а я такое просто не могу читать. Для прогностическая аналитика? А слова Пушкин в предложении согласовывать будет? «относительно новая и новейшая технология» — масло масляное, прелестно… А слово Spark, кстати, переводить не просили, это название.
«крупным инженерам и ученым в области обработки данных» — угадайте с трех раз, кто был в оригинале?
Ну в общем, вывод все тот же — как был треш, так и остался.
lain8dono
Редактор. Перевод и локализация — понятия разные.
Кстати ради интереса тоже вбил рандомный текст. Из Game Engine Architecture, хотя не важно. При этом при копипасте пробелы не все остались. DeepL справился, а Google Translate в этих местах дичь выдал. Мелочь, но приятно.
sshikov
>Редактор.
А нахрена тогда тут переводчик, если все равно нужен человек, и при этом переводчику этому он верить не может совсем, потому что машина гонит пургу?
lain8dono
Биологическому переводчику тоже редактор нужен.
sshikov
Дело в том, что я был редактором. И как-то, было дело, отредактировал десятки тысяч страниц переводов. Поэтому могу уверенно сказать, что мне, как редактору, вот такой переводчик нафиг не сдался. Именно по той причине, что я не могу верить этому подстрочнику.
Человек выгодно отличается от вот этого тем, что умеет задавать вопросы. То есть, даже если он переводит плохо — он как правило знает, что вот этот текст он не понял. И в его переводе будут пометки об этом, о конкретных терминах и т.п.
Если мы заранее договоримся, то редактируя текст от человека, я могу не читать весь оригинал. Тут же я вынужден буду перепроверять все целиком, от и до.
Так в чем тогда профит от такого ИИ переводчика?
kryvichh
Да, кстати, неплохо было бы, если бы е-толмач мог пометить фрагмент с неточным переводом. Но в целом прогресс в этой области очень заметен.
sshikov
Знаете, я думаю что водораздел между теми, кто смотрит на успехи ИИ в этой области с энтузиазмом, и теми кто скептически, вроде меня, он проходит где-то по линии «для чего мы это используем». Т.е., если нам переводчик нужен «для себя», чтобы понять смысл текста, и мы язык знаем недостаточно — то да, прогресс очевидно налицо, и наверное пользоваться можно. Если же переводы это работа, если тексты сложные, и язык мы знаем достаточно хорошо, то текущее качество перевода пока скорее низкое.
И даже не столько низкое — иногда оно вполне приемлемое, сколько непредсказуемое. Скажем, если бы меня попросили перевести Бармаглота, я бы просто ответил: «Сорян, это стихи, и это игры с языком, я на такое не способен». А тут машина нам не смущаясь пишет: «Клинок ворпала хихикнул-закуска!», и хоть бы хны :)
LibrarianOok
Молодец DeepL, хорошо сказал, красиво!
sshikov
Вообще-то это Яндекс был, не? Но да, правда смешно.
trolley813
Вот это как раз пока сложно для машинных переводчиков (да иногда и для немашинных) — определить, что название, а что нет (конечно, в тех случаях, когда названия — это "простые" слова типа Windows или Office). Тем более, конкретно в этом предложении слово Spark стоит в начале, поэтому нельзя определить имя собственное по тому признаку, что оно пишется с заглавной буквы.
sshikov
Естественно. Дело даже не в названиях — у ИИ нет контекста в широком смысле. Вон, ниже был пример, где в одном переводе обед, а в другом, тоже самое — уже стало ужином.
Alek_roebuck
Зато очень веским намёком на то, что Spark — имя собственное, почти что гарантией этого служит отсутствие артикля.
С другой стороны, нет такого правила, что названия не надо переводить. Иногда надо, часто не надо, а часто надо транскрибировать.
kryvichh
Если имя или фамилия — то 100% транскрибируем, либо по правилам, либо используя устоявшуюся транскрипцию.
Alex_ME
Засунул кусок статьи. Результат похож на текст на русском языке, а не на "моя твоя не понимать" (куда более связанный и согласованный, чем у гугла), но с технической точки зрения — смех и слезы.
A Quad Copter is a four-rotor helicopter. It is an under-actuated, dynamic vehicle with four input forces (one for each rotor) and six degrees of freedom (6DOF). Unlike regular helicopters that have variable pitch angle rotors, a quad copter has four fixed-pitch and fixed-angle rotors. The motion of a Quad copter in 6DOF is controlled by varying the rpm of the four rotors individually, thereby changing the lift & rotational forces. Quad copter tilts toward the direction of slow spinning motor, which enables it to roll and pitch. Roll and pitch angles divides the thrust into two directions due to which linear motion is achieved. The rotors rotate in clockwise-anticlockwise pairs, (figure1) to control the yaw produced due to the drag force on propellers.The center of gravity (CG) lies almost at the same plane which contains all the rotors. Also all four motors of same class differ in efficiency with each other.
sshikov
>вращательные усилия
Скорее всего — моменты.
>позволяет ему катиться и менять шаг
А это что вообще было?
Насчет pitch angle — не факт что тут про угол атаки.
>с технической точки зрения — смех и слезы.
Согласен, но это — сложный текст. Тут нужен специалист, иначе у человека тоже получается та еще хрень.
nikolayv81
Про pitch angle rotors это, вроде, именно "с переменным углом наклона", там ось вращения наклоняется, за счёт чего происходит движение в нужном направлении, угол атаки это вроде как уже у всего вертолёта при движении. А вот шаг это как раз про наклон лопастей https://yandex.ru/turbo?text=https%3A%2F%2Fru.wikipedia.org%2Fwiki%2F%25D0%25A8%25D0%25B0%25D0%25B3_%25D0%25B2%25D0%25B8%25D0%25BD%25D1%2582%25D0%25B0
p.s. возможно я ошибаюсь в терминах.
Bedal
Ошибаетесь. У лопасти вертолётного винта непрерывно меняют угол атаки. Когда лопасть идёт вперёд — угол атаки меньше, когда назад — больше. При этом для сохранения постоянства оборотов при увеличении мощности двигателя увеличивают и общий для всех лопастей угол атаки.
У квадрокоптера (обычно) лопасти фиксированы, тяга меняется скоростью вращения винта. Угол атаки каждой лопасти постоянен вне зависимости от приводимой к винту мощности или направления движения лопасти вперёд/назад.
nikolayv81
Да вы правы, в современных вертолётах, но в оригинале "variable pitch angle rotors" скорее бы перевёл как "с регулируем шагом" (хдинамических) т.к. в след предложение содержит разделение на шаг(вроде как у нас принято такое названия вместо "угол установки лопастей") и наклон, с помощью наклона это, насколько я понимаю, более старый способ движения вперёд...
Bedal
Наклона винта у вертолетов не бывает, для движения вперед наклоняется вся машина за счет изменения циклического шага винта. Подъемная сила задней половины винта делается больше, и весь вертолет наклоняется.
В тексте явное упоминание общего и циклического шага винта. Но надо делать скидку на то, что оргинал писал журналист. Как сумел, так и написал :-)
sshikov
>Наклона винта у вертолетов не бывает
Так это у вертолетов. У мультикоптеров и разных гибридов вполне себе бывают винты поворачивающиеся целиком.
Bedal
Давайте оставаться в теме — речь в обсуждаемом тексте и, соответственно, в обсуждении, идёт именно о вертолётах vs квадрокоптеры. Причём в тексте речь именно о простых (малых) квадрокоптерах без автомата перекоса и иных изысков.
А так-то про V-22 и другие аппараты с поворотными винтами могу порассказать тоже.
sshikov
Речь в обсуждаемом тексте вообще про ИИ и машинный перевод :)
И применительно к квадрикам я бы сказал так — современный ИИ не в состоянии понять, что речь «простых (малых) квадрокоптерах». Я даже про себя сказал бы, что мне это не вполне очевидно. Откуда такой вывод, кстати, он из этого одного абзаца?
Соответственно, поскольку у ИИ нет контекста, он не может решить, бывают ли на самом деле поворотные винты, или нет, и как их лучше называть в каждом конкретном случае. Вряд ли ИИ в данном случае вообще коптеры от вертолетов всегда отличит.
Bedal
Не передёргивайте, конечно же, вопрос о вертолётах — в рамках данной ветки. И, как выяснилось, большинство принявших участие в обсуждении человеков тоже не способно однозначно и правильно перевести. Ну, не их это тема. Потому вряд ли ИИ стоит так уж осуждать.
sshikov
>Не передёргивайте
Там эта, смайл стоит, вообще-то.
>Потому вряд ли ИИ стоит так уж осуждать.
Ну, собственно у меня лично претензия одна — в отличие от человека ИИ все еще не может сказать: «Не, я не специалист, позовите тех, кто в теме». И это должна быть базовая функция, а не опция.
Bedal
sshikov
Ну, я так делаю всегда — если это перевод за деньги (ну и при некоторых очевидных условиях, типа наличия тех людей, у которых вообще можно спросить).
И если бы мы тут реально переводили, а не трепались — первое что я сделал бы, это спросил, о чем собственно текст. Потому что сейчас я вообще не понимаю, зачем тут этот самый термин under-actuated, который в моем понимании реально из ТАУ — значит ли это, что вся статья об этом? И все хорошие переводчики, что я встречал, как правило поступают именно так. Поэтому они и хорошие, кстати.
WinPooh73
«Тварь бриллигская, и щелевые печи
Появился в вейбе:
Все мимсы были бороговыми,
И крысики-момомомы перестают существовать.
»Остерегайся Бармаглота, сын мой!
Челюсти, которые кусаются, когти, которые ловят!
Остерегайся птицы Jubjub, и избегай
Жестокий Бандерснатч!"
Он взял в руки вихревой меч;
Давным-давно мужественный враг, которого он напугал…
Так отдохнул он у дерева Тамтум.
И задумался.
И, как в уффишской мысли, он стоял,
Бармаглот с огненными глазами,
Пришёл вздрогнуть в тюльгийском лесу,
И сгорел, как только пришел!
Раз, два! Раз, два! И через и через
Лезвие ворпала пошло на хихиканье!
Он оставил его мертвым, и с его головой
Он поехал галумфать обратно.
«И ты убил Джаббервока?
Иди ко мне на руки, мой бревенчатый мальчик!
Слабый день! Каллу! Каллей!»
Он замерз в своей радости.
«Бриллиг, и щелевые печи
Появился в вейбе:
Все мимсы были бороговыми,
И крысики-момомомы перестают существовать.
Переведено с помощью www.DeepL.com/Translator (бесплатная версия)
sshikov
Ну, в данном случае результат был вполне предсказуем.
CoolCmd
надеюсь, в обозримом будущем ИИ не сможет это перевести. иначе нас ждет также неиссякаемый поток ИИ-песен, ИИ-прозы, ИИ-живописи и т.д.
sshikov
Ой, да какое там… ну вот смотрите, случайная книжка, на этот раз — анимация:
>Прежде чем мы все выйдем и повесимся в отчаянии, позвольте мне посоветовать вам сесть. вниз и смотреть
Как вы думаете, что было на месте «сесть. вниз»? :) И зачем тут точка после «сесть», которой не было в оригинале?
Ну т.е., я пока вижу вот что: этот ИИ лажает. Следовательно, доверять этому переводу, даже как подстрочнику, нельзя. И лажает он как на художественных текстах, типа Джаббервока (на которых и человеку не стыдно), так и на значительно более простых технических.
Sychuan
Но может это будет лучше, чем тот поток, который есть сейчас?
hjornson
Не без огрехов и надобности в коррекции, да, но даже художественный текст оно перевеодит заметно лучше того же гугля.
Named
Летом еще по рекомендации Лебедева, кажется, на эту систему наткнулся, потестировал — вроде было хорошо, на уровне того же гугля.
Сейчас тоже зашел, несколько текстов закинул — примерно то же самое.
Удобно, что можно корректировать перевод, кликнув на слово. В остальном прорыва не заметил.
kulichkovsergey
По сравнению с Гуглом это просто космос.
Живу в Германии, пользуюсь каждый день, еще и русский год назад добавили
kulichkovsergey
Кстати, Гугл все переводит через английский. В итоге перевод немецкий-русский получается порой просто ужасным
timoteo_cirkla
Вообще-то уже не через английский. Можете погуглить.
Sklott
Есть такое ощущение, что для каких-то языковых пар они то включают прямой перевод, то через английский. Насчет «через английский» это очень хорошо заметно на некоторых словах когда есть несколько вариантов перевода «исх.язык -> англ.язык» и «англ.язык -> рус.язык», но при этом ну просто никак невозможно перевести таким образом «исх.язык -> рус.язык». Конкретных примеров сейчас не припомню, но видел такое не раз.
EvilFox
Почему с яндексом его не сравнили? Яндекс.переводчик давно на голову выше гуглопереводчика особенно в художественном тексте (песнях например).
BlackMokona
Потому что у яндекса русский основной, а вот в мире англиканский основной
WinPooh73
Вариант от Яндекса показывает, во всяком случае, некоторое знакомство с классическим русским переводом.
Это был бриллиг и скользкие Тувы.
Неужели Гир и гимбл в вабе:
Отрубить ему голову!,
Как мюмзики в мове.
— Берегись Бармаглота, сын мой!
Челюсти, которые кусают, когти, которые ловят!
Остерегайтесь птицы Джубджуб и избегайте
В frumious Брандашмыг!”
Он взял свой ворпальский меч в руку.;
Долгое время manxome врага он искал—
Так отдыхал он у дерева Тумтум
И постоял немного в раздумье.
И, как уффиш думал, он встал.,
Бармаглот с горящими глазами,
Пришел whiffling через Бармаглот древесины,
И бормотал, когда он пришел!
Раз, два! Раз, два! И насквозь, насквозь.
Клинок ворпала хихикнул-закуска!
Он оставил его мертвым и с головой.
Он пошел галопом обратно.
“И ты убил Бармаглота?
Приди в мои объятия, мой мальчик Бимиш!
Сегодня волшебный день! Каллу! Callay!”
Он захихикал от радости.
Это был бриллиг и скользкие Тувы.
Неужели Гир и гимбл в вабе:
Отрубить ему голову!,
Как мюмзики в мове.
Вот только кто бы объяснил, откуда у ИИ такое желание отрубить голову в первой же строфе, когда в оригинале об этом нет и речи:
’Twas brillig, and the slithy toves
Did gyre and gimble in the wabe:
All mimsy were the borogoves,
And the mome raths outgrabe.
sshikov
>некоторое знакомство с классическим русским переводом.
Ну, сильно лучше-то от этого не стало, не так ли?
iskateli
я думаю меньшинство людей пользуется переводчиком для перевода стихов, зачем вы второй раз подряд тут приводите такой пример именно со стихами? Со своей основной функцией на большинстве текстов он приемлемо справляется.
sshikov
Давайте я поясню. Вы можете ответить, где заканчивается то «большинство текстов», с которым этот ИИ на сегодня справляется? А если нет — то представьте, что вам нужно перевести юридический документ с китайского на немецкий — и вы не знаете обоих. Насколько полученный результат вообще применим, если вы не можете его проконтролировать?
Ну т.е. проверка на стихах — это конечно экстремальный тест, который показывает (уже в который раз), что никакого прорыва на самом деле не случилось. Как много лет назад были тексты, которые гугль переводил приемлемо, так и сейчас такие есть. А вот ограничить более четко эту область применимости мы как не могли, так и не можем.
DaneSoul
kryvichh
Нереальный пример. Тоже самое, как перевести из ассемблера RISC в LISP не зная обоих.
sshikov
Ну вообще я специально преувеличиваю, чтобы было понятнее. Да, если вы не знаете ни языков, ни предмета (будь то юриспруденция, или космонавтика) — вам вряд ли вообще что-то светит.
Суть же в том, что мы не знаем того предела, когда перевод машины перестает быть адекватным, даже если целевой язык русский.
iskateli
Что значит «справляется»? Если всего несколько узкоспецефичных слов переводит неправильно, то да — справляется. В любом случае этот перевод на голову выше например, чем «Сократ персональный» и др. программы двухтысячных годов. Старый мем:
sshikov
>Что значит «справляется»? Если всего несколько узкоспецефичных слов переводит неправильно, то да — справляется.
Ну я выше постил пример, когда этот ИИ перевел sit down как «сесть. вниз», вот прямо так, с точкой. Вы считаете, это узкоспецифичные слова?
То есть да, по сравнению с 2000 годами это конечно огромный прогресс, никто не сомневается. Но в тоже самое время оно может спороть внезапно любую чепуху на ровном месте. И в этом смысле — ничего не изменилось вообще.
VMichael
Сейчас Я.Переводчик переводит эту фразу так:
«Выполните установщик значком лотка и вставьте двоичные файлы MS Windows или другой ОС с пользовательской поддержкой драйвера мыши в текущем загрузочного диска.
Да, прогресс налицо, на самом деле.
SmallDonkey
С русского на английский
Переводчики вслепую выбирали именно переводы DeepL>Blind translators chose to translate DeepL
Слепые переводчики… прорыв однозначно
lnking
Переводчики вслепую выбирали именно переводы DeepL => Translators blindly chose translations of DeepL.
Нормально.
Пары английский-русский, русский-английский DeepL переводит чаще гораздо лучше, чем Google.
doga
Давно маюсь, давно сидел на этом берегу, чтобы задать вопрос:
при переводе не «просто копипасты текста», а «текста из инета просто указанием ссылки в окне перевода»
часто натыкался на упорное нежелание и Гугла, и Яндекса, но не Бинга переводить с английского на русский для ссылок на крупнейшие газеты и другие имхо вполне вменяемые ресурсы. Для статей не по подписке, а именно публично доступных, без всяких предварительных регистраций и СМС.
Примера под руками нет — извините, но это случалось у меня много, много, много раз…
Отказ выглядел так: после перемигивания АКА начала перевода страницы и появления русского текста происходило снова перемигивание и мне показывался английский источник.
Для проверки пробовал в том же сеансе переводить совершенно другие произвольные ссылки — они переводились без каких-либо даже намеков на такие проблемы.
Сам вопрос: папа, что это было?
И переводить через Бинг тогда получалось у меня значительно хуже — но уже не помню подробностей, но противнее настолько, что в особо припирающих мое любопытство случаях я копипастил куски интересующего меня текста.
Что еще я забыл рассказать из числа м.б. важных условий?
Например, я принудительно выставлял язык и для источника, и для выхода — но нифига!..
timoteo_cirkla
Странно. Часто перевожу в хроме англосайты. Нормально переводит.
doga
Так и я часто — но нередко и неудача описываемая случалась. Но почему, Холмс?
doga
Есть у меня в закладках любимая статья, которую так никто и не перевел
www.nytimes.com/2018/01/23/magazine/selling-airborne-opulence-to-the-upper-upper-upper-class.html
Вот прямо сейчас Гугл + ФФ52 = тупо и просто полностью пустая страница после мигнувшего появления русского перевода.
Вспомнил еще, что я также щелкаю на кнопки сверху справа «перевод» и «источник» — тоже не влияют в этом случае.
Хромом не пользуюсь, но спасибо за идею, но внизу уже и про него пожаловались.
Quiensabe
Эту статью хром переводит корректно.
Но они что-то поменяли в работе расширения. Раньше переводилась вся страница, а теперь только видимые абзацы (при скроллинге на секунду появляется английский текст, потом переводится). Так что может с расширением такой проблемы уже и нет, давненько с ней не сталкивался.
doga
Снова спасибо!
я полный ламер в ХТМЛ, но м.б. это разновидность «ленивой загрузки» или как ее там, как это давно уже сделано у многих, и у Кинопоиска для фото в списке участников фильма, например.Т.е. такое при переводах у меня давно (но не всегда — м.б. зависит от размера страницы?), и с этим я смирился давно тоже.
Но и это тоже идея, потому что после появления такого эффекта появились и проблемы с отказом в переводе ссылок, а объединяет их именно «перемигивание», только в случае отказа после перемигивания происходит «не то».
Хотя м.б. это «только совпадение», безусловно.
Quiensabe
Подтверждаю. Периодически встречаю точно такую проблему.
И кстати, расширение гугла для перевода страниц (т.е. перевод текущей страницы открытой в хроме, а не по ссылке) — точно также иногда отказывается переводить. Замечено, что отказ происходит обычно на одних и тех же страницах, но с чем это связано — непонятно.
doga
Спасибо за хром — мне проще теперь с ним даже не пытаться заморачиваться, а именно некоторые и одни и те же страницы — именно так: сначала пробовал переводить такие через день и через неделю, а потом, если не надоедало и не забывал — уже копипастил кусками.
Baigildin
Вот проверил:
Перевод:
Перевод от гугла:
Перевод от deepl:
timoteo_cirkla
______
Quiensabe
Спасибо за наглядный пример!
Жаль текст довольно простой, фразы короткие и мало связанные друг с другом. По сути, только в последнем предложении упоминается факт из предыдущего, что позволяет судить о том, как переводчик умеет сохранять смысл текста как целого, а не просто переводить знакомые фразы по образцу.
В этом примере deepl использовал правильное слово («его», ужин), что говорит в его пользу. Но делать выводы по одному слову не стоит, это может быть случайностью.
С другой стороны, deepl больше «халтурит» с местоимениями. Вначале обращаясь к читателю на «ты», а потом вдруг перейдя на «Вы» (еще и с большой буквы).
Остальные отличия минимальны и вполне в пределах погрешности.
Так что вопрос не выбора не однозначен.
Baigildin
Да, надо было более сложный текст дать. Вот пример технического текста:
Перевод:
Перевод от Гугла:
Перевод от DeepL:
Текст взят отсюда
red75prim
Из человеческого перевода куда-то пропал "multipath", но появились "side lobes".
biokin
Не понимает контекст терминов (смысл -> ощущение)
Буквальный перевод латинских терминов (интрорецептивный)
Мета-слова (типа do, get,go) не детализированы в контексте и не выражены в литературно принятой форме (This is done via -> Оно возникает благодаря многочисленным )
NeoCode
Машинный перевод — интересная тема, надо будет в ближайшее время что-то почитать по ней (кстати что посоветуете?).
Вообще давно есть такая мысль. Перевод с одного человеческого языка на другой — неконструктивен — именно потому, что человеческие языки неточны и неформальны. А что если разработать специальный формализованный язык (или множество языков — на базе английского, русского и т.д.), на котором можно представлять знания в строгом виде, однозначно понятном для компьютера? Это был бы аналог языка программирования или разметки, с компилятором и «средой разработки», в которых бы проверялась непротиворечивость текста. Тогда перевод такого текста на любой язык фактически был бы достаточно однозначной генерацией (фактически — применением «человеческого» стиля к строго представленному знанию). И заодно исследования в этом направлении открыли бы дорогу к человеческим знаниям для искусственного интеллекта.
kryvichh
Ну есть https://en.m.wikipedia.org/wiki/Simplified_Technical_English
Одной из его целей было Reduce ambiguity.
Оно?
NeoCode
Может быть. Только в интеграции со специальным редактором, в котором будет как минимум подсветка синтаксиса, аналог компиляции с выявлением ошибок, элементы гипертекста, построение графов и диаграмм и прочее. Возможно — перевод текста с обычного языка в такую специальную форму.
Английский кстати лучше подходит для такой цели, чем русский, т.к. английский — "аналитический", с неизменяемыми словами.
Sychuan
Такие идеи существют с древних времен и, возможно, это работает для какой-то сверхузкой области вроде математики или химии (причем я не имею в виду учебники по математике, где язык не строгий и не формальный, а что-то вроде Coq и Lean). И главная проблема — это никому не нужно. Ваш проект делает человека рабом компьютера и заставляет спускаться на его уровень, выполнять двойную работу. Наоборот все стремятся к тому, чтобы поднять компьютер на уровень человека. И успехи довольно значительные.
NeoCode
Как вам например такая идея — вы пишете статью на обычном русском языке, загружаете в некую программу, она проводит семантический анализ и разметку, вы прямо в программе мышкой добавляете семантическую метаинформацию в тех местах, в которых программа вас попросила — и затем одним нажатием кнопки получаете абсолютно качественные переводы вашей статьи на все языки мира?
Sychuan
Я бы предпочел, чтобы программа сделала это без моего вмешательства вообще. Собственно примерно так современные передовые алгоритмы и работают. Они переводят текст в некоторое векторное пространство из которого можно потом транслировать в любой язык(word embedding). Более того, такие модели могут научится переводить с языка Y в язык X, не обучаясь на словаре между X и Y, потому что «форма» языков в каком-то смысле похожа и если есть векторные пространства двух языков их можно сопоставить друг с другом.
NeoCode
Чтобы перевод произошел без вмешательства вообще, нужно чтобы возможности компьютера сравнялись с возможностями человеческого мозга, иначе все равно будут ситуации когда компьютер что-то «не поймет» (даже с учетом всяких угадываний по контексту, нейросетей наученных на огромных массивах текстов и т.п.). А это будет еще очень нескоро.
Кроме того, вы рассматриваете только одно применение — перевод с человеческого языка X на человеческий язык Y. То есть изначально рассматриваете что информация предназначена только для человека с его биологическим мозгом — столь же невероятным сколь и несовершенным для решения научно-технических задач. Мне же интересно дать возможность компьютеру самому участвовать в интеллектуальной деятельности, обойдя все несовершенства естественного языка и естественного мышления.
Компьютер мог бы самостоятельно проводить исследования, сбор информации по заданной и смежным темам (при том что я как пользователь просто могу не знать даже названий этих тем), делать выжимки «самого главного» из огромных массивов информации, интерактивно раскрывать непонятные темы в более подробной форме, переформулировать материал в другом стиле (более понятном или удобном для конкретного пользователя), в общем быть таким «расширителем мозга». И всё это требует некой инфраструктуры, которой сейчас просто нет — инфраструктуры унифицированного представления знаний в виде семантических сетей. В конечном итоге, мне кажется что именно это, а не нейросети, является надежным путем к универсальному искусственному интеллекту.
Кажется, мы пытаемся прыгнуть сразу слишком высоко — сейчас компьютер со всеми его терабайтами и гигагерцами это по сути лишь среда для запуска браузера, текстового редактора и игрушек; а мы мечтаем сразу о сильном ИИ, который решит все наши проблемы. Забывая, что нужно пройти промежуточные этапы.
Andrey_Dolg
Тут главный вопрос нафига сильному ИИ решать наши проблемы? ;)
NeoCode
Главный вопрос — как сделать ИИ, пофиг какой, который таки будет решать наши проблемы.
Sychuan
То что он сильный не значит, что у него есть собственная воля, отличная от воли человека
Sychuan
Но и человек тоже всегда что-то не поймет. Я так точно часто ошибаюсь в книгах и текстах. Много раз.
Это прекрасно, но я не думаю, что для этого надо изобретать инфраструктуру в виде
Даже если ее и создадут, то вероятно компьютер сам дистилирует это чистое знание из набора текстов.
NeoCode
Вот аналогия. С начала изобретения письменности люди в основном записывали тексты вручную. Но с появлением компьютеров мы научились пользоваться клавиатурами, а не стали ждать когда же там компьютеры научатся воспроизводить рукописный текст. А если бы стали ждать… до сих пор бы ждали, наверное. И насколько сложнее была бы инфраструктура.
Также и здесь. Я считаю что ждать, пока там компьютер научится полноценно понимать человеческий текст — слишком долго. Сейчас все наши компьютеры с их огромной вычислительной мощью — по сути просто мультимедийные комбайны, такие телевизоры с миллионом каналов. Т.е. со времен «революции 90-х» (GUI, мультимедиа, WWW) ничего по сути не изменилось, только окошки стали со всякими украшательствами, а некоторые программы вообще стали еще более тормозные чем их аналоги 20-30 летней давности.
Да я бы предпочел чтобы у компа был простой интерфейс как в 90-х, но зато он умел бы решать реальные задачи и проблемы, обдумывать, обсуждать, осуществлять научный и творческий поиск, изобретать… пусть не совсем самостоятельно, пусть вместе с человеком — в диалоге, подсказывая и объясняя по запросу, представляя информацию в разных видах и детализациях — словно бы вращая 3D-модель сложной детали в какой-нибудь CAD, и одновременно следуя высокоуровневым интуитивным инструкциям человека.
Sklott
На первый взгляд мысль здравая. Но как только начинаешь углубляться в частности, то вылазит такое, что не всегда понятно как это сводить. И проблема даже не в языке как таковом, а скорее в «культурном контексте». Даже в одном языке в одной и той-же ситуации разные люди могут использовать разные выражения:
— здравствуйте
— доброе утро
— привет
— хай, чувак
и т.д и т.п.
В обычных текстах, особенно при переводе, это тоже вылазит во всей красе…
NeoCode
Да, я думал и об этом тоже. Каждое слово или фраза должны кодифицироваться каким-то образом, отражающим эмоциональное наполнение и прочие гуманитарные аспекты применения. Это кстати позволит трансформировать тексты — делать их с нужной эмоциональной окраской, для конкретной целевой аудитории и т.д.
Скучный мануал? Выбираем в меню другой стиль, и получаем статью в стиле журнала «Хакер»:)
DreamingKitten
перевёл как
я всё понимаю, но буква «ё»…
LibrarianOok
Ну, хоть один электронный болван умеет букву «Ё» писать в словах. Респект ему!
axi1
Ну оочень hoofed.
dbalabanov
жаль, что нет китайского
Cybersoph
Тааак, проверим… Берём сложносочинённое предложение на русском языке и смотрим, что выдаётся на выходе на английском языке:
«Не заметив, что на мосту, где было совершенно темно, шоссе, давно требующее починки, о которой некому было позаботиться, размыто дождями, в этих местах почти не прекращающимися, покрыто выбоинами, заполненными, о чем было нетрудно догадаться, густой грязью, завалено мусором, велосипедист, как мешок с картошкой, со всего маху свалился в яму.»
«Not noticing that on the bridge, where it was quite dark, the highway, which had long been in need of repair, which had no one to take care of, was blurred by the rains, in these places almost constant, covered with potholes filled, which was not difficult to guess, dense mud, swamped with garbage, cyclist, like a sack of potatoes, with all the fly fell into the pit.»
На «интеллектуальный» перевод мало похоже. На смысловой перевод — тем более. И вот почему:
1. Смысловой кластер «cyclist fell into the pit» не выделен и не поставлен во главу предложения в соответствии с правилами английской грамматики.
2. Идиоматические выражения типа: «со всего маху» переводит подстрочным методом конца 70-х годов прошлого века.
3. Инкрустированные в смысловые конструкции пояснительные обороты не выявляются первичным анализом текста на русском языке и потому на языке перевода выглядят неграмотно.
А с чем сравнить?
Вот перевод от Яндекс:
«Without noticing that on the bridge, where it was completely dark, the highway, long in need of repair, which no one could take care of, was washed away by the rains, in these places almost non-stop, covered with potholes, filled, as it was easy to guess, with thick mud, littered with garbage, the cyclist, like a bag of potatoes, fell into the hole at full speed.»
Не лучше справляется и Гугл:
«Not noticing that on the bridge, where it was completely dark, the highway, which had long needed to be repaired, which no one had to take care of, was washed out by the rains in these places almost not stopping, covered with potholes, filled with what was easy to guess, thick dirt, littered with garbage, a cyclist, like a bag of potatoes, fell into the pit from all over.»
Желательный по качеству английский вариант перевода должен быть хотя бы на следующем уровне:
<The bicycle-rider fell down into pit likewise a bag with potatoes not noticing that the highway on the bridge, where it was completely dark and no one long time had to take care of about it’s repair demanding, is blurred by rains in these places almost not stopping, covered with potholes, thick by mud, that was not hard to guess, and filled with garbage.>
В этом случае можно говорить уже об «интеллектуальном» или «смысловом» переводе.
DonAgosto
Гриф штанги прогнулся под тяжестью блинов.
The barbell vulture bent under the weight of pancakes.
Стервятник-качок переел оладушков.
Гугл, яндекс — аналогично —
The bar's neck sagged under the weight of the pancakes.
The bar vault caved in under the weight of the pancakes.