Початково рыцер Еди, под вплывем Дартха Сидиоуса прешедл на цемна стронэ Моцы и прыял тытул „Дартх Вадер”.
Вы поняли что-то из предыдущего предложения? Это польский язык. Это не перевод, это польский язык как он есть, просто записаный кириллицей. Вчера, я случайно оказался на польском сайте, там всё было написано по польски, ничего не понятно, и мне вдруг стало любопытно, что если конвертировать польский текст в кириллицу, смогу ли я, внезапно, понимать его? Ну хоть на сколько-то понимать. Готового такого конвертера я нигде не нашел, ни на гитхабе ни в переводчиках типа Гугла. Пришлось написать самому.
Перевод и оригинал фразы вынесеной в начало статьи:
Поначалу рыцарь Джедай, под влиянием Дарта Сидиуса перешёл на тёмную сторону Силы и принял титул „Дарт Вэйдер”.
Początkowo rycerz Jedi, pod wpływem Dartha Sidiousa przeszedł na ciemną stronę Mocy i przyjął tytuł „Darth Vader”. (Wikipedia)
Мой уровень польского нулевой, правил чтения я не знал. При виде слов вроде przyjaciółka i towarzysz
у меня наступала когнитивная перезагрузка.
В основном я опирался на статью Польский алфавит в Википедии. Цель была сделать текст интуитивно читаемым без всякой подготовки со стороны читателя. Но мне также хотелось сохранить прозрачность транскрипции, чтобы было понятно из какой буквы в латинице получилась та или иная буква в кириллице. В идеале мне хотелось сделать конвертер симметричным, то есть, чтобы можно было бы, в теории, конвертировать полученную кириллицу обратно в латиницу без потерь. Отсюда возникла необходимость сопровождать некоторые буквы диакритическими знаками, то есть закорючками сверху или снизу. При чтении их можно игнорировать, но при желании они могут дать читателю дополнительную информацию.
Быч в Рыме и не видзеч папежа.
Перевод и оригинал
Быть в Риме и не увидеть Папу.
Być w Rzymie i nie widzieć papieża.
Весь конвертор получился в 100 строк кода на JavaScript. (В следущий раз уложусь в положеные для подобных случаев 30). В основном код выглядит примерно так:
else if (item == 'S') {
if (next == 'Z' || next == 'z') { o += 'Ш'; skip = true }
else o += 'С'
}
Оказалось, что przyjaciółka i towarzysz
можно записать на кириллице какпṗыяцӱл̥ка и товаṗыш
, то есть в переводе приятельница и товарищ
.
Возьмем, скажем, польское буквосочетание RZ
, оно не имеет ничего общего с алгоритмами сжатия данных, читается, условнно-относительно, как русское Ж
, и, при этом, лексически соответствует русской букве Р
, что легко видно на слове rzeka
, то есть река
. Если транслировать RZ
в Ж
, то потеряется лексическое узнавание, как вам слово жека
? а если в Р
, то она будет не отличима от обычного R
и потеряется фонетика. И как это отображать в кириллице? В итоге я решил использовать Р
с точкой сверху Ṗ
. Аналогично были подобраны диакритические знаки для других случаев.
Трауматыччне̥ дзецињство и мл̥одоċч, страх, запровадзил̥ы Анакина на стронӭ зл̥а.
Перевод и оригинал
Трваматичное детство и молодость, страх, спровадили Анакина на сторону зла.
Traumatyczne dzieciństwo i młodość, strach, zaprowadziły Anakina na stronę zła. (Wikipedia)
Специально "запровадзил̥ы" перевожу как "спровадили", а не как "довели", для сохранения максимального интуитивного сходства с оригинальной лексикой и грамматикой.
Не буду разбирать все кейсы, но просто для примера: буква "ł"
читается так: делаем губы будто хотим произнести "у"
но произносим "в"
. Но лексически это родственник русской буквы "л"
, это видно на примере слов siła
(сила), było
(было), stało
(стало), słuchaj
(слушай), поэтому хотелось, чтобы буква выглядела как "л"
, но при этом было понятно, что произносится она, как минимум, с польским акцентом, поэтому был выбран такой вид с диакритиком "круг снизу", как "л̥"
. В итоге, в кириллице эти слова выглядят как сил̥а, был̥о, стал̥о, сл̥ухай, что, с одной стороны, облегчает их интуитивное узнавание, а с другой, сохраняет отличие от обычной "L/l"
.
Под конец жыця поврӧцил̥ на яснå стронӭ моцы и зе̥пхнåл̥ све̥го мистṗа до ре̥актора Гвязды Ċмерци ратуяц све̥го сына и тым самым пṗыврӧцил̥ рӧвновагӭ моцы.
Перевод и оригинал
Под конец жизни поворотился на ясную сторону Мощи и запинал своего мастера в реактор Звезды Смерти, спасая своего сына, и тем самым восстановил равновесие Мощи.
Опять же, более естественно для нас было бы сказать "обратился", а не "повротился", "светлая", а не "ясная", "Сила", а не "Мощь", но смысл передаётся почти без изменений даже почти полными кальками с польского.
Pod koniec życia powrócił na jasną stronę mocy i zepchnął swego mistrza do reaktora Gwiazdy Śmierci ratując swego syna i tym samym przywrócił równowagę mocy. (Wikipedia)
В свёртке исходный код функции которая получает польский текст на латинице и возвращает польский текст на кириллице. Код максимально и утрировано примитивен, не оптимизирован по скорости исполнения, не печёт пирожков, и, ни в коем случае, не является образцом правильного JavaScript. В нём нет комментариев, не поставлены точки с запятой и использованы var
(запрещено на территории планеты Земля) вместо рекомендуемого const
.
Функция конверсии на JavaScript, 100 строк
function pl_lat2cyr(txt) {
var basic_p = 'ABDFGHKLMNOPTUWYZabdfghklmnoptuwyz'
+ 'ÓóŻżŃńĆ挜ŹźĄąĘęVv'
var basic_r = 'АБДФГХКЛМНОПТУВЫЗабдфгхклмноптувыз'
+ 'ӦӧЖжЊњҸҹĊċӜӝÅåӬӭВв'
var cons_p = 'BCDFGHJKLMNPRSTWZbcdfghjklmnprstwzŁłŻżŃńĆ挜Źź'
var o = ''
var skip = false
for (var index = 0; index < txt.length; index++) {
if (skip) {
skip = false
continue
}
var item = txt[index]
var j = basic_p.indexOf(item)
var next = txt[index + 1]
if (next == null) next = ''
if (j >= 0) {
o += basic_r[j]
}
else if (item == 'Ł') { o += 'Л̥' } // Љљ
else if (item == 'ł') { o += 'л̥' }
else if (item == 'E') { o += 'Е̥' } // Ээ
else if (item == 'e') { o += 'е̥' }
else if (item == 'C') {
if (next == 'Z' || next == 'z') { o += 'ч'; skip = true }
else if (next == 'H' || next == 'h') { o += 'Х'; skip = true }
else o += 'Ц'
}
else if (item == 'c') {
if (next == 'Z' || next == 'z') { o += 'ч'; skip = true }
else if (next == 'H' || next == 'h') { o += 'х'; skip = true }
else o += 'ц'
}
else if (item == 'S') {
if (next == 'Z' || next == 'z') { o += 'Ш'; skip = true }
else o += 'С'
}
else if (item == 's') {
if (next == 'Z' || next == 'z') { o += 'ш'; skip = true }
else o += 'с'
}
else if (item == 'R') { //Ṗṗ
if (next == 'Z' || next == 'z') { o += 'Ṗ'; skip = true }
else o += 'Р'
}
else if (item == 'r') { //ṗҏ
if (next == 'Z' || next == 'z') { o += 'ṗ'; skip = true }
else o += 'р'
}
else if (item == 'I') {
if (next == 'A' || next == 'a') { o += 'Я'; skip = true }
else if (next == 'E' || next == 'e') { o += 'Е'; skip = true }
else if (next == 'Ą' || next == 'ą') { o += 'Я'; skip = true }
else if (next == 'Ę' || next == 'ę') { o += 'Ē'; skip = true }
else if (next == 'Ó' || next == 'ó') { o += 'Ӱ'; skip = true }
else if (next == 'U' || next == 'u') { o += 'Ю'; skip = true }
else o += 'И'
}
else if (item == 'i') {
if (next == 'A' || next == 'a') { o += 'я'; skip = true }
else if (next == 'E' || next == 'e') { o += 'е'; skip = true }
else if (next == 'Ą' || next == 'ą') { o += 'я'; skip = true }
else if (next == 'Ę' || next == 'ę') { o += 'ē'; skip = true }
else if (next == 'Ó' || next == 'ó') { o += 'ӱ'; skip = true }
else if (next == 'U' || next == 'u') { o += 'ю'; skip = true }
else o += 'и'
}
else if (item == 'J') {
if (next == 'A' || next == 'a') { o += 'Я'; skip = true }
else if (next == 'E' || next == 'e') { o += 'Е'; skip = true }
else if (next == 'Ą' || next == 'ą') { o += 'Я'; skip = true }
else if (next == 'Ę' || next == 'ę') { o += 'Ē'; skip = true }
else if (next == 'Ó' || next == 'ó') { o += 'Ӱ'; skip = true }
else if (next == 'U' || next == 'u') { o += 'Ю'; skip = true }
else o += 'Й'
}
else if (item == 'j') {
if (next == 'A' || next == 'a') { o += 'я'; skip = true }
else if (next == 'E' || next == 'e') { o += 'е'; skip = true }
else if (next == 'Ą' || next == 'ą') { o += 'я'; skip = true }
else if (next == 'Ę' || next == 'ę') { o += 'ē'; skip = true }
else if (next == 'Ó' || next == 'ó') { o += 'ӱ'; skip = true }
else if (next == 'U' || next == 'u') { o += 'ю'; skip = true }
else o += 'й'
}
else o += item;
}
return o
}
Если у вас есть идеи, как улучшить работу этой функции с точки зрения лингвистики и фонетики, пишите или делайте пул реквест. Ссылка в конце статьи.
Котлин – статычне тыпованы ēзык програмованя дзял̥аяцы на машыне виртуалне̥й Явы, ктӧры ест гл̥ӧвне розвияны пṗе̥з програмистӧв JetBrains. Назва ēзыка походзи од выспы Котлин недале̥ко Пе̥те̥рсбурга. Котлин ест запроектованы з мыċлå о пе̥л̥не̥й инте̥ропе̥рацыйноċци з ēзыками дзял̥аяцыми на машыне виртуалне̥й Явы.
Перевод и оригинал
Kotlin - статически типизированный язык программирования, работающий на виртуальной машине Java, который в основном разрабатывается разработчиками JetBrains. Название языка происходит от острова Котлин под Санкт-Петербургом. Kotlin разработан для полной совместимости с языками, работающими на виртуальной машине Java. (Google Translate)
Kotlin – statycznie typowany język programowania działający na maszynie wirtualnej Javy, który jest głównie rozwijany przez programistów JetBrains. Nazwa języka pochodzi od wyspy Kotlin niedaleko Petersburga. Kotlin jest zaprojektowany z myślą o pełnej interoperacyjności z językami działającymi na maszynie wirtualnej Javy. (Wikipedia)
В использовании латиницы есть одна особенность, практически невозможно, просто так, взять и отличить вставки на английском в польский текст, от самого польского текста. Отсюда, перлы вроде Еди, вместо Jedi или Дартх Ваде̥р, вместо Darth Vader. То есть, можно, конечно, их отличать программно, в теории, но для этого нужен словарь, как минимум, а то и какой-то грамматический искуственный интеллект, чтобы разбирать неочевидные случаи. Например, оказалось, что поляки пишут "online" прямо по-английски, а не "onlajn", как вроде бы надо по правилам фонетики польского языка.
Барбара Брылска (ур. 5 Червца 1941 в Скотниках) – полска акторка филмова. Една з найвыбитнейшых полских акторек повоенных. В латах 60. и 70. XX веку уходзила за сымбол сексбомбы полскего кина.
Перевод и оригинал
Барбара Брыльская (родилась 5 июня 1941 года в Скотниках) - польская киноактриса. Одна из самых ярких польских послевоенных актрис. В 1960-х и 1970-х годах она считалась символом секс-бомбы польского кино. (Google)
Barbara Brylska (ur. 5 czerwca 1941 w Skotnikach) – polska aktorka filmowa. Jedna z najwybitniejszych polskich aktorek powojennych. W latach 60. i 70. XX wieku uchodziła za symbol seksbomby polskiego kina. (Wikipedia)
Мне нравится это читать. Хотя, признаюсь, не имею понятия насколько это похоже на реальное польское произношение, или, вообще, на что это похоже.
В року 1983 фирма Atari впровадзила на рынек 2 улепшоне моделе компутера – Atari 600XL и 800XL
Перевод и оригинал
В 1983 году Atari выпустила две улучшенные модели компьютеров - Atari 600XL и 800XL. (Google)
W roku 1983 firma Atari wprowadziła na rynek 2 ulepszone modele komputera – Atari 600XL i 800XL (Wikipedia)
Для удобства использования я сделал расширение для браузера, которое конвертирует все текстовые элементы на странице по нажатию кнопки в тулбаре. При нажатии на слово оно переключается, туда-сюда, между кириллицей и латиницей, но для начала, надо на странице нажать кнопку в тулбаре, иначе вообще ничего не произойдёт.
Чтобы установить расширение
FireFox
Зайти в дополнения/расширения, нажать на шестерёнку, потом Debug Add-on, потом Load Temporary Add-on, и выбрать папку со скачаным и распакованым расширением. У меня FireFox не локализован на русский язык, потому названия на английском.
Chrome
More Tools -> Extensions -> Developer mode -> Load unpacked.
У меня Chrome не локализован на русский язык, потому названия на английском.
Какие можно сделать выводы? Польский язык в кириллице не стал, внезапно, понятен без перевода, но, в тоже время степень понятности польского языка в кириллической форме меня удивила. Я совершенно не ожидал, что лексически и грамматически у меня будет такой коэффициент распознования.
Стоит заметить, что лично мне, восприятие польского на слух даётся так же трудно, как и чтение польского языка латиницей, но опять же, это потому, что мои познания в этом языке равны нулю. По крайне мере были равны нулю ещё вчера, а после нескольких часов чтения по-польски в кириллице, у меня начали возникать всякие семантические и ассоциативные связи, может быть, таким способом даже можно втянуться в обучение языку.
Пишите ваше мнение в комментах, насколько вы смогли уловить смысл фраз и незнакомых, но родственных лексических единиц, то есть, в основном, слов. Если вы знаете польский, белорусский, украинский или другой славянский язык, ваше мнение тоже очень интересно, наверное, вы будете воспринимать польский иначе.
А это скриншот сайта с которого и началась эта статья, именно туда меня занесло в самом начале и мне стало интересно прочитать текст, прямо по-польски, без перевода:
Дисклаймер: я не утверждаю, что данная работа чем-то полезна. Я не призываю никого отказываться от изучения или использования латинской транскрипции польского языка. Я не преследовал никаких целей кроме любопытства. Я не утверждаю, что мой конвертор делает всё правильно и соблюдает все правила и исключения, хотя я постарался максимально полно отразить фонетику польского языка опираясь на справочники и статьи. Если существуют другие способы записывать польский кириллицей -- я их не нашёл.
Исходный код конвертера и веб-расширение находятся тут
Использованые ссылки:
Darth Vader в польской Википедии
Barbara Brylska в польской Википедии
Польский алфавит в Википедии
Польский алфавит для начинающих на сайте nowlasnie.com
Символы Unicode в Википедии
Страничка про Atari в польской Википедии
Сообщение о новом мировом рекорде в сборке Кубика Рубика на speedcubing.pl
Комментарии (110)
k12th
24.12.2021 01:58+5Немного знаю польский язык (курсы + 6 лет живу в стране), поэтому читать это всё было немного больно:) Но, конечно, имеет право на существование, как минимум для расширения кругозора.
Что касается записи польского языка кириллицей, то однажды я нашел такую штуку: http://cymraeg.ru/gramatyka/. Характерно, что для передачи носовых ą и ę используются юс большой и малый — которые когда-то обозначали такие же звуки в (древне)русском языке.
tyomitch
24.12.2021 16:57+2Характерно, что для передачи носовых ą и ę используются юс большой и малый — которые когда-то обозначали такие же звуки в (древне)русском языке.
Формально вы правы; но любой из польских носовых может соответствовать любому из древнеславянских носовых: например, ząb/zęby из зѫбъ/зѫби, или zając/zajęczy из заѩць/заѩчии
tommyangelo27
24.12.2021 01:59+3На польское произношение похоже очень отдалённо. Например, нет слова Цемна, ciemna читается примерно как Чемна, что будет соответствовать Темна.
Есть много слов, начинающихся с Cie.. , которые в русском будут начинаться с Те (но я не лингвист, и не знаю как правильно назвать такое соответствие).
Как игрушка - прикольно.
tyomitch
24.12.2021 15:48+4(но я не лингвист, и не знаю как правильно назвать такое соответствие)
ru.wikipedia.org/wiki/Когнаты_(лингвистика)
Более обще — польское C и белорусское Ц соответствуют русскому мягкому Т, польское DZ и белорусское ДЗ соответствует русскому мягкому Д. Не только в начале слова и не только перед IE, но и в других контекстах.4p4 Автор
24.12.2021 22:03+1Готов вам поверить, но есть, например, польское слово koniec, где "C" явно читается как "Ц". Так что модель немного сложнее.
stantum
24.12.2021 02:07+2Идея интересная, но необходимо проработать диакритику. Например, безобидное слово błąd пробретает новые краски.
VitalKoshalew
24.12.2021 07:06+2Так это то же самое слово, просто в разных языках оно по-разному используется, а с некоторых пор и произносится.
Lotto74
24.12.2021 16:30+1Нет, это не "то же самое слово". Błąd по-польски - ошибка. Слово того же корня, что и, например, błądzić - блуждать, сбиваться с дороги. То слово, что вы имеете в виду, по-польски будет kurwa.
kryvichh
24.12.2021 18:10+7Так русская "блудница" того же корня. От которой пошло слово из 5 букв.
tyomitch
24.12.2021 18:31+1Я специально перепроверил: нет, от разных, разошедшихся ещё в ПИЕ.
Одно имеет общую историю с английским blind, другое — с blend.
en.wiktionary.org/wiki/Reconstruction%3AProto-Slavic/bl%C7%ABd%D1%8A
en.wiktionary.org/wiki/Reconstruction%3AProto-Slavic/bl%C4%99d%D1%8Ckryvichh
24.12.2021 19:21+1Вот здесь, раздел этимология: https://ru.m.wiktionary.org/wiki/блудница
Происходит от праслав. , от кот. в числе прочего произошли: ... польск. błąd (род. п. błędu) ...
tyomitch
24.12.2021 19:33+1Несомненно, что блудница однокоренная с błąd; но вот в русском слове из 5 букв — другой корень.
kryvichh
24.12.2021 19:46+1Там ниже ещё про другую ступень чередования.
tyomitch
24.12.2021 21:03Несомненно. Вот только ступени чередования — это про ПИЕ.
kryvichh
25.12.2021 02:27+1Или про прославянский? Но в нашем контексте важно, что это был один корень на каком-то историческом этапе, ЧТД.
tyomitch
25.12.2021 11:55Или про прославянский?
Нет, там оно уже не работало.
ru.wikipedia.org/wiki/Аблаут_в_праиндоевропейском_языке#Судьба_аблаута_в_языках-потомкахНо в нашем контексте важно, что это был один корень на каком-то историческом этапе, ЧТД.
Если копать до ПИЕ, то можно много интересного «доказать», например что англ. black «чёрное» и фр. blanc «белое» — одно и то же самое.
VitalKoshalew
24.12.2021 19:45Два соседних славянских языка никуда не расходились в прото-индо-европейскую эпоху. Слово многогранное и имело на местности множество форм, значений, произношений, которые смешивались, расходились, снова смешивались. По состоянию на 2021 год по результатам полу-насильственного приведения телевизором всех к одному стандарту слова в польском и русском языках теперь совершенно разные и даже произносятся совершенно по-разному. Особенно сильно повлиял факт перехода в русском языке слова в категорию обсценных, что отсекло все остальные значения, так как никто не хотел быть неправильно понятым.
Если уж вы цитируете викисловарь, то там напрямую указано:От др.-русск. блѧдь ‘обман; вздор, пустяки; обманщик; безумный; прелюбодейка’
mortadella372
24.12.2021 20:01+1Два соседних славянских языка никуда не расходились в прото-индо-европейскую эпоху.
В прото-индо-европейскую эпоху это и был прото-индоевропейский. До разделения на балтийские, славянские, германские и тп.
Все это конечно очень спекулятивно, но для момента расхождения славянских языков мне встречались оценки около 1000 в.н.э.
tyomitch
24.12.2021 21:07Если уж вы цитируете викисловарь, то там напрямую указано:
От др.-русск. блѧдь ‘обман; вздор, пустяки; обманщик; безумный; прелюбодейка’
По-вашему, это указывает на его идентичность с błąd? По-моему, нет.VitalKoshalew
24.12.2021 23:37Да, это одно и то же слово, просто в современном русском языке вырвалось вперёд одно обсценное значение, а в современном польском оно как раз с большего утрачено.
См. классический польский этимологический словарь, там ссылка на русское слово даже имеется.tyomitch
25.12.2021 00:06См. церковнославянский словарь, в котором блѧдь и блѫдъ — два разных слова: оба на стр. 246, у обоих среди значений есть «блудство, разврат», но есть и необщие значения.
VitalKoshalew
25.12.2021 00:51+1В вашем же источнике указано, что используется и другой вариант того же слова ("вж. и блѫдъ").
В приведённом мной источнике про эту замену гласных тоже сказано.tyomitch
25.12.2021 01:09Хоть у двух "вариантов" и разные наборы значений - это все равно одно и то же слово?
VitalKoshalew
25.12.2021 01:47+2В приведённом вами словаре написано — используется и другая форма слова. В польском источнике указано, что одна форма слова — современная, другая осталась (к 1927 году) только в «церковном» польском языке.
Мне кажется, вы подходите к происхождению слов с точки зрения современных языков, которые записаны в словари и изучаются централизованно и унифицированно в рамках каждого государства. Ещё полвека-век назад и на протяжении всей предыдущей истории такого не было — условно говоря, в каждой деревне был свой говор. Государственные границы были условностью. Говоры и языки перетекали один в другой, смешивались, расходились. Люди не задавались вопросом «один ли прото-индо-европейский корень у этих слов?», просто говорили так, как в их местности принято, а в соседней местности было немного по-другому. Собрав это множество местных диалектов в один словарь мы можем выделить две статьи со ссылками, можем одну, можем устроить «сепулярий» — это не имеет значения. Словарь предназначен для поиска слова, соответственно будет столько статей на одно слово, по скольким пользователю будет удобно искать. Словарь вами приведённый — староболгарский, а там говоров бесчисленное множество:Пример: карта произношения ѫ в Болгарии
tyomitch
25.12.2021 11:42-1В приведённом вами словаре написано — используется и другая форма слова.
Нет, там написано «используется и другое слово». Варианты одного слова обозначены иначе, чем (полные или частичные) синонимы: сравните с записью на стр. 218 про агнѧ, где указано: «вар. ꙗгнѧ; вж. и агньць, овьчѧ»; и чуть ниже агода, где указано «вар. ꙗгода; вж. и плодъ».Словарь вами приведённый — староболгарский, а там говоров бесчисленное множество
Церковнославянский, который болгары (небезосновательно) называют староболгарским — это ru.wikipedia.org/wiki/Литературный_язык: говорили в каждой деревне по-своему, а писали так, чтобы прочесть мог любой православный. Какой толк от книги, которую могли бы понять только в одной деревне? (У некоторых языков, например арабского и китайского, такая «двухслойность» — невзаимопонятные региональные диалекты при общем письменном языке — сохраняется и по сей день.)
Наоборот, представление о том, что местечковый диалект достоин записи на бумаге — появилось только в 20в.
Zalechi
24.12.2021 23:50Błąd błądzić kurwa - симантически это синонимы. Курва пришла из латыни, и на итальянском ничего плохо не значит, а имено: поворот, кривая.
Славяне смекалистые и развили идею, применив "кривого" поведение индивида женского пола обозначив его латынским заимствонием. Все так делают..
Вот и получается, что это слова синонимы с разной этимологией: "Блядь, курва, прошмандовка" и так далее..
tyomitch
25.12.2021 00:14Ни из какой не из латыни:
(Этимологический словарь славянских языков под ред. Трубачёва, 1987)Zalechi
25.12.2021 00:38-1В вашем примере указано, что не связано с германским. Или я чего-то не заметил?
Вот мой анализ:
Dal lat. CURVUS. => с латыни...
Ищем этимологический словарь латыни:
curvus
[curvus], curvă, curvum
aggettivo I classevedi la declinazione di questo lemma
1 curvo, incurvato, ricurvo, incavato
2 tortuoso, sinuoso, serpeggiante
3 perverso, corrotto, distortoPS: испанцы красавцы, у них быстрее нашел более глуюокую этимологию, они до пра-инлоевпропейскго выложили ссылки, там кликабельно, гляньте:
http://etimologias.dechile.net/?curva
PPS: если Вы минус поставили ща упоминание слова "Блядь" в исследовательских целях, как предмет научного обсуждения, то я Вам сочувствую. Лингвисты работы пишут по этим делам и они есть в отркрытом доступе.
/disclaimer: пост 18+/
tyomitch
25.12.2021 01:00Нет, минус за то, что этимологию итальянского/испанского слова вы пытаетесь выдать за этимологию созвучного славянского. Между ними нет никакой связи, и ни один из ваших источников на такую связь не указывает.
Zalechi
25.12.2021 01:36Таки да. От "курицы":
https://ru.wiktionary.org/wiki/курва
Однако даже там есть много мнений, но польский лингвист отвергает связь с латынью, и тоде возводит к праиндоевропемкому:
https://ru.wikipedia.org/wiki/Курва_(лингвистика)
Буду знать. А я думал, что это из латыни заимствование, - типо пошла по кривой дорожке.
А что вы думайте про слово "воля"? Я его тоже возвел к латыни. Воля = свобода, я как-то нагуглил слово-за слово до "орла" в латыни с его свободным полетом... Volare - летать.
вы пытаетесь выдать
PS: ничего я не пытаюсь выдать, я анализирую в силу своих способностей
UPD: с "волей" видимо я ошибся по той же схеме: https://lexicography.online/etymology/в/воля
UPD2: я почему так рассуждал, когда к латыни возводил? Видимо когда я проводил первоначальный этимолгический запрос я сразу начинал с той мысли, что слова явно имеют один корень. Начинал поиск с итальянского, заранее пологая, что меня возведут к латыни. Делал я так искрене веря, что слово очень похожее в корне не могло быть импортировано романами(латинянами из славянских языков, в силу понятных причин. Однако видимо не стоило проявлять излишнюю самостоятельность и начинать копать не с той стороны.
Yaris
24.12.2021 02:11+1Помню, когда в Польше был в гостях, пытался читать их надписи из интереса. Вроде всё понятно, но столько усилий уходило на "парсинг", что интерес вскоре пропал. А приятели ничего, живут, читают по-польски :-)
А с такой штукой и я смогу читать :-)
Revertis
24.12.2021 02:36+9Имея родной русский и выучив словацкий, сразу начинаешь довольно неплохо понимать чешский (само собой), польский, болгарский, сербский, хорватский, и даже словенский. В разной степени, конечно. И много слов, что называется false friends, конечно же, но всё же. Словацкий как будто сохранил большую часть старославянского, и при этом является центральным для всех языков из стран вокруг.
bogolt
24.12.2021 21:30наверное все же «translator's false friends» иначе не очень понятно отчего же они ложные друзья.
Классический пример который звучит во многих фильмах когда lunatic переводят как лунатик ( правильный перевод «сумасшедший» )Revertis
24.12.2021 21:33+6Я ещё в языковой школе придумал фразу, чтобы хорошо доносить эту боль: čerstvý chlieb úžasné vonia - свежий хлеб восхитительно пахнет.
FrytechTV
25.12.2021 01:24Интересный пример. Как так получилось, что значения настолько разные, хотя схожие вроде бы слова?
Revertis
25.12.2021 02:35+1Я не настоящий лингвист, всего лишь полиглот. Но у меня есть предположения:
Черствый означало когда-то твёрдый. Им, например, называли свежие помидоры, так как они ещё не вялые. И в одном языке это слово стало означать свежий, в другом твёрдый, чёрствый.
Ужасный - скорее всего, означало ошеломительный (stunning). А так как ошеломлять можно и плохим, и хорошим, то в одном языке закрепилось одно значение, в другом другое.
Вонь. Скорее всего, всегда обозначало просто запах, и в словацком (и округе) осталось так же. Для неприятного запаха они используют слово смрад, и... слово запах! :) Кстати, один раз слышал просто пах в значении вонь. Может русское слово пах пошло от вони, которая была в определённой области тела?
Вообще, в словацком языке много наших русских слов, которые они считают устаревшими, но понятными. Например сказка. У них сказка это розправка. Так же есть примеры и наоборот, у них это нормальное слово, а у нас устаревшее. Примеры - чело, очи, уста.
Есть много слов, корни которых у нас остались в одних словах, но исчезли в других. Например, слово изречение. Корень рек/реч. У словаков есть слово речь, но они не рекают, а рекают чехи :))
Короче, очень интересно изучать эти разницы и похожести.
alambov
24.12.2021 22:06+1То что принято называть старославянским (церковнословянским) ближе всего к современному болгарскому. Это южнославянский язык, ставший языком церкви и сильно повлиявший на русский.
Вы навреное имеете ввиду праславянский язык - гипотетического предка всех славянских языков. А так да, зная русский (восточнославянский) и словацкий (западнословянский) легко провести параллели по всем группам славянских языков.Revertis
24.12.2021 22:19Да, вы правы, правильнее называть это праславянским языком. И действительно, зная восточнославянский плюс среднеевропейский славянский, довольно легко находить параллели.
molybdenum
24.12.2021 02:59+13в нашей областной библиотеке совсем худо было с английскими книжками. в основном учебная литература и адаптации. зато пять стеллажей польских книжек от фантастики Лема до детективов Ежи Едигея. Взял почитать со словарем и с удивлением понял, что привыкнув к польской нотации и подключив знания белорусского языка, вполне можно было читать и понимать прочитанное и даже удивляться особенностям польской грамматики и лексики. потом попытался так же разобраться с чешским — сложнее оказалось. словацкий — проще. потом болгарский. а потом я поступил в институт иностранных языков. на переводческий
vkni
24.12.2021 03:32+1Очень прикольно! С точки зрения Теории Языков Программирования это должен быть просто лексер, ака конечный автомат (см flex, ragel, и тд из этой когорты). Для JavaScript вроде FLEX.js.
Medeyko
24.12.2021 05:35+25Вот вам код в 29 строк. Не благодарите :)
pl_lat2cyr
function pl_lat2cyr(txt) { var pl = 'CŁcłSsRrIEeABDiFGHKLJMNOPTjUWYZabdfghklmnoptuwyzÓóŻżŃńĆ挜ŹźĄąĘęVv' var tp = '2x2x11116xx0006000006000006000000000000000000000000000000000000000' var ru = 'ЦЛцлСсРрИЕеАБДиФГХКЛJМНОПТjУВЫЗабдфгхклмноптувызӦӧЖжЊњҸҹĊċӜӝÅåӬӭВв' var p2 = 'ZHZHZZZZAEĄĘÓUAEĄĘÓUAEĄĘÓUAEĄĘÓU' var r2 = 'ЧХчхШшṖṗЯЕЯĒӰЮяеяēӱюЯЕЯĒӰЮяеяēӱю' var o = '' var next = txt[0] for (var index = 1; index < txt.length; index++) { var item = next; var j = pl.indexOf(next); next = txt[index] if (j >= 0) { if (tp[j] == 'x') { item = ru[j] + '̥' } else { var k = p2.indexOf(next.toUpperCase(), j); if (k >= 0 && k < (tp[j] - '0') + j) { item = r2[k] next = txt[++index] } else { item = ru[j] } } } o += item } return o }
tp - это "тип" буквы в pl. x - это значит, что после неё надо кружочек добавить, а цифра - это сколько разных вторых букв надо попробовать перебрать. Вторые буквы перебираются в p2, если там обнаруживается соответствие, то буква берётся из r2 из позиции, соответствующей p2; если не обнаруживается, то берётся из ru из позиции, соответствующей pl.
Постарался сохранить Ваш стиль. Точки с запятой и комментарии не добавлял!
WebUI
24.12.2021 06:19+4Это очень близко у украинскому. :) Прочитал, сначала узнал знакомые слова, но прочитав еще раз неизвестным оказалось только слово "Моцы", и то ближайшее "Мощи" (мощности) или силы.
oldnomad
24.12.2021 06:19+4Что касается "тёмного" Ł, то его было бы правильнее передавать как раз кириллическим Л (этимологически оно происходит от твёрдого славянского /л/), а "светлое" L -- как Љ из вуковицы (этимологически происходит от мягкого /ль/, в восточно-польских диалектах так и произносится).
arthin
24.12.2021 10:06+2Как на мое ухо, так произносят "Ł" они обычно как типичнейшее "w" или белорусское "ў". Хотя, конечно, по аналогичным словам в других славянских понятно, что оно родственно "л".
HelgaK
25.12.2021 01:41+3Так белорусское "ў" тоже стоит на месте русских "л": пайшоў - пошел, поўдзень - полдень итд. Но мне как белоруске было бы приятнее видеть "ў" в скрипте, чем эту непонятную "л̥".
un1t
24.12.2021 12:08+3Оказалось, что przyjaciółka i towarzysz можно записать на кириллице какпṗыяцӱл̥ка и товаṗыш, то есть в переводе приятельница и товарищ.
Это читается "пшыячулка" , только ł там читается как w в английском
Выучить правила чтения польских слов не сложно, это займет несколько часов. Возможно это было бы даже быстрее чем писать код.
Но идея интересная.
alexandme
24.12.2021 13:51+4В контексте статьи можно упомянуть Междусловянский язык, по своему звучанию, он очень похож на транскрипцию польского от автора публикации и достаточно интуитивно понятен.
Launcelot
24.12.2021 13:51-12Жуть как неприяно было читать, вроде буквы русские, а написана ересь какая-то. Благо хром научился делать перевод...
IvanSTV
24.12.2021 13:51-2Еще один открыл для себя Америку, что изучение языков одной языковой группы относительно родного упрощается при фонетической адаптации, а навык бессознательного сравнительного языкознания благотворно сказывается на изучении других языков той же группы.
Знание украинского, например, наряду с русским позволяет вполне сносно понимать славянские языки, так как у человека банально появляется больший интуитивный словарь архаичных общих корней языка.
Например, древнеславянское слово "ять", то есть "иметь" имеется во всех славянских языках. но в современном русском сохранилось только в виде вторичном - то есть, в качестве неявного измененного корня или части корня типа "приязнь", "взять" и пр. Но в славянских используется архаичная прямая форма -например "пояти смартфону" или "яти тебя в дупу"
tyomitch
24.12.2021 15:55+3упрощается при фонетической адаптации
В данном случае адаптация орфографическая, с полным игнором фонетики (не как что-то плохое)
kewnt
24.12.2021 13:52+3Когда большая часть Польши входила в состав России, запись кириллицей использовалась и на практике. Видел даже фото/сканы книг. К сожалению, пруфов не будет - понятное дело, сейчас эту информацию стараются не афишировать (как и масштабы православия в Польше).
tsypanov
26.12.2021 15:07+1Румынский некогда тоже записывался кириллицей, причина была в стремлении сохранить православие. Когда же угроза окатоличивания исчезла, то его снова перевели на латиницу, которая для романских языков объективно подходит лучше кириллицы.
borovichok13
24.12.2021 15:34+1Кино:Потоп, Огнем и мечом, Пан Волыдеевский. А как же"Ставка больше, чем Жизнь"? и "Пепел и алмаз"?
ZaitsXL
24.12.2021 15:58+1советую сходить еще и на болгарскую Википедию, там по общему мнению русскоязычному человеку можно надорвать себе все от смеха даже без конвертера
mrdubz
24.12.2021 17:35+6А можно и на курсы "уеб дизайна" в Пловдиве пойти
kryvichh
24.12.2021 19:10+1Из славянских только в белорусском есть буква, которая передаёт "w" точно: "Ўэб".
tyomitch
24.12.2021 19:36А как же польская Ł?
kryvichh
24.12.2021 20:00+4Возможно, хотя на западе Беларуси и Виленщине местные поляки говорят твёрдое "л", а не "ў".
С другой стороны, поляки никогда не будут "переводить" Web как Łeb, даже если в современном польском звучание похожее. Зато слова с твёрдым "Л" - Ługańsk.
Lotto74
24.12.2021 16:33-1В упор не понял подход. Правила чтения по-польски в оригинале осваиваются максимум за полчаса безо всяких корявых псевдо-транслитераций. От того, что автор показал в статье, просто кровь из глаз идет. Зачем? Особенно при наличии гуглопереводчика, который дает вполне сносный перевод?
Vsevo10d
24.12.2021 16:51+5О, 15-й стандарт подъехал, в дополнение к Словио, Межславянскому языку и прочим.
astenix
24.12.2021 17:34+3Польский знаю на уровне «O, kurwa!», но дело же не в этом. Абзац
Початково рыцер Еди, под вплывем Дартха Сидиоуса прешедл на цемна стронэ Моцы и прыял тытул „Дартх Вадер”.
для меня выглядит как «белорусы коверкают украинский язык».
Початково = спочатку же. Сперва, ранее, до того.
Рыцер Еди = рыцарь, походу, по имени Эди.
Вплыв = пiд впливом (произносится "пид вплЫвом"), влияние. Под влиянием.
Цемна строна = тут непонятно, пропустим.
Моца = хммм. По-румынски "а моцэи" - кемарить, засыпать. По-украински ничего не похоже, только мiцность - крепкость, сила. Твердый орешек - Міцний горішок. Временно переведем как "сила".
И принял титул = аааа, так Дарт Вейдер же, этот контекст нам понятен. Тогда моца = мощь, сила, а цемна строна = темная сторона силы, я же твой отец, канальязационный ты Люк! Давай вместе узнаем, кто твой мать.
Zwerg
24.12.2021 18:51+2Не совсем в тему статьи - просто вспомнилось: прекрасные польские sci-fi-fantasy короткометражки Legendy Polskie
https://www.youtube.com/watch?v=1J_Y12RqeLM&list=PLFttT4XjEwKQjYyH9m2vwwXQG94tUEeR1
steanlab
24.12.2021 19:54+2Замечание одно — моей бабушке по вашей инструкции было тяжело установить конвертер на firefox :) Пришлось помогать. Ну а по теме — спасибо за труд и за статью. Познавательное расширение, хотя польский через такую призму мне очень сильно напоминает чтение болгарских сайтов. Ну или украинских, со странноватой орфографией.
p.s. сам потомственный беларус (вырос в беларуской языковой среде) и наверное поэтому с пониманием почти ко всем языкам славянской языковой группы.
dimalu85
24.12.2021 21:21+4Почитав комментарии удивляешься насколько русский ушел далеко от других славянских языков. Даже белорусский, который русифицировали последние 150 лет, все еще очень близок и польскому и украинскому. А вот носителям только русского эти же языки уже намного сложнее понятны.
steanlab
24.12.2021 21:47+2русифицировать то русифицировали, но беларуский, в отличие от русского, сохранил и начертание латиницей и даже т.н. арабицу (транслитерация беларуского языка арабской вязью татарского населения, "бойцов Витовта"). Последняя для меня лично была открытием, после того как один из разработчиков сделал конвертер вроде предложенного автором, из кириллического беларуского в арабический беларуский.
p.s. «беларуский» а не «белорусский» — просьба воспринимать как авторский стиль и не рассматривать как нарушение норм орфографии :)
ژِوَ بَلَرُثْtyomitch
24.12.2021 21:56+1Возможно, для вас станет открытием, что арабицей когда-то писали и южные славяне?
be-tarask.wikipedia.org/wiki/Басьнійскі_арабскі_альфабэт
tyomitch
24.12.2021 22:06Сомневаюсь, что болгарский или словенский или чешский белорусам так же легко понятны, как языки своих ближайших соседей.
steanlab
24.12.2021 22:48+1Болгарский и чешский — вполне. Хотя беларусы, как и россияне, с разным, хм, филологическим бэкграундом. Жители центральной и части восточной Беларуси хуже ориентируются в тех же польских и украинских словах, чем жители западных областей. Это по личному опыту. Хотя несмотря на крошечный размер страны (по сравнению с той же РФ) у нас тоже есть языковые аномалии. Например т.н. «мотольский говор» (по названию д. Мотоль в Бресткой области), который я, честно говоря, с трудом разбираю (проще понять ураинских гуцулов на границе с венгрией, чем земляков из Полесья).
У беларусов есть еще и соседи в виде Латвии и Литвы, вот там совсем тяжело. Хотя кое-какие знакомые/созвучные слова встречаются. Гарбата (чай), например, в беларуском и арбата в литовском. Заимствования — наше все :)
Revertis
25.12.2021 03:35Русский очень сильно вульгаризировался. Как и до сих пор каждому надо вые**уться, чтобы придумать новое слово, или поменять падеж с предлогом так, чтобы было почти непонятно.
Достаточно посмотреть этимологию простых русских слов рот, глаз, ребёнок, например. Всё произошло от ругательных слов, и заменило нормальные славянские - уста, око, дитя.
tsypanov
26.12.2021 13:23+1"Нормальные славянские" никуда не делись. Уста осталось в слове "устный", око осталось в словах "очный", "окулист", "очки", дитя осталось в слове "детский".
Просто русский богаче.
Revertis
26.12.2021 13:27Но ведь в номинативе мы их не используем. Значит исчезли. Не надо искать останки в других словах.
tsypanov
26.12.2021 13:51Устный перевод, устная речь, устное замечание.
Очная ставка, заочное обучение, приём у окулиста, очки.
Клиника "Мать и дитя", детский сад, детская площадка.Вполне себе повседневные слова. Также как слово "коло" осталось в словах Колобок, околица, околыш, колобродить, около, "снеданок" в слове снедь, "порожний" в слове порожняк и т.д. и т.п. Так называемые "исчезнувшие" слова никуда не делись, а просто немного изменили форму или область применения.
Revertis
26.12.2021 14:15+1Но ведь предметы, которые обозначались словами уста, око и дитя теперь называются другими словами. Не надо придумывать отмазки.
tsypanov
26.12.2021 15:04Клиника "Мать и дитя" - здесь слово "дитя" сохранило своё первоначальное значение.
Выражение "всевидящее око" - здесь слово "око" сохранило своё первоначально значение.
Далее, выше вы писали: "Всё произошло от ругательных слов" - от каких именно ругательных слов произошли упомянутые вами "глаз", "ребёнок", "рот" и т.д.?
З.Ы. Вспомнил ещё слова "детина" и "детинец".
Revertis
26.12.2021 15:07Это всё можно загуглить. Хватит троллить.
tsypanov
26.12.2021 15:15+2Это не троллинг, это опровержение ложного тезиса "Русский очень сильно вульгаризировался."
Загуглил этимологию слова рот:
Рот. Общеслав. Исходное *rъtъ — суф. производное (суф. -тъ) (с перегласовкой ъ/ы) от той же основы, что рыть (см.). Буквально — «то, чем, разрывая, выкапывая, добывают пищу» (о животных, птицах). Ср. др.-рус. рътъ (> рот в результате падения редуцированных) «клюв».
И где тут "Всё произошло от ругательных слов"?
И да, происхождение этого слова - славянское. Теперь если вас не затруднит, объясните, почему "уста" - это "нормальное славянское" слово, а "рот" - нет. Это, повторюсь, не троллинг, я пытаюсь для себя понять критерии "нормальности".
Revertis
26.12.2021 15:24Интересно, почему в этом описании написано про слово рыть, но не написано существительное - рыло? Наш рот образован от слова рыло. Вот и вульгаризация языка. Ребёнок это раб, или тот, кто не может сопротивляться. Глаза сами найдите :)
tsypanov
26.12.2021 15:38+1Не рот образован от слова рыло, а рыло и рот образованы от общего корня "рыть". С "раб" та же история, это слово произошло от общего корня с ребёнком.
Глаз. Искон. Современное значение «орган зрения» является вторичным и свойственно только рус. яз. Экспрессивное образование на основе глазъ «блестящий шарик, камешек»; ср. просторечное шары (выкатить) «глаза», польск. gały «глаза», родственное сущ. галька (см.), ср. такие же перен.-метафорич. по происхождению названия частей тела, как голова, губа, нога, палец и др. (см.). Глаз был назван по его похожести на блестящий шарик, камешек.
Где вульгаризм?
tyomitch
25.12.2021 21:19+2И к аргументу «насколько русский ушел далеко от других славянских языков» я уже однажды приводил подборку:
wünschen; Dach; Druck; danken; Kosten; Rechnung; retten; Geschmack; Zwiebel; suchen
віншувати; дах; друк; дякувати; кошт; рахунок; рятувати; смак; цибуля; шукати
поздравлять; крыша; печать; благодарить; расход; счет; спасать; вкус; лук; искать
В какой из строк славянские корни, а в какой заимствованные?
Белорусский ряд совпадает с украинским; так что это как раз они, оставаясь близки друг другу, отошли от славянских корней.tsypanov
26.12.2021 13:42+2А если смотреть ряд тюркизмов, то всё ещё запутаннее: русский и белорусские ряды во многом (хотя не во всём) совпадают, будучи близкими к славянским корням, в отличие от украинского:
meydan, torba, borç, leylek, terazi - турецкий
майдан, тоба, борг, лелека, терезы - украинский
площадь, сумка, долг, аист, весы - русский
плошча, сумка, доўг, бусел, шалі - белорусский
tsypanov
26.12.2021 13:20насколько русский ушел далеко от других славянских языков
Русский: тёмная сторона силы
Украинский: темна сторона сили
Белорусский: цёмны бок сілы
Польский: цемна стронэ МоцыКак раз русский, украинский и белорусский намного более близки к друг другу, чем польский.
tyomitch
26.12.2021 13:37+1Не уверен, что это хороший пример: и в белорусском есть старана, и в польском есть siła, и в русском есть бок и мочь наряду с мощь.
Какой из синонимов выбирают переводчики — вопрос мутный: например, на be-tarask.wikipedia.org/wiki/Сьветлы_бок_Сілы в заголовке и в шаблонах всюду сіла, а в тексте статьи всюду моц.tsypanov
26.12.2021 13:45+1Я взял первый же пример из статьи, вот прямо из заголовка. Уверен, можно надёргать примеров в обе стороны, было бы желание.
anmmm
24.12.2021 22:14+3Польский - один из самых близких к русскому из невосточнославянских языков. Не то чтобы совсем интуитивно понятен, но, разобравшись с правилами чтения / произношения и запомнив совсем немного ключевых слов, можно без труда читать со словарём, буквально с первого дня.
nkretinin
24.12.2021 22:15+4Для беларуса или украинца не составит большого труда прочитать такой текст, потому что эти языки ближе к польскому, чем к русскому (это трудно осознать из-за использования латиницы в польском)
Но в целом я был в Болгарии много раз, и мне были понятны болгарские фразы больше за счёт знания украинского, чем русского (другое дело, что это касалось текстовых фраз, на слух болгарский язык вообще нельзя понять из-за странного произношения и ударений, но это влияние длительной турецкой оккупации)
Есть много видео на Ютубе с межславянским языком - это фиктивный язык, который базируется на всех славянских языках, и для его понимания одного русского недостаточно, но поляк, чех, украинец и серб его могут понять без проблем
gt25
24.12.2021 22:15+5зная беларуский и немного украинский понимаю практически все слова что вы привели. впрочем большой разницы с оригинальной латиницей не вижу, достаточно разучить как звучат буквы и буквосочетания и всё
limercia
24.12.2021 22:15+3Гении мыслят одинаково, однако.
Примерно с год назад в уме у знакомого возникла схожая идея, реализованная в виде плагина для браузера: https://addons.mozilla.org/en-US/firefox/addon/cyrillicpolski/
Само собой, есть некоторые неточности перевода, но помогает, если частично язык на слух можешь воспринимать.
alex_eine
24.12.2021 22:15+3Знаю русский и украинский и примерно понимаю как читаются специфические для польского буквосочетания в латинице, читать молча - тяжеловато, как только читаю вслух - дык это ж украинский просто с много шипящих и практически любой текст становится понятен.
Играл в ведьмака на польском (хотел сравнить озвучки) - на слух 80% понятно, а имея английские субтитры и примерно понимая о чем речь с прошлых прохождений - понятно всё и в этом есть свой инетресный колорит, куррва.
KuziaWawa
24.12.2021 22:15+3Для человека давно живущего в Польше и хорошо знающего язык понимать стало хуже.
romancelover
25.12.2021 01:39По-польски читать умею, и указанный выше текст кириллицей почти не вызвал у меня затруднений. Хотя мне ближе этимологический подход (cz=ч, ł=л, ć=ть и т.п.) с учётом того, что некоторые звуки в польском произносятся немного не так, как в русском (ч твёрдый, л смазанно, похоже на w, мягкий т похож на русское ч и т.п.). Хотя если прочитать их как в русском, поляки поймут, хотя заметят сильный акцент.
В интернете на разных сайтах предлагается много вариантов транслитерации польского на кириллицу. Тот вариант, который мне нравится больше всего, описан на странице http://steen.free.fr/cyrpol/
ZiggiPop
25.12.2021 05:38Очень забавно читать.
Не знаю как это получатся, но польский по сложности как беларуский, в любом виде - в кирилице или нет, то есть почти как родной.
infino1
25.12.2021 10:32Живу и работаю в Польше 12 лет, конечно читаю и Польский язык уже как родной, и такое отношение к переводу с польского вызывает улыбку. Но возможно кому-то, чей взгляд свеж и не знает языка, такой подход в чем то поможет.
PS. Знание беларуского портит учёбу польского в части произношения, постоянно сваливаешься в мягкий беларуский.
MagnetonBora
26.12.2021 21:42Боюсь проблема уже в названии. "Ciemna strona mocy" читается как "Чемна строна моцы". И к тому же есть нюанс в чтении букв ę и ą.
vakhramov
хм...кириллица в гугль транслейт даёт валидный перевод с Белорусского,
возможно - приведение к Белорусскому будет более полноценным, несколько случайных фраз ткнул, и перевелось правильно
Adler_lug
Вся фраза в общем то переводится с белорусского более менее понятно на русском:
Видимо влияние польского языка исторически сыграло не малую роль на белорусский...
molybdenum
никаких «видимо». было ж одно государство литвы с польшей
kryvichh
Удивительно, какие вещи могут делать переводчики на основе нейросетей! Там из 3 "белорусских" слов только 1 без ошибок. Буквы "и" в белорусском вообще нет.
averkij
Я думаю, там для непопулярных языков используется мультиязычная модель с общим словарем. Поэтому она просто пытается перевести последовательность как может.
tyomitch
Интересная версия. Действительно, если указать языком оригинала болгарский (на который этот текст совсем не похож), то переводит так же.