Кому и зачем нужно писать русские слова латинскими буквами?

Конечно, это нужно для русскоязычных людей. Очевидно, что идея об иностранцах, которые прочитают латинские буквы на уличной вывеске и сразу поймут, что они означают, является очень сильным преувеличением. Для иностранцев русскоязычная латиница не нужна. Она нужна нам — людям, которые говорят на русском.

В первую очередь адекватный стандарт нужен для конвертации названий и имен для международных документов. Очевидно, что паспорта, водительские удостоверения и даже визитки должны быть с нормальными именами, написанным по правилам русского языка, а не английского, немецкого или французского. Сейчас в России и Казахстане используется стандарт конвертации из Британского Географического общества, который был принят столетия назад и предназначался для населенных пунктов, а не имен. И цель была отличать их от английских названий, поэтому, например, вместо очевидной буквы H для русской Х там используется KH — две буквы, которые носители английского языка не умеют читать, поскольку в их языке такого нет. И в русском тоже нет. Этот стандарт не подходит для нормального использования. Он даже не всегда одинаково относится к тем же самым буквам: Ц может превратится в C или в TS. А буква Ё чаще всего становится буквой E.

Второй областью использования является интернет и любые программно-аппаратные системы, где принято использовать латинские буквы. Есть такое понятие — «Человекопонятный URL» — сокращенно ЧПУ. Он используется для удобства пользователя, который может понять содержимое страницы сайта из ее адреса. Сейчас этот формат не стандартизирован и появляется масса вариантов, которые, если быть честным, все-таки больше похожи на стандарты перевода русскоязычных имен для документов на латиницы. Для программистов иногда может быть удобно именовать функции, переменные, таблицы и др. с помощью русских слов, но приходится это делать латинскими буквами. Для этого тоже очень нужен единый адекватный стандарт, который передает особенности русского языка, а не какого-то другого, как происходит это сейчас.

Подойдет ли адекватная латиница для других языков с кириллическим алфавитом?

Кажется, что идея, которая используется для адекватной конвертации русских слов на латиницу не подойдет для большинства других языков с кириллическим алфавитом. Каждый язык нужно рассматривать отдельно, и особенности русского написания слов не похожи на другие языки, которые используют тот же алфавит, поэтому этот принцип конвертации использовать нельзя.

Можно ли использовать правила из других языков для конвертации русского на латиницу?

Конечно. Общий принцип прост: буквы, которые имеют похожее звучание должны быть использованы по прямому назначению. Но если какие-то буквы или их сочетания можно упросить, то нет смысла заимствовать сложные правила из других языков, которые не являются родственными русскому. Нет никакого смысла писать две или три буквы для описания одного звука только по причине того, что так сделано в другом языке (SH для звука Ш в английском или SCH для Ш в немецком).

Общее описание идеи конвертации русских слов в написание латинскими буквами

В русском языке есть важная особенность, которая для отображения на письме прибегает к использованию неочевидного (но всем привычного) способа: мягкость и твердость согласных букв регулируется последующей гласной буквой. В русском для гласных букв нет разделения на твердые и мягкие, хотя есть всегда мягкие и всегда твердые согласные, на которые не влияют последующие гласные: Й, Ч, Щ — всегда мягкие; Ж, Ц, Ш - всегда твердые.

Если отказаться от использования специальных гласных букв для обозначения мягкости согласных, то перевод на латиницу русского языка становится очень простым и вариативным. Основной проблемой латиницы является «недостаточное количество» гласных, которых вдвое меньше, чем в русском. Однако, если посчитать, что буквы E, Ё, И, Ю, Я являются составными (со звуком Й) и используют функцию смягчения согласной, то латинских гласных становится достаточно для безболезненного написания русских слов.

Поэтому остается только выбрать способ, как будет обозначаться мягкость согласной в слове. Есть два пути: использования вспомогательной буквы и использование надстрочных и подстрочных элементов. Кажется, что использование дополнительной буквы будет проще и удобней, но это может повлечь некоторые особенности, которые приводят к созданию дополнительных правил-исключений для такого написания. Поэтому первый способ, с дополнительными «точками» у мягких согласных.

Ļuboy șimvol nad iļi pod bukvoy oboznačayet yeyo m̭agkosţ

Совершенно неважно будет ли это точка, вертикальная или горизонтальная линия, хвостик, символ похожий на ударение из учебника, сверху или снизу — все они обозначают мягкость согласной буквы. Функция придания мягкости уходит от гласных и возвращается на свое законное место.

Гласные А, О, У, Ы, Э превращаются в очевидные A, O, U, I, E. Конечно, здесь появляются первые исключения:

  • В начале слова и после гласных буква I всегда означает И, так как в русском нет слов, которые начинаются на Ы;

  • В начале слова буква E всегда означает Э, так как слова, которые начинаются на русскую E нужно писать с помощью двух букв: YE.

Буквы E, Ё, Ю, Я превращаются на письме в YE, YO, YU, YA, когда стоят в начале слова, после гласной, твёрдого или мягкого знака. Буква И остается I, без добавления Y, так как звук Й в ней отсутствует, кроме случаев, когда она стоит после мягкого знака (чьи, семьи, третьи).

Таким способом мы автоматически исключаем необходимость использования твердого знака: podyezd. Мягкий знак в середине слова тоже исчезает: usṯye. Функцию разделительного мягкого и твердого знака выполняет буква Y. Сам по себе твердый знак сейчас существует только для того, чтобы «отменить» функцию смягчения, которую дают буквы E, Ё, И, Ю, Я. Поэтому такой способ с использованием Y убирает лишнее правило.

Буквы Е и Ё

Эти буквы на письме часто не различают. Это очень плохо для фамилий и имен. Конечно, чередование букв Е и Ё в однокоренных словах будет выглядеть при конвертации не очень «красиво», хотя в русском написании с ними все более менее в порядке: ёж, ежи — но yoj, yeji. Это нельзя считать проблемой, поскольку чередование гласных в корнях слов вполне обычное явление: неприкасаемый, но прикосновение; изберу, но избирать; выдеру, но выдирать; замерли, но замирать и т.д.

Исключение исключений

При использовании таких правил конвертации в латиницу, с учетом знания, что часть согласных букв всегда мягкие, а часть — твердые, уже нет проблем с написанием слов: цирк, цинк, цифра, цыплёнок, цыган, циркуль и пр. Они всегда будут написаны с помощью латинских букв C и I.

То же самое касается правил ЖИ-ШИ, ЧА-ЩА, ЧУ-ЩУ. Конечно, там нет немотивированного выбора одной или другой буквы, но все же намного удобней, когда гласная одна — I, и другого варианта не может быть.

Слова жюри, брошюра, парашют становятся адекватными: они будут написаны именно так, как произносятся: juři, broxura, paraxut.

Буква Ш

Одна буквы лучше, чем две или три. Поэтому необходимо сократить все, что только возможно. Именно поэтому буква Ш должна превратится в одну букву. Если изучить вопрос, то оказывается, что после задействования всех очевидных согласных, совпадающих в русском и латинском алфавите, остаются несколько доступных для использования: Q, X, W (или V).

Сразу хочется отбросить W, которая может играть роль буквы V, если кто-то ошибся при написании. И пусть она визуально может быть схожа с Ш, но правильное прочтение неподготовленными пользователями практически невозможно.

С буквой Q и X ситуация менее очевидна: Q можно прочитать как К (а у нас уже такая есть). А вот букву X прочитать как ИКС сложней всего, так как она почти не используется в языках на основе латиницы.

Именно этот факт кажется удобным для использования X в качестве буквы Ш. Тем более, как оказалось, символ X (греческая буква КСИ) в испанских переводах арабского заменял арабский звук Ш. И именно из этих переводов X попадает в латинский алфавит. В некоторых словах португальского и в мексиканском испанском буква X обозначает звук Ш. Конечно, исторические причины не являются аргументом, но вот использование редкой буквы, которая задействована очень мало, вместо двух или трех символов, кажется разумным использованием «свободного пространства».

Очевидно, что Щ является мягкой версией Ш, а значит дополняется «точкой»: kladovx̱ik, obx̣iy, yax̰ik, ẍuka, zapravx̌ik — и тут тоже подходит любой символ.

Буквы Ц и Ч

Буква Ц должна конвертироваться просто и очевидно — в C. Как в латинском алфавите. Заменять ее буквами TS нет никакого смысла. Это только запутывает и добавляет исключений.

Поскольку буква Ц всегда твердая, а Ч всегда мягкая, то логично сделать из них пару по аналогии с Ш и Щ. Конечно, они не похожи по звучанию, но «специальная C» выглядит более знакомо из-за влияния западно-славянских языков. Поэтому počta кажется достаточно логичным, и увидеть в слове почта, например Q — poqta — несколько сложнее.

Буквы Ж и Й

Поскольку в латинском алфавите буква J называется ЖИ, то нет смысла искать специальные сочетания букв (ZH — это вариант не из английского языка, а из Британского стандарта написания названий русских населенных пунктов). Возможно, что будут некоторые сложности, поскольку J во многих европейских языках используется для обозначения Й. Но, как было сказано выше, ориентироваться на какой-то конкретный язык, который не является русским нет никакого смысла, если это приносит неудобства и добавляет исключений.

При использовании J в качестве звука Ж, остается только один адекватный кандидат на букву Й — это Y. Кроме самой буквы Й латинская Y будет заменять «сложные» гласные, где это уместно. То есть в E станет YE, если стоит в начале слова или после твердого знака. С буквой Y все становится очень просто: yama, yenot, yolka, yula.

Буквы E и Э

Если слово начинается на Э, то там будет латинская E: eto, ekvator, ekzam̭en. В середине слова в русском языке не очень часто встречается звук Э, и его обычно обозначают русской буквой E, из-за чего случаются разночтения в произношении некоторых слов: рейтинг, сканер. А иногда и прямые исключения: шоссе, пенсне. При адекватном переводе этих слов на латиницу можно будет выбрать правильный вариант сразу, и не оставлять простора для фантазии: reyṭing (РЭЙТИНГ), skañer (СКАНЕР), xosse (ШОССЭ), p̌ensne (ПЕНСНЭ). Хотя, если бы эти слова появились в русском, имеющим латинскую алфавитную основу, то и проблемы бы не возникло: скорее всего слова остались бы в своем оригинальном написании.

А ведь можно добавить исключение? В русском языке буква Э очень редко встречается в середине слова, а значит латинская E почти всегда смягчает предыдущую согласную? Да, это действительно так. Но этот подход оставим для второго способа отображения, когда по какой-то причине «точки» использовать не хочется.

Можно ли остаться в рамках букв латинского алфавита и не использовать дополнительные элементы?

Конечно. Самое простое — использовать озвученные выше правила и просто не добавлять «точки». Этот текст останется читабельным, но будет менее удобен для полноценного использования. Но есть и другой вариант, который, однако, добавит новые исключения.

Самый простой вариант — использовать отдельную букву для смягчения согласных и ставить ее сразу после «стандартной» твердой гласной. Как было сказано выше, если адекватно переводить буквы из русского языка в латинский алфавит, то остается несколько букв: Q, W, X.

Но буква X уже используется для обозначения буквы Ш. Буква W слишком похожа на V по смыслу. Буква Q кажется несуразной и нелогичной. Что если посмотреть на другие языки? Буква H кажется подходящей: в немецком она не произносится, если стоит после гласной, в английском она почти не произносится в начале слова, так же и во французском, а в португальском она идеально регулирует L и N делая их мягкими!

Itak, budhem ispolhzovath H dlha smhagchenhiya soglasnih bukv

Здесь у нас автоматически появляется CH обозначающая букву Ч (как мы все втайне хотели). Буква Щ становится почти элитной XH. А вот после J и Y букву H ставить уже не нужно — они не смягчаются.

Конечно, есть и проблемы. Слово СХОДИТЬ будет написано буквами shodhith, что можно рочитать, как СЁДИТЬ, если следовать правилам. Но если такого слова нет (а «сёдить» нет), то двойственности в понимании не будет. Вообще появляется довольно много исключений, но они не приводят к нечитаемому тексту. Более того, русская буква Х не является слишком распространённой в языке. Тем более, редкость, когда она идет сразу после согласной. Вот список слов, которые удалось быстро найти:

алхимия — alhimhiya — может быть прочитано: альимия
археолог — arheolog — ареолог
волхв — volhv — вольв
вход — vhod — вёд
колхоз — kolhoz — колёз
меланхолия — melanholhiya — меланёлия
мхи (мн.ч. мох) — mhi — ми
мхе (пр.п. мох) — mhe — ме
необходимость — nheobhodhimosth — необёдимость
обхват — obhvat — обьват
обхохотаться — obhohotaca— обёхотаться
синхронно — sinhronno — синьронно
спецхран — spechran — спечран
схема — shema — сема
шхуна — xhuna — щуна
начхать — nachhath — начать (но Ч всегда мягкая, поэтому, с учетом правил, такое слово должно быть прочитано правильно)

И ещё есть большое количество слов с корнем «ход». Очевидно, что неправильно прочитанные слова не являются существующими словами, кроме слова ми, означающего название ноты.

Но как смягчать саму H? Можно использовать двойную: HH. Но лучше ввести дополнительное правило:

  • HI, HE — всегда мягко;

  • HA, HO, HU — всегда твердо.

Конечно, есть исключения:
твердое HE будет в словах: двухэтажный, трёхэтажный, четырёхэтажный, сверхэлегантный, сверхэнтузиазм и слова со сверх-.

Если принять часть слов с русской буквой Х после согласных, как исключения, которые нужно запоминать, то кажется, что неоднозначность возникает только в слове mhi: это может быть нота ми, и может быть слово мхи (мн.ч. мох). Кажется, что контексты настолько далеки, что такое исключение можно допустить, поэтому ми и мхи пишется одинаково: mhi. Конечно же, слово мы превращается в mi.

Если же H идет после гласной, то читается, как русская Х. Ведь гласные не смягчаются. Вот примеры: vihod, zahod, moheroviy, na vdohe, v sumatohe.

Со словами xosse и phensne снова никаких проблем: в xosse нет смягчающей H, а значит это ШОССЭ, в phensne в первом слоге H смягчает звук П, а отсутствие H во втором слоге оставляет твердость русской буквы H, а значит это ПЕНСНЭ.

Можно добавить еще больше правил и исключений?

Конечно. Их легко придумывать. Новое правило почти всегда гарантирует новое исключение.

Как было сказано выше, в средине слова буква Э встречается нечасто. И даже там, где произносится Э (шоссе, пенсне) пишут русскую букву Е. Поэтому, можно принять, что латинская E в середине слова всегда смягчает предыдущую согласную, а исключения нужно будет запомнить. Конечно, буквы J, C, X (Ж, Ц, Ш) не смягчаются.

Буква Э в середине оказывается, в основном, в аббревиатурах, сложносокращенных и иностранных словах:

безэмоционально
безэнергетической
безе
вазэктомия
зэк
квинтэссенция
киберэволюция
кэш
флэшмоб
лэптоп
лэйбл
мэйнстрим
мэр
мэрия
мэтр
НЭП
облэнерго
пленэр
пэр
РЭБ
рэкет
санэпиднадзор
санэпидстанция
судмедэксперт
тинэйджер

А может сделать смягчение с помощью другой буквы?

Возможно, что W будет выглядеть не слишком страшно, особенно с учетом «всегда мягкой E». Но можно спутать с V. Можно использовать X, а вместо нее для Ш использовать W. Слова с множеством X выглядят весело, но эта буква похожа на спецсимвол, и когда крестов много, то слово кажется неправильным. Тем более, что прочитать его с первого раза становится сложней. Можно использовать Q, что выглядит иногда даже мило, но читается с трудом: pqivo, krqivo.

После нескольких проб написать текст с другими буквами для смягчения, оказалось, что более читаемым (а может просто привычным по другим языкам) получается вариант с H.

Какой вариант лучше?

При написании от руки, безусловно, лучшим вариантом выглядит тот, в котором меньше букв. То есть вариант с «точками». Тем более, что он дает почти неограниченные возможности для дизайна шрифтов. Но от руки сейчас пишут редко, а специальные символы добавить в текст, который набирается на клавиатуре не так уж легко (хотелось бы автоматическую подстановку с помощью драйвера клавиатуры). «Точечный» легче читается, в нем меньше правил и исключений, но он требует программных дополнений к интерфейсам операционных систем и текстовых редакторов. Минусом может быть использование конкретно точки в конце слова, если оно последнее в предложении или после него идет любой знак препинания: может визуально казаться, что пропечаталась лишняя точка. Но никто не говорит, что это должна быть именно точка. Можно использовать волнистую линию, дугу, вертикальную или горизонтальную черту.

Вариант с буквой H удобен, если хочется прямо сейчас перейти к написанию текстов на латинице. Если нужно использовать точные ЧПУ. Если хочется называть мультиязычные программы русскими словами.

Оба варианта могут быть взаимозаменяемыми. Возможно, при условии, что «всегда мягкая E» не используется. Но её использование очень повышает удобство.

Можно даже использовать оба варианта, если это позволяет ситуация. Это бессмысленно, но может быть интересным дизайнерским решением для коротких фраз или отдельных слов.

Когда можно начинать использовать эту латиницу?

В любой момент. Не нужно ждать, когда кто-нибудь издаст закон о переводе русского языка на латиницу. Перевод нам не нужен. Просто должен быть альтернативный инструмент для своих задач:

  • для использования в интернете;

  • для устройств без русской раскладки;

  • для фирменного названия;

  • для программирования;

  • для написания имен;

  • для дизайнерских изысков.

Это только начало

Принимать плохой вариант, который предложили старинные англичане, нельзя. Нужно искать хороший. Пусть даже поиск будет долгим и не всегда продуктивным.

Концепция «смягчения согласных» более точное показывает особенности русского языка и позволяет уменьшить количество используемых букв. Возможно, что появятся другие способы для простой и короткой записи русских слов латинскими буквами.

Хорошо, когда каждый желающий сможет сформулировать основную идею и вывести правила, чтобы можно было обсудить и выбрать наиболее удачный вариант: краткий и понятный.

Комментарии (84)


  1. Homyakin
    06.07.2024 18:01
    +22


    1. RomanKerimov
      06.07.2024 18:01
      +4

      Ну а как же Юникод, почему он не стал 100501 вариантом кодировки, а наконец‐то решил наши проблемы?


      1. Homyakin
        06.07.2024 18:01

        Про юникод ничего не скажу. Но относительно транслитерации этих стандартов вагон и маленькая тележка. Есть проект iuliia, там этих схем на любой вкус и цвет: российские, международные, от компаний, с диактрикой и без неё. Чем предложенный вариант лучше любого из описанных - загадка.


      1. kryvichh
        06.07.2024 18:01
        +2

        В целом да, но какой конкретно: UTF-8, UTF-16LE, UTF-16BE, UTF-32?


        1. ImagineTables
          06.07.2024 18:01

          Это как выборы в автократии. Юникод спроектирован так, чтобы победил только один вариант, и вы сами знаете какой.


      1. lair
        06.07.2024 18:01
        +2

        ...какой конкретно юникод? Я до сих пор вижу проблемы из-за несогласованности byte order mark.


    1. askv
      06.07.2024 18:01

      Победит лучший (скромно надеюсь).


  1. askv
    06.07.2024 18:01
    +3

    Отличная разработка. Ожидал, правда, что где-то в конце статьи будет алфавит и свод всех правил, чтобы не собирать его самому из всей статьи. И было бы неплохо, если бы был конвертер кириллицы в такую латиницу и наоборот.


    1. smallreg Автор
      06.07.2024 18:01
      +2

      Действительно. Забыл.


      1. askv
        06.07.2024 18:01
        +6

        Использование диакритических знаков - всё-таки утопия. Напечатать их на стандартной раскладке невозможно, поэтому лучше всегда писать через h, как и было предложено. Лучше выбрать какой-то один вариант правил и его использовать последовательно. Я бы предложил апостроф после согласной, но вряд ли это хорошая идея в компьютерном мире. А есть алфавит наоборот - русско-латинский?


        1. RomanKerimov
          06.07.2024 18:01
          +3

          Я смог сделать без диакритики и апострофа

          • Используется та же орфография, что и для русской кириллицы, потому что неудобно параллельно пользоваться двумя разными орфографиями

          • То есть русская фонетика и орфография передаются столь же хорошо, как и в кириллице

          • Это по большей части наиболее привычный для русских вариант латиницы — англотранслит, отклонение от которого происходит лишь для удовлетворения выше обозначенных целей

          • Нет отклонения от классических русских названий латинских букв — икс не превращается в ха или уж тем более в ша


      1. novoselov
        06.07.2024 18:01

        Выбор X для обозначения ш и щ странный, больше подошло бы использование S.
        Причем у вас скорее 2 типа изменений, точка сверху или снизу для твердости и мягкости, галочка сверху для звонкости. Тогда Ш будет с точкой, а Щ с галочкой (как Ч)


        1. VZNKN
          06.07.2024 18:01
          +1

          Ну типа s уже занята под замену кириллической 'с'


    1. BOBAH1
      06.07.2024 18:01
      +3

      а давайте сразу на иероглифы переходить, чего уж там.


  1. SergeyProkhorenko
    06.07.2024 18:01
    +16

    Это совершенно нечитабельный вариант русской латиницы. У такого результата несколько причин:
    1. Очень поверхностный, неполный и ненаучный анализ русской фонетики
    2. Необоснованно отброшено смягчение согласных перед определенными гласными, которые в других языках обозначаются с помощью умлаута
    3. Не было проведено анализа того, как другие языки передают латиницей звуки, похожие на звуки русского языка
    4. Не было проведено анализа того, как другие языки обозначают на латинице смягчение или отверждение согласных, а также шипящие согласные и ударение с помощью диакритических знаков
    5. Справедливо отказавшись от одних диграфов, автор предлагает другие, о которые спотыкается взгляд при чтении

    Вот читабельный вариант русской латиницы, лишенный этих недостатков: Sovremennaya russkaya latinica. Эту латиницу ChatGPT безошибочно переводит на кириллицу без каких-либо подсказок, промптов или правил. Любой русскоязычный человек бегло читает ее без подготовки и не зная правил.


    1. smallreg Автор
      06.07.2024 18:01
      +2

      1 Вы правы. Могли бы вы прислать ссылку на статью, где полный научной анализ современой русской фонетики, а именно описано взаимодействие букв в словах. Мне кажется, что я русский знаю достаточно неплохо, и все случаи здесь предусмотрены. Да, невозможно сделать мягкий знак для конечных шипящих в женском роде, но я не считаю, что такие слова читаются иначе по сравнению с отсутствующим мягким знаком после конечных щипящих в словах мужского рода;

      2 Приведите пример, пожалуйста. Вероятно, я не знаком с этими языками. Я правильно понимаю, что вы предлагаете поставить «точку» над гласными, которые будут смягчать согласную? Если так, то символ h вместо точки в этом случае приведет ровно к описанному варианту;

      3 Другие языки передают очень по-разному, и я считаю, что брать все правила из произвольного языка неправильно. Другой язык на то и другой, что правила будут отличаться. Если брать, то только подходящие вещи. Не вижу причин, например, брать tsch из немецкого, чтобы изобразить один звук ч

      4 Я очень мало знаю других языков, и мне кажется, что это не очень нужно. Нужно знать русский, так как мы не переводим на другой язык, а используем только алфавит. С учетом моих микроскопических знаний я определил, что h является смягчением для некоторых букв в португальском, а x(икс) в нем звучит как ш в названиях населенных пунктов

      5 Можно полностью опустить все знаки над или под буквами, если они вам не нравятся. Это не утвержденный стандарт. Это только идея переместить функцию смягчения на буквы, которые смягчаются. Способы могут быть разные. Два варианта я показал.

      Простите, но я не понимаю причины, почему ChatGPT должен являться мерилом хоть в чем-нибудь. Пока это только интересная игрушка. Ваша ссылка интересна, но она точно так же, как и все остальные способы предлагает транслитерацию: замену одной буквы на другую, без осмысления как эти буквы работают в русских словах. Они сделали попытку добавив, почему-то, только смягчение мягким знаком, но половина гласных имеют эту функцию смягчения, но почему-то она реализуется другим способом? А в конце мне стало совсем непонятно: оказывается, с русской латиницы нужна транслитерация имен(почему только имен?) на английский. Тогда вообще непонятна необходимость переписывать русский на латиницу. Мне кажется, что они совершенно серьезно предлагают переводить язык полностью, а не для особых случаев. Мне кажется, что ни один из здесь присутствующих не скажет, что есть хорошие правила транслитерации, результат которых ему удобно читать в большом объеме.

      Вот их вариант:
      Boĺše polovinî čelovečestva čitayet i pišet na latinice. Yužnîye sosedi Rossii massovo perehodät na latinicu, oriyentiruyaś na uspešnîy opît Turcii. Serbî v častnom porädke perehodät na latinicu. Rossiya sama vremä ot vremeni delayet šagi v storonu latinici: graždanskiy šrift Petra I, reforma orfografii 1918 goda, podgotovlennaya yeşo v 1904-m, sovetskiy proekt latinizacii russkogo alfavita 1929 goda, prodvigavšiysä snizu. Perevod russkogo yazîka na latinicu možet okazatsa vînuždennîm i daže pospešnîm – v silu veskih ekonomičeskih i političeskih pričin.

      Вот мой вариант:
      Boḷxe poloṿini c̣elovec̣estva c̣itayet i pixet na laṭiṇice. Yujniye soseḍi Rosṣii massovo perehoḍat na laṭiṇicu, oṛiyenṭiruyaṣ na uspexniy opit Turcii. Serbi v c̣astnom poṛadke perehoḍat na laṭiṇicu. Rosṣiya sama vreṃa ot vremeṇi delayet xaġi v storonu laṭiṇici: grajdansḳiy xṛift Petra I, reforma orfograf̣ii 1918 goda, podgotovlennaya yex̣o v 1904-m, sovetsḳiy proyekt laṭiṇizacii russkogo alfaṿita 1929 goda, prodṿigavxiyṣa sṇizu. Perevod russkogo yazika na laṭiṇicu mojet okazaca vinujdennim i daje pospexnim — v ṣilu vesḳih ekonoṃic̣esḳih i poḷiṭic̣esḳih pṛic̣in.

      А здесь тот же текст, но вместо точки стоит буква h:
      Bolhxe polovhini chelovechestva chitayet i pixet na lathinhice. Yujniye sosedhi Rosshii massovo perehodhat na lathinhicu, orhiyenthiruyash na uspexniy opit Turcii. Serbi v chastnom porhadke perehodhat na lathinhicu. Rosshiya sama vremha ot vremenhi delayet xaghi v storonu lathinhici: grajdanskhiy xrhift Petra I, reforma orfografhii 1918 goda, podgotovlennaya yexho v 1904-m, sovetskhiy proyekt lathinhizacii russkogo alfavhita 1929 goda, prodvhigavxiysha snhizu. Perevod russkogo yazika na lathinhicu mojet okazaca vinujdennim i daje pospexnim — v shilu veskhih ekonomhicheskhih i polhithicheskhih prhichin.

      Вместо нескольких способов смягчения и нескольких диакритических знаков, у меня только один знак и только один способ смягчения. И любой вариант в таком объеме и без практики читается очень тяжело.

      Мысль там интересная, только используется сразу несколько правил, да еще и дополнительная транслитерация "для английского", что меня ставит в тупик. Мне кажется, что запомнить одно правило и несколько исключений проще, чем целый список вариаций значков.

      Кроме того, используется порочная логика, что буква ЭС похожа на букву ША, а буква ЗЭ пожожа на ЖЭ. На самом деле, в русском языке эти пары букв выглядят так: ЭС - ЗЭ, ША - ЖЭ. Звук С - глухой звук, З - звонкий и вторая пара: Ш - глухой, Ж - звонкий.


    1. novoselov
      06.07.2024 18:01

      Хороший вариант, но не понятно зачем там визуально столько намешано.

      Изначальные две точки над гласными читаются легче из-за аналогии с Ё, но это не совсем про мягкость, в списке там должна быть ї (и с 2 точками) для обозначения Й. А обычная i (и с точкой) как раз указывает на мягкость и стоит эту же точку распространить на согласные (для унификации).

      У буквы Щ при это есть хвостик, а у буквы Ц нет. И зачем то завели отдельный символ твердости для двух букв Э и Ы.


      1. SergeyProkhorenko
        06.07.2024 18:01

        @smallreg

        1 https://foxford.ru/wiki/russkiy-yazyk/sootnoshenie-bukv-i-zvukov

        2 Эстонский (и в меннее выраженном виде также другие языки, где есть умлауты). Диграфы для смягчения согласных (h) хуже читаются, чем диакритические знаки (акут). Тем более, букву h любой русский скорее прочтет как [х], чем как мягкий знак.

        3 Я имел в виду прежде всего использование диакритических знаков в латинице славянских языков.

        4 В разных языках решаются одни и те же проблемы. Во многих случаях они решаются одинаковым образом. Было бы неразумным не исследовать этот опыт, а изобретать свой велосипед. Кроме того, многие люди знают или изучают несколько языков, и им проще, когда эти языки похожи по начертанию и букв и по обозначаемым этими буквами фонемам.

        В алфавите по возможности не должно быть ничего необычного и тем более путающего. Например, использование "x" для обозначения звука [ш] кого угодно собьет с толку. Использование букв (J), которые в разных языках обозначают разные фонемы или даже несколько разных фонем, - тоже плохо. Применение букв (I), которые в разных местах текста обозначают разные звуки ([и] и [ы]), нарушает принцип фонетического письма, приближая текст к иероглифам.

        Использование одного и того же диакритического знака "точка под буквой" для выполнения совершенно разных функций (смягчение согласных и обозначение шипящих звуков [ч] и [щ]) сбивает с толку. Каждый диакритический знак должен выполнять свою уникальную функцию (смягчение предшествующей согласной, отверждение предшествующей согласной (перед [э] и [ы]), смягчение согласной, обозначение шипящей согласной, ударение).

        5 Ваш отказ от умлаутов, смягчающих предшествующие согласные, а особенно от автоматического смягчения согласных перед латинскими E и I приводит к перегрузке текста диакритическими знаками, смягчающими согласные. Кроме того, на самом деле звуки, обозначаемые буквами Я и А, Ю и У, Е и Э, И и Ы, Ё и О отличаются друг от друга не только смягчением предшествующей согласной, но и своим тоном. Поэтому неправильно выкидывать из алфавита половину гласных.

        То, что ChatGPT смог без подсказок понять совершенно новый для него алфавит говорит о том, что это фонетический и системный алфавит, а не нагромождение исключений из правил.

        Транслитерация русской латиницы на английский нужна именно для использования имен в английских текстах (паспорта, дорожные указатели и т.п.).

        Для шипящих звуков в качестве основы следует использовать те буквы, фонемы которых похожи, так как создаются похожими действиями говорящего. Именно такой принцип традиционно применяется в латинице славянских языков. Опять же, похожесть алфавитов может быть удобной. Чередование звонких и глухих согласных не имеет к этому никакого отношения. Буква Ч вообще не имеет пары, и тогда от какой звонкой согласной ее нужно образовывать? Вы, кстати, как и я, в этом случае взяли за основу Ц. Та же ситуация и с Щ.


  1. uhf
    06.07.2024 18:01
    +6

    Для иностранцев русскоязычная латиница не нужна. Она нужна нам — людям, которые говорят на русском.

    Зачем? Давно прошли те времена, когда приходилось отправлять SMS на латинице, чтобы экономить символы. Других причин использовать латиницу для русского языка нет. ЧПУ - уродливое порождение SEO, им место на свалке.
    Международные документы будут читать, как ни странно, иностранцы. Им требуется имя на латинице, чтобы вбить его в свою базу - допустим, это Vasya. Как оно произносится на русском - иностранцев вообще не интересует, им это не нужно. Их в принципе устроит любая уникальная последовательность символов.

    Сейчас в России и Казахстане используется стандарт конвертации из Британского Географического общества

    На деле, в России и Казахстане уже разные стандарты транслитерации, и это приводит к ряду проблем. Еще один стандарт явно ситуацию не исправит.


    1. randomsimplenumber
      06.07.2024 18:01
      +3

      Зачем изобретать ещё одну транслитерацию? Разве что если вдруг кириллица станет недоступна.


    1. RomanKerimov
      06.07.2024 18:01

      Причины есть — человеческая физиология. Так уж вышло, что 26 букв удобнее набирать десятью пальцами, чем 33

      Ну потому что посчитаем:

      • Большие пальцы не берём — у них особое положение и функция, а любой другой палец может уверенно и точно нажимать по три кнопки — в главном ряду, ряд выше, ряд ниже — 8×3=24

      • Указательные пальцы длинные и отклоняются в сторону, поэтому добавляем ещё по 3 кнопки — получаем 30

      И вот так получается, что на 30 кнопок помещаются 26 букв и ещё 8 знаков препинания, чего более чем достаточно, а вот 33 буквы на них не помещаются

      Ну взгляните сами на картинку, насколько здесь перегружен мизинец, и эта область клавиатуры заставляет держать руку неудобно перпендикулярно горизонтальным рядам, а не под удобным углом в 40—45 градусов


      1. askv
        06.07.2024 18:01
        +7

        Печатаю десятипальцевым методом, никогда не замечал, что латиницу проще печатать, а кириллицу сложнее. Примерно одинаково на самом деле. Вопрос привычки.

        P.S. У Вас и раскладка не такая, как я печатаю.


        1. RomanKerimov
          06.07.2024 18:01

          А я как заметил, я вообще прошёл путь к десятипальцевому методу довольно нестандартным путём. Я как то однажнды узнал про Дворак, да и переставил кнопки на клавиатуре под него. И совершенно потрясающим побочным эффектом этого стало то, что я наконец‐то перестал смотреть на клавиатуру при наборе кириллицы. И мне это так понравилось, что я вернул всё обратно, после чего я освоил слепой набор и на Двораке

          Ну и потом уже спустя какое‐то время я начал замечать, что что‐то в кириллическом наборе меня напрягает, несмотря на то, что я кириллицей набирал чаще. Заметил я это скорее всего из‐за того, что Дворак очень бережно относится к перемещению пальцев

          И вот я начал раскапывать этот вопрос, и обнаружил тут два аспекта. Первый — это уже упомянутый перегруз правого мизинца буквами, вынуждающий поворачивать правую руку вправо. А второй, что на ЙЦУКЕН два указательных пальца буквально набирают 65 % букв в тексте — то есть десятипальцевый набор уже становится и не вполне десятипальцевым

          И вот собственно так постепенно я и пришёл к тому, чтобы разработать недостающий годный вариант бездиакритической русской латиницы

          Я честно не знаю как так вышло, что в эпоху зоопарка кодировок по всей видимости никто так и не придумал латиницу, которая бы не использовала диакритику, апостроф, была бы полностью однозначной и совместимой с русской орфографией, и при этом не прибегала бы к маргинальному использованию латинских букв — то есть удовлетворила бы сразу все требования, которые по отдельности стараются удовлетворить разные стандарты транслитерации русского языка

          Ну похоже у меня получилось сделать такую латиницу: https://habr.com/ru/articles/827106/#comment_27013418


          1. askv
            06.07.2024 18:01

            не прибегала бы к маргинальному использованию латинских букв

            не вижу в этом большого смысла, вопрос привычки на самом деле

            Ну похоже у меня получилось сделать такую латиницу

            если хотите её продвинуть, то лучше напишите подробную статью, а не просто табличку замен. На первый взгляд мне Ваш вариант нравится меньше, чем приведенный в настоящей статье. Нужно хорошо потрудиться над аргументацией, почему именно такие замены, почему другие хуже и т.д. и т.п. Пусть лучше накидают минусов и критики, чем закупоривать идею.


            1. RomanKerimov
              06.07.2024 18:01
              +3

              Есть запрос — будет статья


      1. randomsimplenumber
        06.07.2024 18:01

        Вместе с латиницей нужно переходить на латынь. Или на эсперанто какое нибудь, где слова покороче и грамматика попроще.


        1. RomanKerimov
          06.07.2024 18:01

          Ну, в русской грамматике, конечно, есть свои сложности, но с другой стороны эти нерегулярности, которые возникают на стыке корней, суффиксов и окончаний, носят исключительно закономерный характер, и их запомнить уж точно проще, чем английскую орфографию, например

          Преимущество русского по сравнению с латынью и эсперанто ещё и в том, что уже есть огромное число носителей русского языка и большое количество контента

          Конечно, очень интересно, как ситуацию изменят языковые модели, которые по сути принципиально уже решили проблему перевода

          Но как будто бы по прежнему не будут нужны языки, на которых почти никто не говорит


      1. BOBAH1
        06.07.2024 18:01
        +2

        ты это китайцам расскажи про десять пальцев


        1. RomanKerimov
          06.07.2024 18:01

          А у китайцев всё хорошо — они на 26 кнопочек жмакают при наборе


    1. Furriest
      06.07.2024 18:01
      +1

      Уточню — иностранцам важно, как произносится имя, написанное на латинице. Ну либо вам придется привыкать, что в аэропорту и любом другом присутственном месте вас будут вызывать по тому звучанию, которое прочитается иностранцем с "вот этой вот транслитерации" на его языке.

      И поддержу, внутри страны использование транслитерации совершенно бессмысленно. Первый кейс из введения к статье (на международных документах) — он как раз для иностранцев, а с ЧПУ соглашусь вдвойне — это абсолютное зло и должно быть уничтожено, как и в принципе любые SEO-механизмы, искусственно улучшающие положение того или иного сайта без повышения качества контента. Вместе с людьми, эти механизмы продвигающими.


      1. randomsimplenumber
        06.07.2024 18:01

        А вот тут неплохо было бы использовать фонетическое письмо, передающее звучание. Как в англо-русском словаре.


        1. Furriest
          06.07.2024 18:01

          Да, но, во-первых, его будет чудовищно сложно набирать (и тогда придется держать три версии записи - чересчур), а во-вторых, полгода лапу на сердце, вы правда рассчитываете, что ресепшионист в отеле или медсестра в травмпункте будет уметь читать фонетический алфавит? :)


          1. randomsimplenumber
            06.07.2024 18:01

            вы правда рассчитываете, что ресепшионист в отеле или медсестра в травмпункте будет уметь читать фонетический алфавит? :)

            Ну, во первых ничего сложного там нет ;) Во вторых - правильно она все равно не прочитает. Будет оно записано кириллицей, транслитерацией или хоть клинописью. Если она специально не тренировалась.


            1. inkelyad
              06.07.2024 18:01

              Ну, во первых ничего сложного там нет ;)

              Я вот уверен, что 100% населения земли разницы между какими-нибудь звуками этого алфавита просто не услышит.


        1. vkni
          06.07.2024 18:01

          Да его никто не знает, кроме редких профессоров лингвистики.


      1. inkelyad
        06.07.2024 18:01
        +2

         Ну либо вам придется привыкать, что в аэропорту и любом другом присутственном месте вас будут вызывать по тому звучанию, которое прочитается иностранцем с "вот этой вот транслитерации" на его языке.

        Вспоминается легенда(?) о том что китайцы просто используют имена, которые могут произнести иностранцы. В общем, не вижу в этом ничего страшного.


        1. Furriest
          06.07.2024 18:01

          Ну да, вроде бы это не легенда, особенно в отношении имени Хуэй :)

          Поэтому и нам нужна транслитерация в тот вид, который могут прочитать и потом воспроизвести иностранцы, во всяком случае большинство. А современный ужас в виде iuliia - это тупое копирование машиночитаемого стандарта ICAO 9303 в поле "имя", люди просто не задают себе вопроса "зачем" (но да, чтобы изменить применяемую в паспортах транслитерацию — нужно будет менять именно рекомендации ICAO, это не локальная история). Машиночит же вообще надо записывать юникодом с переводом его в 36-ричную систему счисления.

          Есть, конечно, альтернативный путь — перед каждым посещением новой страны находить нейтива, просить его прочитать то, что написано в паспорте, вслух на диктофон и потом учить звучание собственного имени в стране. Я так с японцами делал. Но хотелось бы упростить жизнь всем :)


          1. randomsimplenumber
            06.07.2024 18:01

            хотелось бы упростить жизнь всем

            Не получится ;)

            Хочется чтобы японцы правильно произносили вашу фамилию? Надо чтобы кто-то записал японскими буквами по японским правилам. Латиница, хоть с умляутами хоть без, им ничего не упростит. Буквы то они прочитают, но слово получится нерусское ;)

            То же самое с китайцами, индийцами, африканцами..Финнами.. Все они учат славянскую латиницу (чтобы читать вашу фамилию. Понимать язык это не поможет).

            Нейросеть, которая умеет записать слово на языке Х по правилом языка У - вот что вам нужно ;)


            1. vkni
              06.07.2024 18:01

              Надо чтобы кто-то записал японскими буквами по японским правилам.

              Ага, и обучить каждого встречного-поперечного недостающим навыкам произношения.


              1. randomsimplenumber
                06.07.2024 18:01

                В любом случае навыки произношения не появятся автоматически от наличия умлятов/гачеков/диграфов, если в японском такого нет.


          1. inkelyad
            06.07.2024 18:01

            Есть, конечно, альтернативный путь — перед каждым посещением новой страны находить нейтива

            Просить у него справочник имен, выбирать, какое понравилось и использовать его, пока находишься в этой стране.

            А та бюрократия, которая настаивает, что оно должно хоть сколько-то походить на имя в родной стране - попадает под какой-то то там пункт из "Falsehoods Programmers Believe About Names"


  1. kryvichh
    06.07.2024 18:01

    Интересные варианты, удобные для современного литературного русского языка. Проблемы очевидны, основные две:

    1) невозможность написания некоторых иноязычных имён и названий, напр. начинающихся на "ы" (Ын).

    2) сложность передачи особенностей региональной речи и родственных славянских языков, скажем в худ. литературе ("чык-чырык").

    1-й вариант хорош (1 звук - 1 буква), но вводит диакритику. 2-й решает проблему диакритики, но допускает буквовые дуплеты. В целом, ваша система письма выжимает максимум из латиницы, позволяет беглое чтение (но не написание).

    Все-таки кириллица - максимально адекватный способ письма для славянских языков. Она создавалась для славян, и потом ещё дошлифовывалась много столетий в каждом языке. Здесь 1 звук - почти всегда 1 буква = 1 касание клавиатуры, и минимум диакритики.


    1. RomanKerimov
      06.07.2024 18:01

      1 звук — почти всегда 1 буква — это, конечно, очень сильное преувеличение

      У мягкого знака довольно высокая частотность в 1,74 %, а это каждый раз диграф в сочетании согласным, который обозначает 1 звук

      Чуть большее количество касаний вообще не является проблемой — проблемой является необходимость двигать руками при наборе или неудобно размещать кисть, от чего у людей начинает болеть запястье. Более подробно я раскрыл суть проблемы в этом комментарии: https://habr.com/ru/articles/827106/comments/#comment_27013446