Текст написан иностранным агентом – лицом, проживающим за пределами России (в Канаде)

За пару дней до Рождества на Хабре появился пост про транслитерацию польского языка кириллицей. Хотя идея на первый взгляд выглядит всего лишь как занимательное развлечение, на практике с задачами подобного рода периодически сталкиваются лингвисты. Когда лингвисту необходимо сравнить лексику родственных языков (особенно когда речь идёт о массовом сравнении в рамках корпусной лингвистики), сравниваемые языки нужно для начала «привести к общему знаменателю», то есть передать в единой графике, чаще всего латинице, чтобы облегчить сравнение. Даже с учётом неизбежных расхождений между орфографией и произношением (как в английском и французском языках) единая система письма сильно упрощает задачу сравнения. И не только сравнения, но и изучения. Скажем, если Вы начали учить язык с совершенно незнакомой системой письма (корейский, китайский, санскрит и т.п.), наверняка первые изученные Вами слова и фразы будут записаны в транслитерации латиницей (а то и кириллицей).

Ни кириллица, ни латиница не является единой унифицированной системой письма. В каждом языке, использующем кириллицу или латиницу, есть свои правила произношения того или иного знака, весьма отличные друг от друга. Но кроме того, существуют многочисленные дополнительные знаки для звуков, присутствующих в одном языке, но отсутствующих в другом. К примеру, звук «ш» существует во многих европейских языках, но создать единую букву для него в латинице так и не сподобились. Где-то обходятся сочетаниями (sh в английском и албанском, sch в немецком, ch во французском, sz в польском, sc в итальянском, sj в шведском, si или se – в ирландском), где-то под этот звук «переопределили» базовые буквы латиницы (x в португальском, старая знакомая s – в венгерском), где-то изобрели новые буквы путём добавления надстрочных или подстрочных значков к старым (š в чешском, словацком и балтийских, ş в турецком, ș в румынском – приглядевшись под микроскопом, увидите, что знак немного отличается от турецкого; и даже в искусственном языке эсперанто придумали свой знак ŝ). Некоторым языкам повезло – в них этого звука вообще нет, как не было его в латыни (отчего, собственно, и возникли эти проблемы с изобретением дополнительного символа).

Вопрос о том, почему в этих странах не хотят прийти к единым стандартам, отставим пока как риторический. Национальный суверенитет ещё никто не отменял, а насколько они страдают от такого разнообразия норм – это их проблема и их внутреннее дело.

Из языков, использующих латинский алфавит, только английский прекрасно обходится без дополнительных знаков. Формально, конечно, в английском они тоже есть (например, в словах типа fiancé, café), но в тех крайне редких случаях, когда они нужны, их услужливо вставляет автокорректор. Поэтому базовой английской раскладкой клавиатуры вполне обходятся англоязычные страны – США, Великобритания, Австралия, Новая Зеландия и другие (а "заточенный" под американцев Corel WordPerfect Office до сих пор ухитряется проблему неанглийской латиницы даже не игнорировать, а злобно троллить - кто знает, насколько по-садистски у них реализован Юникод, тот поймёт, о чём я).

Совсем другое дело – страны Европы и Латинской Америки. Практически в каждом из тамошних языков есть знаки, дополнительные к базовой латинице. Но мало того – в каждом языке они свои, абсолютно без оглядки на соседей.

Ну и что, скажете вы, велика печаль! Для большинства из нас-то это точно не проблема. Но это вполне актуальная проблема, например, для немалого количества европейцев, где территорию многих государств можно проехать на машине за несколько часов. Как бы ни хотело любое из этих государств обойтись только своим суверенным языком, в реальности бизнес требует использования в той или иной мере хотя бы одного из соседних языков, а нередко и нескольких. Но помимо бизнеса, есть бюрократия (работа с документами, выданными в других странах ЕС, где имена-фамилии пишутся с теми самыми странными значками), есть проблема движения студентов (получает школьное образование в одной стране, университетский диплом – в другой, магистратуру – в третьей, и т.п.)

Наконец, есть компании, обслуживающие клиентов во многих странах и на многих языках (от аэроперевозчиков до банальных веб-магазинов) – в таких нередко от агента требуют знания как минимум двух языков, иногда и больше. Не забудем и бюро переводов. В общем, количество людей, которым на клавиатуре периодически нужны символы, отсутствующие в родном языке, не так и мало. Меня разные клавиатуры интересуют тоже не просто так, а как профессионального переводчика со стажем.

Для решения проблемы дополнительных символов, как известно, существуют раскладки клавиатуры для разных языков. Но в этих раскладках есть свои подводные камни; ведь помимо дополнительных символов, они и основные-то не всегда располагают одинаково: где-то QWERTY, где-то AZERTY, и т.п.

Как разумная альтернатива дурной бесконечности разных раскладок, есть американская международная клавиатура. В ней можно набирать великое множество разных символов путём комбинации букв с акцентами. Например, комбинация ‘a превращается в á, а “o – в ö. Если нужны кавычки как таковые, то после них набирается пробел; для ряда особо хитрых символов правая клавиша Alt используется в комбинации с обычными латинскими буквами – так получаются ð, þ, å, ø, «» и много чего другого. Я с интересом отметил, что некоторые комбинации не работают под Windows, но работают под Ubuntu – например, только в этой ОС комбинация 's позволяет набрать польский символ ś.

Недостаток американской международной клавиатуры – в том, что она включает лишь символы западноевропейских языков. Уже с восточноевропейскими (польскими, румынскими, венгерскими, турецкими) возникает проблема – их там нет (чуть-чуть есть под Ubuntu, но далеко не все).

Но тем не менее, для большого числа языков американская международная клавиатура решает проблему довольно эффективно. Мне, как переводчику и заодно сотруднику большого веб-магазина, вполне удобно, не переключаясь между клавиатурами, писать и по-английски, и по-немецки, и по-французски.

А вот для языков с кириллицей, например, русского и украинского – такой номер уже не пройдёт. Понадобятся две разных раскладки клавиатуры. Я сейчас не хочу писать об известных событиях в политике, потому что речь – не о российско-украинских отношениях, а о том, что для наборов символов, которые различаются всего несколькими знаками (и при этом с большой вероятностью могут использоваться на одних и тех же компьютерах), используются две разные раскладки клавиатуры. А почему нельзя использовать одну?

Для большей части жителей России проблема подобного рода не стоит вообще. Зато она существует в какой-то мере в национальных автономиях (Татарстан, Мордовия и другие), где хотя бы часть пользователей время от времени пишет в Интернете на родном языке. В ещё большей степени проблема существует в ряде стран Средней Азии, где наряду с родными языками в обиходе широко используется и русский (в Казахстане, правда, начался переход на латиницу, но сколько-то лет он ещё займёт; а в Азербайджане, Узбекистане и Туркменистане кириллицу уже не вернуть). Наконец, в таких странах, как Украина, Беларусь, Болгария и в какой-то мере даже в Сербии и Македонии проблема переключения между разными кириллицами вполне существует. Добавлю ещё, что сербская раскладка кириллической клавиатуры кардинально отличается от постсоветской - там расположение клавиш примерно соответствует латинице.

Ниже – сравнительная таблица символов кириллицы в славянских языках. Как видим, большая часть символов совпадает, но некоторые – существуют только в отдельных языках. Вот пример: в сербском и македонском языках исчез мягкий знак Ь, зато возникли символы-лигатуры Љ и Њ – всё потому, что другие палатализованные (в просторечии «мягкие») согласные в этих языках довольно заметно отличаются по произношению от своих непалатализованных пар, в потому сохранять старинную букву кириллицы Ь только ради двух сочетаний создатель сербского алфавита Караджич счёл лишним.

Русский

Украинский

Белорусский

Болгарский

Македонский

Сербский

А

А

А

А

А

А

Б

Б

Б

Б

Б

Б

В

В

В

В

В

В

Г

Г

Г

Г

Г

Г

Ґ

Ѓ

Д

Д

Д

Д

Д

Д

Ђ

Е

Е

Е

Е

Е

Е

Є

Ё

Ё

Ё

Ё

Ж

Ж

Ж

Ж

Ж

Ж

З

З

З

З

З

З

Ѕ

И

И

И

И

И

І

І

Ї

Й

Й

Й

Й

Й

Й

Ј

Ј

К

К

К

К

К

К

Ќ

Л

Л

Л

Л

Л

Л

Љ

Љ

М

М

М

М

М

М

Н

Н

Н

Н

Н

Н

Њ

Њ

О

О

О

О

О

О

П

П

П

П

П

П

Р

Р

Р

Р

Р

Р

С

С

С

С

С

С

Т

Т

Т

Т

Т

Т

Ћ

У

У

У

У

У

У

Ў

Ф

Ф

Ф

Ф

Ф

Ф

Х

Х

Х

Х

Х

Х

Ц

Ц

Ц

Ц

Ц

Ц

Ч

Ч

Ч

Ч

Ч

Ч

Џ

Џ

Ш

Ш

Ш

Ш

Ш

Ш

Щ

Щ

Щ

Ъ

Ъ

Ы

Ы

Ы

Ы

Ь

Ь

Ь

Ь

Ь

Э

Э

Э

Э

Ю

Ю

Ю

Ю

Ю

Ю

Я

Я

Я

Я

Я

Я

Языки Средней Азии, автономий России, а также монгольский – отдельная интересная тема, там тоже есть дополнительные символы, которых нет в этой таблице. В некоторых языках, у меня впечатление, символы изобретали по принципу «лишь бы не так, как у соседей».

Тем не менее, несмотря на всё разнообразие, большую часть символов можно свести к принципу «базовый символ + дополнительный акцент, точка или штрих». Иными словами – тот же принцип, что и для дополнительных латинских символов американской международной клавиатуры.

Отсюда вопрос: почему нельзя создать подобную расширенную клавиатуру для кириллицы? Хотя по практическим соображениям, лучше, наверное, было бы всё-таки две разных: «славянскую кириллицу» и «восточную кириллицу» (для языков Средней Азии, Кавказа и автономий).

«Общеславянскую» кириллическую клавиатуру можно было бы построить на том принципе, что дополнительные буквы набираются с помощью правого Alt либо разных кавычек-акцентов (а если нужны кавычки как таковые, то можно, как и в английской международной – после них либо пробел, либо нажать кавычку два раза).

Стоп, но как решить, например, ту проблему, что в русском языке есть Ы, но нет І, в украинском – наоборот, а в белорусском, а также в русинском (этот язык официально изучается и преподаётся в ряде мест на востоке Словакии) – и та, и другая буквы?

Компромисс видится в том, чтобы зарезервировать на клавиатуре часть клавиш для символов, которых в русском языке в принципе нет, а некоторые редко используемые русские символы (в первую очередь Ъ) набирать с помощью правой Alt. Подобным образом давно уже поступают украинцы, набирая с помощью правой Alt редко, но всё же используемую букву Ґ. Букву Ы можно набирать как автозамену комбинации Ь+І.

На рисунке ниже – один из вариантов подобной раскладки. Синим обозначены символы, которые можно набирать при помощи правой Alt. Теоретически, можно было бы создавать также символы, набираемые при помощи сочетания с кавычкой в качестве акцента, но в Microsoft Keyboard Layout Creator я подобную опцию не нашёл.

Раскладка, которую я по наводке одного из пользователей создал в Microsoft Keyboard Layout Creator.
Раскладка, которую я по наводке одного из пользователей создал в Microsoft Keyboard Layout Creator.

На возражения о неудобстве подобной раскладки можно заметить, что большинство россиян без неё и так обойдётся (как большинство американцев и даже жителей англоязычных провинций официально двуязычной Канады обходятся без «американской международной»).

Как вариант, возможно создание нескольких локальных версий данной раскладки, с одним и тем же расположением символов, разница будет лишь в том, какой из символов первичен, а какой будет набираться с помощью правой Alt. В такой раскладке нашлось бы место даже для устаревших символов, вроде "ять" (на рисунке, помимо "ять", есть также отдалённо внешне схожие с ней сербские буквы "джь" и "чь" - русскоязычные пользователи их часто путают друг с другом).

А вот для пользователей в соседних славянских странах, если её удачно продумать, эта раскладка вполне могла бы стать удобным стандартом де-факто. Потому что политика политикой, однако интересы потребителя над политикой всегда превалируют.

Комментарии (34)


  1. gagarinas
    31.12.2021 14:16
    +1

    Как не русскому, по мне это лучее чем приходится пользоватся.

    https://translit.net/


    1. RomanKerimov
      01.01.2022 18:24

      О, кажется, я нашёл ещё одного потенциального пользователя моего способа набора, который я ещё не зарелизил

      Rabotayet primerno tak. Nabirayem abzac teksta latinicej, a potom vvodim yazyikovoj kod i nazhimayem na knopku konvertacii. ru

      CapsLock ↓↑

      Работает примерно так. Набираем абзац текста латиницей, а потом вводим языковой код и нажимаем на кнопку конвертации.

      А какой родной язык?


  1. shuhray
    31.12.2021 14:42
    +2

    Вижу букву "уй"! А где же "ять" и "опа"?


    1. tvr
      31.12.2021 18:25
      +1

      Там же, где и буква «хѣръ» :))


  1. mixsture
    31.12.2021 17:07

    Часть этих стран переходит на латинскую версию алфавита, отказываясь от кириллической. Необходимость оптимизации кириллических раскладок прям под вопросом.


    1. RomanKerimov
      01.01.2022 18:29

      Dlya russkogo yazyika tozhe byilo byi khorosho vnedritj latinicu v kachestve yesjhyo odnogo alfavita. Obratimostj tablichki kak raz ochenj udobna dlya paralleljnogo ispoljzovaniya dvukh alfavitov. Nabirayem tekst latinicej, a potom mozhno poluchitj versiyu i na kirillice dlya tekh, komu yeyo boljshe nravitsya chitatj

      Для русского языка тоже было бы хорошо внедрить латиницу в качестве ещё одного алфавита. Обратимость таблички как раз очень удобна для параллельного использования двух алфавитов. Набираем текст латиницей, а потом можно получить версию и на кириллице для тех, кому её больше нравится читать


      1. Kazehay
        01.01.2022 22:16

        Вся суть кириллицы при создании была - алфавит под существующие языковые нормы. И если остальным странам не досталось лингвистов способных создать нечто похожее, то не надо втягивать в ад унификации всех остальных. Потому что даже с транслитом полная лажа при формировании йотированных гласный (я,ю,е,ё)так как мне, как человеку учившему полноценно только немецкий, логичнее видеть формирование этих букв через "j", и крайне странно видеть использование этой буквы [j] в транслитерации буквы "ж".


        1. RomanKerimov
          02.01.2022 02:14

          Но j в приведённой табличке не участвует в транслитерации буквы ж

          J нельзя в русском повсеместно использовать для обозначения [j] и палатализации, потому что в русском этого слишком много. Кроме того, это убило бы обратимость, что тоже неудобно


        1. Aleks-NP
          02.01.2022 15:08

          В эстонском (грамматика от немцев) ж это ž. J читается как "й".


  1. peter23
    01.01.2022 00:11
    +1

    Не только у сербов, но и у болгар своя раскладка, сильно отличающаяся от ЙЦУКЕН.


    1. Mitridat1974 Автор
      02.01.2022 03:14

      Это да. Если ставить вопрос глобально, то наверное, надо отдельно создавать расширенную ЙЦУКЕН-раскладку, и расширенную QWERTY-подобную кириллическую раскладку.


  1. vics001
    01.01.2022 04:23
    +2

    С белорусским что-то не то: букв И, Щ не должно быть, а вот апостроф потерялся.


    1. dzmitry_li
      01.01.2022 11:27

      С натяжкой моэно сказать ещё дз и дж пропущены - звук один, хотя набирается двумя буквами


    1. Mitridat1974 Автор
      01.01.2022 22:05

      Спасибо за замечание, исправил


  1. AigizK
    01.01.2022 10:28
    +1

    Башкирская кириллица содержит 42 буквы, и все они имеют пару из русского алфавита. Например а-ә,о-ө. Причем если заменить эти буквы в словах, люди все равно поймут. Потому как тот же русский когда говорит башкирское слово, будет использовать ближайший звук из русского языка. Но, при этом набирать эти буквы через Alt плохая идея. Так как эти буквы очень часто используются. Поэтому у нас вместо цифр сверху, используются дополнительные буквы. А на смартфоне как раз долгое нажатие или набор букв с помощью swift решают проблему.


    1. Mitridat1974 Автор
      02.01.2022 03:15

      А на компьютере Вы их как набираете?


  1. IlliaHai
    01.01.2022 11:09

    Стандартная украинская раскладка в убунте и "расширенная" в виндоус вполне имеют русские буквы "ы", "э", "ё" на третьем уровне (набираются через правый альт).

    Есть раскладка ruu — которая на том же третьем уровне содержит украинские "і", "ї", "є" и беларусские буквы.


    1. Mitridat1974 Автор
      02.01.2022 02:08

      Не подскажете, как именно набирать русские буквы в расширенной украинской раскладке? Экспериментировал с правой Alt, но нашёл только ґ и некоторые европейские символы.


  1. sukhe
    01.01.2022 16:05

    У меня русский язык вообще не установлен. Чтобы писать на украинском и русском вполне хватает раскладки Ukrainian Unicode (https://r2u.org.ua/wiki/keyboard/UkrainianUnicode).

    А что касается универсальной кириллической раскладки - сделать можно. Но она будет удобна только для тех, чья раскладка будет выбрана в качестве базовой. Потому-что, например, в русском/украинском/белорусском средний ряд начинается с ФЫВА, в сербском/македонском/боснийском - с АСДФ, а в болгарском - c ЬЯАО. То есть, кому-то придётся переучиваться. И, учитывая, что АСДФ больше остальных совпадает с латинской клавиатурой, переучиваться придётся тем, кто привык к ФЫВА.


    1. Mitridat1974 Автор
      01.01.2022 23:55

      Как можно добавить эту раскладку Ukrainian Unicode в Windows и Ubuntu? Искал - не нашёл.


      1. sukhe
        02.01.2022 01:07

        По ссылке в моём комментарии есть инструкции по установке для Windows, Linux, OS X. Причём в Убунте даже устанавливать не надо - она там уже есть. Для Windows 10 нужно предварительно установить пакет украинского языка. Вобщем, там всё подробно расписано.

        Если в раскладке чего-то будет не хватать - можно подправить с помощью бесплатного Microsoft Keyboard Layout Creator. Или сделать полностью новую раскладку под свои хотелки.


        1. Mitridat1974 Автор
          02.01.2022 02:09

          Якщо коротко описати проблему: я розумію Вашу інструкцію, але у мене все не так. Укранська мова вже давно встановлена, але описані Вами опції працюють цілком інакше.


          1. Mitridat1974 Автор
            02.01.2022 02:39

            І є ще одна проблема - я можу створити розкладку клавіатури за допомогою вказаного Microsoft Keyboard Layout Creator і навіть встановити її, вона буде відображена у відповідних налаштуваннях мови для Windows - але Windows її все одно ігноруватиме.


          1. sukhe
            02.01.2022 12:11
            +1

            Наразі в мене немає інстальованої Ubuntu, але на FreeBSD та Kali (а також на усіх компʼютерах з Windows) ця розкладка працює.

            Команда для налаштування клавіатури приблизно така:
            setxkbmap us,ua -variant ,unicode -option lv3:ralt_switch

            Символи третього рівня набираються при натиснутому правому Alt


  1. nemiga
    01.01.2022 22:05

    В белорусском языке нет буквы щ (в таблице нужно убрать).


    1. Mitridat1974 Автор
      01.01.2022 22:05

      Исправлено, спасибо


      1. embsbe
        01.01.2022 22:24

        Не за что. И ещё апостроф вместо твёрдого знака


  1. embsbe
    01.01.2022 22:05

    Странный белорусский с И и Щ.


    1. Mitridat1974 Автор
      01.01.2022 22:05

      Исправлено, спасибо


  1. SourenTopchian
    01.01.2022 22:05
    +1

    В белорусском алфавите нет букв И Щ. Имеется буква I.


    1. Mitridat1974 Автор
      01.01.2022 22:05

      Исправил


  1. rcl
    02.01.2022 15:46

    Прежде чем рассуждать о клавиатурах и раскладках, автору надо познакомиться с такими понятиями как locale, localization, internationalization, IANA, timezone,..., чтобы не говорить про то как по-разному устроена печать в Windows и Ubuntu (это скрывает от пользователя истинный источник и смысл происходящего).


  1. kryvichh
    03.01.2022 08:25

    Универсальная кириллическая раскладка имеет смысл, когда обычно мы пишем на одном языке, и изредка вставляем слова на других. В остальных случаях удобнее отдельные раскладки + автопереключатель типа Punto Switcher.


  1. shoorick
    03.01.2022 13:17

    Тому, кто живёт под линуксом (включая Убунту) поможет клавиша Compose — на современных клавиатурах можно, например, назначить эту роль правой клавише Win. Куча сочетаний символов для ввода латинских букв через эту клавишу уже настроена плюс можно определить свои. У меня, например, последовательное нажатие Compose, дефиса и мягкого знака даёт букву ѣ, есть сочетания и для кириллической і, и для букв других языков с кириллицей — украинского, белорусского, татарского, башкирского. Кроме того, «из коробки» есть и ввод через правую клавишу Alt — для его включения достаточно поставить одну галочку «Дополнительные типографские символы» в настройках клавиатуры. Если интересно, могу рассказать подробнее.