Самые распространенные алфавиты
Латиница
С большим запасом, латиница (и ее варианты) — самый популярный алфавит в мире. Латиницей пользуются почти 5000 языков мира, 70% населения мира. Из 300 с небольшим разделов википедии более 200 используют именно эту систему записи. Не будем на ней останавливаться, тут все понятно.
36 языковых разделов используют кириллицу. Это в первую очередь славянские (восточно‑ и южнославянские) языки, я также языки народов СССР — кавказские, среднеазиатские и другие. Большинство использует исключительно кириллицу, но два раздела имеют переход на латиницу. К этому мы еще вернемся.
Среди странных разделов — раздел википедии на старославянском языке (Википєдїꙗ с возможностью переключения на глаголицу, Ⰲⰻⰽⰻⱂⱑⰴⰺⱑ!).
Арабское письмо
Арабская вязь (и ее вариации) используется 15-ю разделами, включая 3 раздела‑миллионника (разделов с миллионом и более статей). Самый большой раздел, как ни странно, не «арабская википедия» (1,2 млн статей), а «египетская» (на египетском варианте арабского языка) (1,6 млн). Кроме этих двух, арабскими буквами пишут на южноазербайджанском разделе, урду, западном пинджаби, мазандеранском (один из языков Ирана), пуштунском, синдхи (Пакистан), гилаки (тоже Иран), уйгуры, сирайки (Пакистан), и кашмирцы. И марокканский диалект арабского, который, как и египетский, достаточно отличается от классического арабского, что на нем есть собственный раздел.
Индийские приколы
Деванагари (विकिपीडिया) — алфавит, который используют в Индии и вокруг нее — всего 120 языков. Это очень древняя система записи, история которой прослеживается от древнеегипетских иероглифов, через арамейские языки и брахманское письмо в индию. Это не совсем буквы, а абугида (слоговое письмо). Не смотря на то, что ей пользуются огромное число человек, википедии на деванагари — скудные; самая большая — на хинди, там всего 163 тысячи статей (русский раздел достиг этого количества где‑то в 2007 году, сегодня уже более двух миллионов, хотя на хинди говорит полмиллиарда человек). Разделы на деванагари, кроме хинди — маратхи, неварский, непальский, майтхили, санскрит (да, есть раздел на санскрите!), бихари, дотели, пали, авадхи, ангика (микрораздел, всего 1600 статей при 15-ти миллионах носителей), и конкани.
Другие алфавиты, родственные деванагари:
Бенгальское письмо (বাংলা উইকিপিডিয়া) — собственно бенгальская википедия, а также бишнуприя‑манипури и ассамский раздел
-
Бугийский раздел использует письменность лонтара. Это моя любимая письменность, оцените, какой красивый шрифт: ᨓᨗᨀᨗᨄᨙᨉᨗᨕ ᨅᨔ ᨕᨘᨁᨗ
Гуджарати (વિકિપીડિયા)
Восточный панджаби (ਪੰਜਾਬੀ) — есть еще раздел на западном; но там пишут арабицей.
Малаялам пишут так: മലയാളം
Манипури пишут так: মনিপুরি
Бирманский язык тоже красивый как и все южноиндийские: မြန်မာဘာသာ; пао и монский язык использует практически тот же алфавит.
-
විකිපීඩියා
Тамильский раздел: விக்கிப்பீடியா
Телугу: తెలుగు వికీపీడియా
Есть раздел на центрально‑тибетском языке и на дзонг‑кэ (это язык Бутана, содержит всего 310 статей), оба используют тибетский алфавит: ལྦེ་ཁེ་རིག་མཛོད
Один алфавит - 1-2 языка
Теперь перейдем к алфавитам, которыми пользуются 1-2 языков
Геез (ዊኪፐድያ፣)
Эфиопы и эритрейцы используют письмо геэз (разделы амхарский и тигринья). Это малюсенькие разделы; например, тигринья — та которой говорят почти 10 миллионов — всего 327 статей, и то плохого качества. В инкубаторе еще есть раздел на языке тигре.
Тифинаг
Еще в Африке есть раздел с такими буквами: ⵜⴰⵎⴰⵣⵉⵖⵜ ⵜⴰⵏⴰⵡⴰⵢⵜ (алфавит называется Тифинаг).
Это википедия на стандартном марокканском берберском языке. Это почти искусственная попытка стандартизировать берберский язык на основе трех. Большинство носителей предпочло бы пользоваться арабским письмом или латиницей, но википедия выбрала именно этот вариант.
Еврейские буквы
Иврит и идиш (есть нюанс)
Грузинский (ქართული ვიკიპედია)
Это письмо использует и мегрельский раздел.
Армянский
У армянского письма тоже две википедии: основной (Հայերեն Վիքիպեդիա) и западноармянский (Արեւմտահայերէն Ուիքիփետիա).
Готское письмо
Готский раздел (?????? ??????????) — недораздел на мертвом языке, популяризированном Толкиеном; использует готское письмо (на основе греческого, с примесью латинского)
Греческое письмо
Кроме собственно греческого раздела (Ελληνική Βικιπαίδεια), есть еще понтийский — недораздел с 487 статьями. Еще есть раздел на древнегреческом, пока в инкубаторе.
Мальдивский
Корейская Википедия (위키백과)
Пишется на алфавите Хангыль. Когда‑то этот раздел испытывал технические трудности из‑за того, что браузеры плохо поддерживали хангыль, но проблемы решили лет 20 назад.
Китайцы и японцы
Как известно, китайцы не придумали ничего умнее, чем писать иероглифами. Китайская википедия (на Путунхуа) (中文維基百科) не единственная, кто использует эту систему письма; ей пользуются также разделы на языке у и гань, а также кантонский и вэньянь (классический китайский). Два последних используют традиционные иероглифы, а три первых имеют возможность переключения между традиционными и «упрощенными».
Хуже китайской грамоты — только японский; этот раздел использует японский язык, и соответственно, невероятно сложную японскую систему записи иероглифы в сочетании со слоговыми системами, кандзи, хирагана и катакана.
Индейцы
Есть 3 википедии на индейских языках (то есть их больше, но они пользуются латиницей).
Канадское слоговое письмо (это такие треугольнички и полукруги которые обозначают согласные, а гласная зависит от поворота буквы). Выглядит так: ᐅᐃᑭᐱᑎᐊ
Им пользуются инуктитутская википедия и кри (и те и другие — канадские индейцы).
Раздел википедии чероки, ᏫᎩᏇᏗᏯ использует своеобразное письмо чероки; ее придумал один индеец в начале XIX века, глядя на английские буквы, но не зная их значений. Ꭰ, например, означает звук /а/, а Ꮇ слог /лу/...
Одна википедия - много алфавитов
Вообще‑то, именно из‑за этого раздела я и написал статью.
Есть довольно много разделов с конкурирующими орфографиями; в большинстве случаев, это просто кнопочка‑переключатель.
Я не буду рассказывать подробно, но вот несколько интересных случаев:
Никому не нужный раздел на древнанглийском можно переключить на руны, и он станет еще бесполезнее (ᚹᛁᛚᚳᚢᛗᛖ! ᚦᛁᛋ ᛁᛋ ᛋᛇ ᛖᛝᛚᛁᛋᚳᛖ ᚹᛁᚳᛁᛈᛖᛞᛁᚪ.)
Все китайские разделы можно переключать с традиционных иероглифов на упрощенные (на самом деле — сложнее: там 6 вариантов)
Некоторые разделы (те же индейские…) можно переключить на латиницу и не мучиться.
Многострадальные курды, в зависимости от страны проживания, используют 3 системы письма, между которыми можно переключаться. В СССР курды писали латиницей, но такого варианта нет.
Латиницу/кириллицу можно переключать в таджикской, талышской, и узбекской википедии. Почему‑то в этих разделах нет автоматической поддержки арабицы (видимо, по техническим причинам), хотя ее активно используют носители этих языков в некоторых странах. Кстати, азербайджанский раздел последовательно использует латиницу, хотя все три алфавита могут использоваться для записи этого языка.
-
Южные славяне: тут интереснее.
Сербская википедия поддерживает и латиницу, и кириллицу (в современной Сербии кириллица является единственной официальной письменностью, но решили поддерживать и латиницу). Писать можно на одном из двух алфавитов, а читатель может выбрать, читать на латинице, кириллице, или на языке, на котором статья была написана.
Вообще сербский почти не отличается от хорватского (правда, хорваты предпочитают латинские буквы). Сербо‑хорватская википедия тоже поддерживает оба алфавита.
А язык он на самом деле не сербский, не сербо‑хорватский, и даже не хорватско‑черногорско‑сербский язык, а боснийско‑хорватско‑черногорско‑сербский язык. Чтобы не было скучно, существует отдельный раздел на хорватском. Там только латиница. Есть еще Боснийская Википедия, все на том же боснийско‑хорватско‑черногорско‑сербском, и тоже с латиницей. Все три боснийско‑хорватско‑черногорско‑сербские википедии копируют друг у друга статьи, почти не меняя, но все славятся национализмом…
Белорусская (беларуская?) википедия (википедии?)
Это один самых странных случаев. Вообще, история белорусской (или беларуской) письменности удивительна. Одна из первых систем записи этого языка был белорусский арабский алфавит (!). С XVI века использовалась «латинка», латинский алфавит, похожий на польский. Разумеется, основной алфавит белорусов — кириллица, но уже много веков не могут договориться о том, как именно ей пользоваться. Споры начались до Советской власти, продолжались во время, и не остыли во времена Интернета. Среди популярных вариантов — «наркомовка», «тарашкевица», деясловица, шуповка…. Почти все жители Белоруссии пользуются русскоязычной («русской») википедией (88%), и английской (еще чуть более 9%). Тем не менее, есть целых два (!) раздела википедии на белорусском:
«Наркомовка» («Наркамаўка») — официальная орфография, принятая в республике Беларусь. Это теперь раздел называют так, а изначально можно было писать, как угодно, хоть на латинице.
«Тарашкевица» — этот вариант обычно предпочитают носители белорусского языка за границей.
В отличие от других разделов с несколькими орфографиями, и белорусов нет автоматического переключателя, это реально два разных разделов, которые отличаются содержанием! Кстати, между этими двумя сообществами вроде как уже нет, и они вполне сотрудничают. Правда, у белорусских википедистов есть и другие проблемы, можете спросить у Перникова или Марка Бернштейна.
Инкубатор
Языковой инкубатор википедии — место, где проекты дозревают то стадии, когда их можно вынести в основное пространство. Большинство википедий не доживают до этого этапа, поэтому не буду подробно писать про них. Но все‑таки, вот три примера оттуда:
-
ASL, американский жестовый язык, пытается открыть свой раздел (это уже вторая заявка). Его цель совершенно для меня не понятна (глухие и слабослышащие могут прекрасно читать и по‑английски). Тем не менее, есть специальная система записи этого жестового языка; сайт выглядит прикольно (почему‑то боком), как‑то так:
-
Я уже писал на хабре про википедии на искусственных языках.
Мой любимый проект, токипона, имеет несколько форм записи кроме латиницы.
Логотип
Знаменитый логотип Википедии состоит из следующих букв и символов:
Իワィ,ល ཝིΩWيवि袓И위ವಿרฉ
Следующих алфавитов: армянский, кхмерский, японский, тибетский, греческий, латинский, арабский, деванагари, упрощенный китайский, кириллический, корейский, каннада (дравидский язык в Индии), еврейский, и тайский «алфавиты», а также зачем‑то символы старомонгольского письма и клингона.
Обычно это символы, входящие в слово Википедия на этом языке; однако выбор языков и букв не всегда очевиден. Например, из букв кириллицы выбрали именно И, а из еврейских букв — невзрачная ו.
vilgeforce
Кириллица в сербском - чириллица, это даже на скрине видно :-) А вот говорить сербам что их язык сербо-хорватский - крайне не рекомендуется ;-)
unreal_undead2
Есть отличия в базовой лексике типа названий месяцев. И насчёт кириллицы - в книжном магазине в Белграде в глаза сходу бросаются книги на латинице, на кириллице новых "массовых" книг не видел. Но таблички на улицах на кириллице.
anti4ek
Собственно, как и хорватам.