По приезду в Ереван я порвался на кучу маленьких Игорей от вывесок, меню, табличек и прочих инфоносителей. Мозг отказывался воспринять "S" как "Т" и совершенно не видел разницы между Ե и Է.

Букварь я себе, конечно, нашёл, но лень — штука непробиваемая.

Задача сформулировалась: "как бы так выучить алфавит, чтобы его не учить". Звучит оптимистично, люблю такое.

Проведя пару дней в тоскливых размышлениях, что придётся-таки учить азбуку, как все белые люди, я вспомнил эту картинку:

ох уж эти британские учёные
ох уж эти британские учёные

Ок, а что, если взять и поменять рандомную букву в русском слове на похожую армянскую? Ну напрիмер, вот тաк.

Работает! Слова читаются, буковки узнаются. Если ещё положить их на иллюстрацию, добавить транскрипцию и название буквы, станет прям совсем хорошо.

Особенно, если это буду делать не я, я-то хочу контент потреблять, а не делать. Тогда надо написать скрипт, который будет клепать картинки за меня.

Расчехлив пайтон, понял, что вопросов стало сильно больше. Как скрипт будет подбирать иллюстрацию? И где? Куда потом её выкладывать? Всё-таки придётся для начала разобраться с буквами, ведь так? А какие слова?

С буквами пришлось, конечно, разобраться первым делом. Обошёл всех друзей-армян, обложился учебниками, читал вывески и дорожные знаки. Получил такую таблицу:

Со словарём всё оказалось проще: нарыл где-то частотную базу на пять тыщщ слов и вычистил оттуда короткие и длинные. Ну и положил в табличку, конечно. Одновременно с этим прикрутил автоперевод на английский в соседний столбец: найти симпатичную картинку на англицком проще, чем на русском. Ну а коли так, можно той же методой сделать перевод на армянский, и добавлять на иллюстрацию и его тоже! (Правда, все армяне, которым я показывал, что получается, ржут и говорят, что такими словами никто не пользуется, или и вовсе они означают что-то другое. Ну да ладно, я только начинающий армянин.)

Теперь про поиск картинок.

Первый план был простой: гугл! Но, увы, гугл часто подсовывает что-то в таком духе:

я вот тоже за голову схватился
я вот тоже за голову схватился

Не имею ничего против стоковой графики, но нет, не на каждую первую картинку, пожалуйста.

Я бодался как мог: минусил "stock", "vector", добавлял "illustartion", игрался с настройками поиска, вообщем, всё не то. Потом вспомнил про DALL·E mini. Но в процессе понял, что, во-первых, оченно долго, а во-вторых:

я орал чайкой. Чудовищно даже по моим меркам.
я орал чайкой. Чудовищно даже по моим меркам.

Ок, надо придумывать дальше. И точно: нашёл loremflikr: сервис, выдающий картинки-заглушки с фликра по запросу. Собираем всё в кучу, и... Куда постить? В телегу, конечно. Огромное количество релокационных чатиков. Настроил постинг в телегу, и зусунул скрипт в планировщик задач.

Вот и всё! Абсолютно счастлив. Хотя, конечно, просто почитать азбуку было бы проще (тем более, её всё равно пришлось прочитать четыре раза.)

Канал с буковками: https://t.me/armenianalphabet

Комментарии (10)


  1. IAMBIRD
    13.06.2022 17:00
    -5

    Христианский алфавит на 39 букв отвратителен и ложится на язык примерно так же, как и латиница на ирландский, не говоря уже о нечитаемом начертании.
    Старая 22-хбуквенная скоропись была сильно лучше.
    Да и от клинописи зря отказались, вполне технологичная была.


  1. Ds02006
    13.06.2022 17:40
    +17

    Подмена букв для изучения нового алфавита напомнила мне вот это:

    ...Ведь тайский язык — это просто. Сначала надо запомнить, что буква а пишется как า. Еще в тาйском языке есть несколько букв К. Одна из них — буквา ก. Онา похожา нา птичกу и переводится กาก птичกา, า именно — กурицา. กстาти, буква о пишется อ. อбрาтите внимาние нา букву М — ม. อчень มнอгอ слอв с буквอй Б — บ. Другาя บуกвา, กอтอрую нาдอ зาпอмнить, этอ บуกвา В и пишется она ว. วอบщем, скอрอ วы приวыกните. Этอ прอстอ зาпอмнить. บуกวา Т — тอже прอстาя — ต. Еще чาсตอ испอльзуеตся บуกวา С — ซ и пишеตซя อнา ตอже рาзными ซпอซอบาми, ว зาวиซиมอซตи อต ซлучาя. ซлอжнอซตь нอмер อดин — этอ пอняตь, чตอ บуกวา ‘и’ пишеตซя нาด ซอглาซнอй. …


    1. goshkalinin Автор
      13.06.2022 17:52
      +1

      Восхитительный игровой сценарий!
      Особенно с учётом того, что ม и บ максимально одинаковые.


    1. iShrimp
      13.06.2022 20:04
      +4

      Занимательная копипаста! Только надо исправить ошибки в словах "вобщем" и "привыкните". Чем меньше мусора в данных, тем лучше обучается нейросеть :)


  1. Browning
    13.06.2022 20:23

    Хорошая работа.

    По-моему, распространённое утверждение, будто ռ есть грассирующее р, это какое-то обманулово. Кажется, оно должно звучать скорее как гхр, причём все три звука одновременно. (Дисклеймер: я тоже не армянин.)


    1. goshkalinin Автор
      13.06.2022 20:41

      Спасибо!
      Я как чумачечий вот уже третий месяц прислушиваюсь к местным "р". Коռоче, я у себя его записал-таки как "грассирующее р", но факт в том, что произносят его (и мягкую, и твёрдую вариации) как пойдёт вообще совсем. В зависимости от того, откуда родом, с кем общается, интонация —  это всё превращает триединство "р" в многообразие мурчаний. И такое не только с "р"!


    1. goshkalinin Автор
      13.06.2022 20:46
      -1

      Не сразу осознал, что оно из моего скрина. Я копипастнул учебник, да :)


    1. middle
      13.06.2022 21:32

      А вы послушайте, как произносит "r" не Эдит Пиаф, а современные парижане.


  1. temujin
    13.06.2022 23:01

    Один вопрос и одно замечание:
    Для чего понадобилась гистограмма длин слов?

    Грассирующее р, это звук обозначаемый буквой ղ, на мой вкус тверже французского граассиррующего и близко к тюркскому звучанию аналогичного звука.


    1. goshkalinin Автор
      13.06.2022 23:11

      Короткие выкинул, потому что плохо читаются, а длинные выкинул, потому что плохо ложатся в макет.

      Я не знаком ни с первым, ни со вторым вариантом, увы.