Привет, Хабр!

В этом году мы делаем проект Фонда Бортника по разработке модели синтеза речи языков России и СНГ. Возможно, нас на Хабре вы знаете по статьям про синтез речи, детектор голоса или через одного популярного бота для озвучки в Телеграме (на всякий не буду ссылку прикладывать).

Наша основная задача - сделать удобный, быстрый, устойчивый, качественный и нетребовательный к вычислительным ресурсам синтез на самых популярных у нас в стране и в ближайшем зарубежье языках.

По итогу проекта планируется публикация общедоступных моделей синтеза языка под свободной лицензией (MIT). Мы бы хотели покрыть как минимум 10 популярных языков. Всего популярных языков (более 100 тысяч носителей) 30+, так что, в принципе, тут есть, где разгуляться.

Поэтому ищем людей, у которых два родных языка (русский и второй родной), которые бы помогли нам с рядом вещей:

  • Помощь в поиске актуальных текстов на родном языке;

  • Запись голоса (как на русском, так и на втором родном языке);

  • Минимальные консультации по фонетике, ударениям и грамматике.

✉️ Контакты для связи, условия участия оговариваем в каждом случае отдельно.

Комментарии (9)


  1. adeshere
    09.01.2025 13:52

    Хорошее дело делаете. Желаю успеха!

    Сам бы поволонтерил, да боюсь, что не всякая двуязычность тут будет в тему :-( оффтоп)

    У меня второй язык - не совсем родной. Хотя и общаюсь на нем уже более 40 лет свободно, и все нижеперечисленное вроде могу:

    Помощь в поиске актуальных текстов на родном языке;
    Запись голоса (как на русском, так и на втором родном языке);
    Минимальные консультации по фонетике, ударениям и грамматике.

    Проблема только в количестве носителей. Боюсь, что в пределах СНГ их 100 тысяч не наберется (основная масса сейчас вне его, имхо). Так как второй язык у меня - фортран


    1. snakers4 Автор
      09.01.2025 13:52

      Спасибо за добрые слова и шутку =)


  1. ssj100
    09.01.2025 13:52

    Что такое второй родной ?


    1. snakers4 Автор
      09.01.2025 13:52

      Упрощённо, это когда, например, в школе изучаешь два языка (например русский и татарский) и в семье говоришь с родителями на татарском, а со сверстниками на русском. Ну или любая другая комбинация похожих вариантов. Иногда бывают более сложные моменты, люди переезжают, получают образование на разных языках, в семье говорят на родном, а с коллегами, например, на русском.

      Я лично, к примеру, не могу сказать, что у меня два родных языка, так как английский я формально начал учить где-то с 1 класса школы, хоть и была и не одна работа, где я почти не говорил на русском (и совсем не писал на русском). Но английский не стал родным от этого, даже в пиковые моменты, когда я буквально общался на нём каждый день.


    1. jackgrebe
      09.01.2025 13:52

      это сервис для гастарбайтеров-многонационалов. см тэги к статье.
      РФ - родина 666 народов.


  1. Boris_92
    09.01.2025 13:52

    Причем тут азербаджанский, узбекский и таджитский язык и языки России?


    1. snakers4 Автор
      09.01.2025 13:52

      Только согласно официальной переписи населения на каждом из них говорит около ~300к граждан нашей страны. Реальные цифры скорее всего кратно больше.


    1. PanDubls
      09.01.2025 13:52

      А калмыцкий можно? Калмыки так-то тоже недавние мигранты. Я вам больше скажу -- и славянские-то языки это языки пришлого населения. На автохтонов у нас тянут разве что восточно-финские, ну и за Уралом что-то, причём не всё. Ограничим языки России ими?)


      1. jackgrebe
        09.01.2025 13:52

        Я вам больше скажу -- и славянские-то языки это языки пришлого населения.

        "да и русских никаких нет по большому счету".

        где-то я эту риторику уже читал. и слышал. от спикеров характерной внешности и библейской национальности.
        и по паспорту этим спикерам дать не выйдет - РФ родина 666 народов, такова официальная многонациональная идеология.