В результате сбора данных база проекта была пополнена 16 новыми языками, в том числе казахским, баса, армянским, белорусским, урду и гуарани. Большее количество часов было отдано английскому (2600), руанде (2260) и немецкому (1040).

Проект Common Voice нацелен на накопление базы голосовых шаблонов, учитывающей всё разнообразие голосов и манер речи. Пользователям предлагается озвучить выводимые на экран фразы или оценить качество данных, добавленных другими пользователями. Накопленную базу данных c записями различного произношения типовых фраз человеческой речи можно использовать без ограничений в системах машинного обучения и в исследовательских проектах.

«Доступ в Интернет все чаще опосредуется речью: голосовые помощники и умные динамики дают нам указания, ищут информацию, связывают нас с друзьями, используются во вспомогательных технологиях и многое другое. Однако эта технология не работает для миллионов людей. Например, ни Amazon Alexa, ни Apple Siri, ни Google Home не поддерживают ни одного африканского языка» - утверждает Хиллари Джума, менеджер сообщества Common Voice Community Manager. – «Предоставляя людям возможность делиться своей речью, мы можем помочь обеспечить всем сообществам доступ к голосовым технологиям и открываемым ими возможностям.»

Напомним, что недавно Mozilla также объявила о трех стипендиатах Common Voiceинвестициях в размере 3,4 миллиона долларов для обеспечения работы в Восточной Африке и партнерстве с NVIDIA.

Комментарии (1)


  1. gsaw
    11.08.2021 14:16
    +1

    Google Home не поддерживают ни одного африканского языка

    К сожалению русский тоже относится к африканским языкам. Купил себе пару Google Home еще в 2017-ом, в надежде, что буду общаться с ними на русском. Жду до сих пор.