Украинский программист Андрей Рысин, который с 2004-го года работает в американской компании SAS, занимающейся разработкой программного обеспечения в сфере бизнес-аналитики, в 12-ти-миллионном онлайн-сообществе GitHub для разработчиков со всего мира выложил Большой электронный словарь украинского языка (БЭСУЯ).

Теперь все, кто создаёт сайты с украинским интерфейсом или программы, как-либо связанные с украинским языком, смогут бесплатно воспользоваться программным обеспечением, позволяющим проверить грамматику и орфографию текста на украинском языке.

Данное программное обеспечение доступно в открытом доступе для внедрения такого словаря в свой собственный Интернет-ресурс. Более того, любой желающий может поучаствовать в улучшении этого словаря, предлагая свои правки и обсуждая их на форуме. Что для этого нужно: начните использовать словарь, задайте свои вопросы и обсудите проблемы, или напишите свои конструктивные предложения на e-mail.

По словам автора разработки, целью создания этого словаря было создание программного обеспечения, которое поддерживает украинский язык, анализирует тексты или проверяет грамматику, стилистику и орфографию данных на украинском языке.

Данный проект был создан в первую очередь для технических лингвистов, программистов, филологов и всех, чья работа так или иначе связана с украинским языком. В словаре на данный момент около 197 000 слов, из которых генерируется приблизительно 3,4 млн словоформ, каждая из которых в свою очередь имеет свой набор тэгов (часть речи, морфологические признаки и др.) Для сравнения: орфографический онлайн-словарь украинского языка slovnyk.ua имеет более 260 000 слов + словоформы.

Но так как разработка украинского программиста является публично открытым и независимым проектом и каждый может поучаствовать в его усовершенствовании, то как показывает модель Википедии, можно предположить, что в скором времени, это станет основным используемым орфографическим онлайн-словарем украинского языка, несмотря на то, что БЭСУЯ не является академическим словарем и над ним не работали никакие академии и институты. По данным GitHub, над словарем работали много экспертов в отрасли языковедения.

На данный момент словарь уже используется в проекте проверки орфографии hunspell в браузере Firefox и офисном программном обеспечении Libreoffice.org, также с его помощью можно проверить грамматику в программе LanguageTool. В планах использование в pymorphy2, Elastic Search и Solar.

Новость подготовил 2polyglot.com

Комментарии (0)