image

Российская государственная библиотека и «Школа 21» провели онлайн-хакатон по прикладному применению средств алгоритмической обработки текстов на русском языке. Его участники создали алгоритм поиска необходимых данных в текстах подшивок газеты «Красная звезда» за 1941-1945 гг.

В хакатоне принимали участие 87 человек из двух кампусов «Школы 21».

Участникам нужно было представить программное решение, которое переводило бы в машиночитаемую форму все упоминания времен и дат, упоминаемых в подшивках. Это могли быть конкретные даты, исторические периоды, временные интервалы и т.д.

При разработке решения необходимо было учесть вероятность ошибок ввода, распознавания, а также разные обозначения времени и даты, например, употребление«2 февраля 1944 года» или «во вторник через неделю».

Представленное решение можно применять как в работе Российской государственной библиотеки, так и при любой работе по сопоставлению описываемых в источниках событий с хронологической привязкой.

Технология станет доступна всем пользователям Национальной электронной библиотеки. С 2021 года будет запущен проект, который позволит пользователям за несколько минут найти данные, на поиск которых раньше уходили годы.  

См. также: «10 научных статей о реставрации с помощью глубокого обучения, которые должен прочитать каждый»