В День русского языка 6 июня 2021 года аналитики компании «Яндекс» и эксперты Института русского языка имени Виктора Виноградова опубликовали список слов с их местным толкованием, который дает представление о региональном разнообразии русского языка.
«Яндекс» использовал данные из платформы «Яндекс.Дзен» для составления списка слов, которые используются только в определенных частях нашей страны. Сотрудники компании проанализировали статьи и комментарии шести миллионов пользователей «Яндекс.Дзен» с января 2019 года. Аналитики обработали 15 млн публикаций, 217 млн комментариев, 11 млрд словоупотреблений, которые сделали 6 млн пользователей. На выходе они составили список всех встретившихся в них слов.
«Яндекс» пояснил, что в итоговый список попали по 500 слов из каждого региона, «которые в том или ином регионе употребляют минимум в три раза больше пользователей, чем в среднем». Потом этот список слов и выражений изучили лингвисты из Института русского языка, отсеяли и отобрали самые интересные слова и выражения, исключив из списка топонимы, названия организаций, фамилии, ругательства и грубые слова, а также слова, обозначающие уникальные местные реалии. Каждому отобранному слову или выражению лингвисты дали подробное определение.
Вдобавок «Яндекс» открыл доступ к полному списку слов и выражений, которые компания получила в результате этой разметки — набор данных RussianLocalWordsDataset.
Примечательно, что для некоторых регионов страны характерных слов не нашлось — они не представлены в списке. «Яндекс» предположил, что это связано с темами, которые выбирают местные авторы, или в регионе просто мало интернет-пользователей, а соответственно, и данных. Список этих регионов: Еврейская автономная область, Кабардино-Балкарская Республика, Карачаево-Черкесская Республика, Магаданская область, Ненецкий автономный округ, Республика Адыгея, Республика Алтай, Республика Дагестан, Республика Ингушетия, Республика Калмыкия, Республика Марий Эл, Республика Северная Осетия — Алания, Республика Тыва, Чеченская Республика, Чукотский автономный округ, Ямало-Ненецкий автономный округ.
Институт русского языка имени В. В. Виноградова приглашает всех желающих принять участие в опросе, чтобы понять, какая доля жителей определенных регионов, возрастов, уровня образования, использует те или иные слова.
KGeist
>Республики Марий Эл нет
А зря, есть свои интересности. Моё любимое - "да чё да" в значении "и так далее". Любимое, потому что это не очередное существительное (что обычно сравнивают, как и в этом опроснике), а целое сочетание с интересной грамматикой. Вроде как присутствует также в Кировской и в Ижевской. Как-то в закутках академического Рунета нашел редкую pdf-ку, где разбиралась этимология - дескать, в финно-угорских есть аналогичные конструкции и там это как будто грамматически прозрачно, а в русском - нет (т.е. калькирование)
vorphalack
а можно подробностей узнать?
joffer
вот да, с удовольствием бы почитал более подробный материал
andersong
У нас, в Перми, с детства слышал «да чё да».
yoda776
Раньше подобные вещи называли в худшем случае жаргоном, в лучшем — безграмотной речью. А теперь, видите ли, «региональное разнообразие».
В чудные времена живем.
SergeyMax
KGeist
Как бы всё наоборот - чудно считать говор безграмотностью. Если бы история сложилась иначе и русские земли объединила, допустим, Вятка, то безграмотной бы считалась московская речь. До Москвы долгое время стандартом был Киевский говор (откуда у нас до сих пор Бох вместо Бок). Речь развивалась в регионах параллельно и независимо, нет кого-то "более правого"; текущий стандарт это же просто результат исторических и политических случайностей. Своё мнение нужно иметь, а не смотреть на то, в какую там сейчас сторону дует ветер :)