Институт имени А. С. Пушкина — один из головных вузов России, определяющих уровень владения русским языком. Исследование институт провел совместно с разработчиком решений в области интеллектуальной обработки информации и лингвистики ABBYY. Они использовали технологию понимания и анализа текстов на естественных языках ABBYY Compreno.
При оценке диктанта в 10-м классе школы используют описанные на первом изображении критерии: пятерку можно получить за отсутсвие ошибок, четверку — за 1-2 ошибки.
Печатные СМИ
Меньше всего ошибок в печатных СМИ делает Лента, за ней в тройку лидеров по грамотности следуют Известия и Интерфакс. Более 1% ошибок на страницу текста делают Московский Комсомолец, Огонек, Тасс, Комсомольская правда. Аргументы и факты делают 1,99% ошибок на страницу текста (в словах) — это «тройка».
Лента реже всех ведущих российских СМИ, попавших в исследование, делает орфографические ошибки и ошибки согласования в предложениях.
ТВ и радио
Исследователи проанализировали 120 часов радиоэфира и просмотрели более 200 телепередач. Всего 2 ошибки в час делают на Радио России, 3 — на телеканале Россия-1. 5 канал и Русская служба новостей отметились четырьмя ошибками в час, а Эхо Москвы — семью ошибками. Бизнес ФБ каждый час делает 8 ошибок.
От десяти и более ошибок делают Серебряный дождь, Маяк, ТВЦ, Первый канал, Коммерсант ФМ и НТВ.
Дикторы неправильно строят предложения, употребляют слова-паразиты, делают излишние заимствования (off-road вместо внедорожника) и совершают стилистические ошибки: "… щас обсуждали", «Все чё-то ждали», «ужасающее фуфло».
Объясните, почему, на ваш взгляд, вот эта ситуация, которая некомфортна и женщинам неудобно бессильного мужчины и мужчина, на самом деле, как правило, чувствует себя некомфортно, когда слышит такие претензии со стороны женщины? Пример ошибки в структуре предложения
Комментарии (12)
Lisio
02.06.2015 15:16+8Если учитывать тот факт, что после смены большей части команды качество текстов на Ленте упало ниже некуда и они забыли для чего обычно используют Orphus, то результаты крайне печальные.
and7ey
02.06.2015 16:52Хм, а на ТВ оценивали только ведущих? Или приглашенных экспертов тоже? Прямые эфиры/запись?
Оценку делал один человек (который тоже может ошибиться), или кто-то проверял?
В общем, без деталей, пока это выглядит, что сделали так, как кому-то было нужно.
Ну, и цель проекта — «построить рейтинг» — вызывает недоумение. Рейтинг ради рейтинга.
dyadyaSerezha
02.06.2015 19:45+2"% ошибок на страницу текста (в словах)" — а на полстраницы, на две страницы или на все издание процент будет другой, что ли? Писать «на страницу текста» или «на тысячу слов» имеет смысл только в случае указания абсолютного кол-ва ошибок. Статистики хреновы. :)
WWolf
02.06.2015 23:38+2Высокие результаты, надо сказать. Может, «технологию понимания и анализа текстов на естественных языках ABBYY Compreno» стоит еще подопиливать? Чтобы ошибки искала лучше? Сегодня ни смотреть телевизор (независимо от канала), ни читать газеты, журналы, не говоря уже об интернете, невозможно без постоянного ощущения, что слушаешь, читаешь, смотришь на троечников.
Borz
03.06.2015 13:47[OFF] на первой картинке ошибка: если допущено две ошибки, то какую оценку поставить — три или четыре? Для тройки надо чтобы было «3-4 ошибки» [/OFF]
priv8v
04.06.2015 14:15Интересно, был ли потом пост-анализ глазами этих найденных автоматикой ошибок, чтоб понять можно ли это считать ошибкой русского языка издания, ведь это может быть чья-то прямая речь, перепечатка с указанием ссылки откуда взяли и т.д. С теле-радиом еще интереснее: там (на мой взгляд) корректно учитывать только ошибки ведущих, а вот ошибки приглашенных людей вроде и не на совести радио/тв.
Еще нюанс: СМИ были взяты по популярности, а популярность была построена на соцопросе (весьма странный способ определения популярности).
gluck59
05.06.2015 13:33Из услышанного мимоходом по «Россия-24»:
«В {cityName} произошло землетрясение мощностью 7 магнитуд»…
john_samilin
>> Лента реже всех ведущих российских СМИ, попавших в исследование, делает орфографических ошибок и ошибок согласования в предложениях.
Эмм…
andyudol
Ну что вы хотите? Он же не Государственный институт русского языка имени А. С. Пушкина и не ABBYY. Он только написал о выполненной ими работе.
Я думаю, что не надо таких длинных предложений сочинять. Он начал с «реже», а закончил как будто там «меньше».