Я много лет занимаюсь маркетингом, написанием текстов, при этом увлекаюсь английским и использую его в работе. В русскоязычном интернете в целом не так и много статей о контент-маркетинге и продвижении бизнеса в США. А те что есть часто просто рассказывают как надо делать на разборе каких-то конкретных ошибок.

Я подумала, что стоит сравнить подход к созданию контента, который используют авторы-носители языка и мы, не-нейтивы, когда пишем на английском. И вот вам результаты моего эксперимента.

Примечание: методология мини-исследования не особенно научная, но, на мой взгляд практическая. Мне полученные результаты кажутся интересными и полезными, но не стоит считать их истиной в последней инстанции.

Введение: что будем анализировать


Для начала мне нужно было найти какую-то возможность собрать в одном месте англоязычные статьи изначально русскоязычных авторов, которые «варятся» в нашем сегменте сети, но хотели бы донести свой контент до международной аудитории. Такое собрание русско-английского контента я нашла на хабре.

Хабр – популярный ресурс, который в последний год-два декларирует цель трансформации в международный ресурс. Здесь появилась англоязычная версия, возможность ведения дискуссий на английском. Проблема в том, что пока не похоже, чтобы контент, который на английском пишут русскоязычные пользователи, интересовал иностранцев.

Успешность статей одних и тех же авторов на русском и английском значительно отличается. Чтобы понять, почему так, я решила для начала оценить то, какой контент они создают.

Методология


Я не считаю себя экспертом достаточно высокого уровня, что оценить это самостоятельно, и знакомых редакторов-носителей, которые бы бесплатно помогли с этим, тоже нет. Поэтому я буду использовать три инструмента оценки текста и исправления ошибок. Это Grammarly, Linguix и ProWritingAid. Я активно пользуюсь первыми двумя (плачу за две подписки – у Grammarly отличный веб-редактор, а в Linguix более шустрое расширение для браузера – сейчас его обсуждают на ProductHunt), ProWritingAid встречала в паре обзоров и решила взять в качестве «третьего мнения».

Все эти инструменты относятся к категории Writing assistance software, то есть они находят ошибки в английских текстах, предлагают способы их исправления, помогают оценить «читабельность» получившегося текста.

Гипотеза, которую мы хотим подтвердить или опровергнуть – англоязычные тексты русскоязычных авторов плохо читают потому что:

  • уровень их познаний в английском недостаточно хорош;
  • они пишут слишком сложно, тогда как носители предпочитают легкость;
  • тексты в целом не в том формате, что любит зарубежная аудитория.

Мы будем смотреть на:

  • длину статей,
  • количество ошибок на слово,
  • показатель «читабельности» (readability).

Для наглядности, лучшие по рейтингу статьи с англоязычного Хабра затем мы сравним с топовыми статьями, попавшими на главную страницу сайта Hacker News – топовая американская площадка по теме стартапов и технологий.

Ну вот и все, поехали!

Уровень владения английским: авторы рунета vs иностранцы


Для анализа я взяла 10 статей с Хабра. В их число вошли материалы из списка лучших за год, за месяц, корпоративных блогов, и свежих постов частных авторов. Общий объем текста – 22437 слов.

  • Grammarly нашел в этом объеме текста всего 986 ошибки, то есть по ошибке примерно на каждые 23 слова.
  • Linguix показал похожий результат – 933 ошибки, то есть по ошибке на каждые 24 слова.
  • В свою очередь ProWritingAid повел себя довольно странно – в некоторых статьях, где первые два чекера нашли, например, по 88 и 100 ошибок, он мог показать всего 50. Это можно было бы объяснить тем, что у меня нет премиума в этом сервисе, но были и случаи, когда Grammarly и Linguix выдавали максимум 160 алертов, а PWA генерировал более 350. В итоге он показал 1343 оповещений об ошибках. То есть ошибка приходилась на каждые 16 слов. Разница слишком велика, чтобы быть правдой.



Ошибки, которые интеллектуальные ассистенты находят в англоязычных статьях русскоязычных авторов

Но сравним эти показатели с тем, что софт продемонстрировал при оценке контента зарубежных авторов.

Объем англоязычных публикаций вышел на 22631 слов. Для этого объема Grammarly обнаружил 617 ошибок (1 ошибка на 36 слов), Linguix нашел 421 ошибку (ошибка на 53 слова), PWA обнаружил 542 ошибки (ошибка на 41 слово) – но тут опять не обошлось без аномалий.
В целом же результат красноречив – у авторов рунета, пишущих на английском языке на каждые 20-25 слов приходится ошибка, тогда как у иностранных авторов софт проверки грамматики генерирует рекомендации (то есть это даже не обязательно грубые ошибки) один раз на 30-40 слов.

«Читабельность» текстов


Понятно, что носители языка пишут на нем с меньшим количеством ошибок. Но ведь если статья интересная, ее даже с ошибками должны читать неплохо, а этого не наблюдается с постами из нашей подборки. Значит, влияет не только число ошибок на слово, а что-то еще.

В английском языке есть понятие readability – то есть сложности текста для восприятия. Часто эти уровни связывают с уровнем образования – например, «текст настолько сложен, что его поймут только люди с университетским образованием» или наоборот, «текст настолько прост, что будет легко понят человеком с 8 классами образования».

Хорошим показателем читабельности считается уровень в 60-70 баллов – в таком случае текст смогут без усилий понять около 80% носителей английского языка. Grammarly и Linguix в своих редакторах бесплатно дают данные по Readability наряду с другой статистикой, а ProWritingAid бесплатно анализирует читабельность только первых 500 слов. Поэтому в данном сегменте у нас будут данные от двух сервисов, где у меня уже был премиум-доступ.

Для материалов на английском от русскоязычных авторов по версии Grammarly средний показатель readability составил 55,5. Средняя оценка по версии Linguix – 57,3. Вообще оба сервиса дают почти одинаковые оценки читабельности, разница не больше пары баллов. Как видно, до желаемых 60 баллов читабельности материалы наших авторов (причем и тех, кто ведет корпоративные блоги) не дотягивают.



Какова же ситуация с контентом зарубежных авторов? Grammarly выдал средний бал по readability для таких статей на уровне 77,8. Linguix – 75,4. Опять разрыв между двумя сервисами невелик. Куда больше он между нашими и не-нашими авторами.
Еще один вывод – нам труднее писать доступные тексты. Это распространенная «болезнь» не-носителей – хочется «накрутить» текст посерьезнее, в итоге же он трудно читается.

Длина текстов


В этом эксперименте мы рассматриваем материалы в формате блог-постов от частных и корпоративных авторов. В рамках этой категории возможны различные форматы публикаций.

Отечественные авторы часто публикуют достаточно длинные материалы – объем в 22437 слов уложился в десять статей. То есть средний объем равен 2243,7.

Чтобы набрать схожий объем (22631 слово) материала для анализа англоязычного контента понадобилось 13 статей. Средний объем материалов — около 1740 слов.
То есть зарубежные авторы пишут короче, а их аудитория привыкает читать тексты именно такого формата.

Что все это значит


По итогам моего пусть достаточно поверхностного и не особенно научного, но практического анализа, можно сказать следующее:

Если вы хотите, чтобы вас читали иностранцы, пишите как иностранец!

На практике это означает ровно три вещи:

  1. Вычитывайте свои статьи. Наймите корректора, а если его нет – используйте сервисы автоматической проверки (или комбо из таких сервисов).
  2. Стремитесь сделать тексты максимально простыми. Читайте больше англоязычных блог-постов, чтобы учиться стилю. Через какое-то время вам будет легче находить излишне сложные конструкции в своих текстах.
  3. Пишите короче. Потребители англоязычного контента предпочитают не особенно длинные статьи – на эту тему есть ряд исследований. Так что для большего эффекта стоит отказаться от лонгридов по любому поводу.

На сегодня все, спасибо за внимание! Буду рада ответить на вопросы в комментариях.