Этим летом мы практически одновременно с коллегой, независимо друг от друга (удивительно, но факт!) сделали одну и ту же описку: вместо «база данных» написали «база дынных». Магазины в это время как раз были полны свежих сладких дынь. Видимо, я в тот момент был слишком голоден, и мой мозг постоянно отвлекался от проблематики архитектуры развёртывания информационных систем. Овощебаза с аппетитными спелыми фруктами — явно более привлекательный образ. А ещё лучше — бесконечные «поля дынных».
Авторов технических текстов на каждом шагу подстерегают ловушки: орфографические омуты, пунктуационные овраги, горы фактических неточностей. Все эти препятствия — хоть и грозные, но вполне знакомые. У тех, кто много пишет, уже есть известные тропки, перевалы и мостики. По ним авторы успешно обходят все неприятности на пути к заветной цели: качественному и полезному тексту.
Но есть и ещё один тип ошибок: мелких, незначительных, вездесущих. Они, как микроскопические пылинки, проникают в каждый текст. Автор может часами выверять фактические данные и полировать до сияющего блеска формулировки. Но в тончайший прецизионный часовой механизм документа всё равно проникнут вредные песчинки. Имя им — описки.
От них так просто не исправишься, они подло вылезают снова и снова. Они встречаются даже у самых опытных авторов. Вроде бы в описках нет ничего критичного, ведь сделать маленькую ошибку в каком-нибудь слове — это совсем не то же самое, что перепутать единицы измерения или термины в научных статьях. Но всё равно неприятно.
Кстати, зачастую такие мелкие описки и помарки как раз и возникают из-за того, что автор всё своё внимание сосредотачивает на фактической правильности текста, на проверке орфографии и пунктуации. И после этого вдвойне обидно ошибиться в чём-то совсем простом и тривиальном. Хочется, чтобы в тексте всё было идеально.
Можно ли как-то автоматизировать процесс отлова таких мелких назойливых «багов», чтобы раз и навсегда забыть о них и сосредоточиться на более важных вещах? В этой статье я хочу поделиться с вами несколькими способами борьбы с такими «вредителями», которые сам применяю на практике. А заодно перечислю самые забавные ляпы, которые я вылавливал в своих текстах.
Для начала небольшая цитата:
Хтоя свола и нензмеы, всё же вы мжеоте пчеорсть киакм-то орабозм эотт азабц. Подоряк рпоасженлоия бкув в кждаом свлое не яетвляся тиакм уж вныажм. Но пваеря и пляедосня бувкы кадожго солва дожнлы быть на сивох мтесах. Останылье бувкы мгуот быть пешаремены и всё же вы проётчте тескт без бошольго тудра. Это птомоу что чнтеие овасноно на пгадыредувании слеющдуего свлоа.
Этот эффект имеет и обратное действие: непроизвольная смена порядка букв при быстром написании слов на клавиатуре. У меня такие описки встречаются чаще всего, когда я быстро и вдохновенно пишу какой-нибудь текст. Да, технические тексты тоже можно писать «вдохновенно». Руки летают над клавиатурой, но не поспевают за словами, которые рождаются в голове: муза посетила IT-специалиста.
На Хабре уже много раз писали, что буквы на классической клавиатуре расположены неоптимально. Именно поэтому часто получается так, что при быстром наборе пальцы нажимают клавиши не в том порядке, который предполагался мозгом. Особенно часто такое бывает с пробелом: «Особенн очасто». Но и порядок букв в слове часто путается.
Вот избранное из моих последних «шедевров»: поисание, vocie, сосотяние, завяка, пекат. Вы резонно можете возразить, что все подобные ошибки выявляются простейшей проверкой орфографии. Обычно так оно и происходит. Но не всегда.
Чтобы это проиллюстрировать, я взял список существительных русского языка и с помощью небольшого скрипта нашёл несколько характерных примеров-анаграмм (на самом деле их гораздо больше):
икс, иск;
оплата, лопата;
штука, шутка;
выход, выдох;
сигнал, сингал;
минор, мирон;
утро, утор;
трос, торс;
сетка, секта;
контур, котурн.
И самое замечательное: «руководство, куроводство».
Примечание: «Утор» — это нарезка на бочке или кадке для вставки дна. А «сингал» — это представитель народа сингалы, жителей Шри-Ланки. Специально посмотрел в Википедии. Такие слова особо опасны, потому что они не входят в наш повседневный словарный запас, но при этом есть во многих словарях. Правда, словарь Google Docs их не знает. Зато он знает слово «пекат» из моего списка шедевров. У этого слова даже есть несколько значений.
Иногда бывает и так, что буквы в словах непроизвольно заменяются на другие. Вспомните, например, про мою «базу дынных» или «дынные поля». И ведь такие ошибки проверкой орфографии не отлавливаются — слово «дынный» есть в словаре.
Ещё один мой ляп. Как раз на этой неделе я ничтоже сумняшеся напечатал в очередном тексте «отпадочный интерфейс» вместо «отладочный интерфейс». Конечно, эту ошибку тут же услужливо подчеркнул алгоритм проверки орфографии, но было забавно.
Ещё в словах часто появляются лишние или исчезают нужные буквы. Тут лидер моего личного рейтинга — это пара «текст» и «тест».
Выйдем за границы одного слова:
А знаете ли Вы, что что 90% людей не замечают в этом тексте повторение слова «что» в самом начале?
Раз не замечают читатели, то точно так же может не заметить и автор. Такие повторы могут возникнуть, например, при внесении правок. Некоторые алгоритмы проверки орфографии определяют подряд идущие одинаковые слова как ошибку. Но далеко не все.
Что же со всем этим делать? Вот несколько правил, которые я сам для себя придумал, чтобы бороться с описками:
1. Обращать внимание на то, что именно там подчёркивает система проверки орфографии.
Казалось бы, странно об этом писать, ведь эта система как раз и предназначена для того, чтобы выявлять большинство ошибок и описок. Но я стал замечать, что всё чаще игнорирую красные подчёркивания. Это связано с большим количеством ложных срабатываний. Если на среднестатистический технический текст натравить любую систему проверки орфографии «из коробки», вы тут же получите испещрённый красными подчёркиваниями экран.
Отсюда следующее правило:
2. Не лениться добавлять в словарь новые правильные слова.
— Тупой словарь: «калевалу» знает, а «коленвал» — нет.
— Он не тупой, просто гуманитарный.
Имена параметров, термины, названия систем — всё это слова, которых пока нет в словаре. Но, если они действительно написаны правильно, то это не ошибки. Чтобы среди них не затерялись действительные описки и ошибки, нужно избавиться от ложных срабатываний. Для этого нужно последовательно и систематически добавлять правильные термины в словарь. Например, совсем недавно я добавил в словарь своего приложения слово «фискализация». Главное — проверить, действительно ли слово, которое вы добавляете, написано без ошибок.
Что же делать с обратным случаем: когда проверка орфографии не помогает?
3. По возможности удалять манулов из словарей.
Какая [высокоодарённая личность] за сутки до отправки заказчику во всей инструкции заменила manual на manul?
Примеры «базы дынных» и «манула» показывают, что бывают такие слова, которые по сути верны, но совершенно неуместны, например, в технической документации. Я пока что ещё не описывал бизнес-процессы в зоопарках, поэтому вероятность необходимости упоминания манула в моих рабочих текстах стремится к нулю (хотя, вот в этом тексте упомянул же ведь!). Проверки орфографии тут бесполезны — эти харизматичные дикие коты прочно обосновались почти во всех словарях.
В таких случаях всегда жалеешь, что в словари можно что-то добавить, но почему-то нельзя ничего оттуда удалить. Хотя, почему нельзя? В некоторых системах словари хранятся в виде простых текстовых файлов. Или в каком-нибудь другом легко редактируемом формате. Можно попробовать постепенно вычистить оттуда всякие правильные, но совершенно неуместные для технических текстов слова.
К примеру, я удалил из словаря своей системы слово «течении». Потому что я довольно часто употребляю форму «в течение периода», но практически никогда не употребляю форму «в течении реки». Если мне вдруг понадобится писать тексты по географии, экологии, гидродинамике и другим смежным дисциплинам, я его обязательно туда верну.
Кстати, пример манулов показывает, что пользоваться массовой заменой в тексте надо с большой осторожностью. Вот ещё одна цитата с просторов сети:
Однажды по требованию заказчика поменял глобально в куче файлов «датчик» на «сенсор», а потом вручную выкорчёвывал бесчисленные «пересенсоры» и даже «приёмопересенсоры».
4. Написать скрипт для отлова дынь.
В этой статье я привёл несколько примеров моих описок. С некоторых пор я все такие описки записываю в специальный текстовый файлик. Это мой личный список «вредителей». С помощью несложного скрипта можно проверять каждый готовый текст на наличие в нём «дынь», «манулов» и «течений». Такой способ помогает, когда не получается удалить слова из системы проверки орфографии.
5. Внимательно перечитывать каждый готовый текст.
Одно дело — перечитывать свою новую статью. Совсем другое — какой-нибудь текст инженерно-технического назначения на несколько сотен страниц с кучей разделов и параграфов. Это бывает скучно и неинтересно, но необходимо. Я стараюсь выработать у себя умение абстрагироваться от смысла текста и проверять его как редактор. Получается с переменным успехом.
Ещё лучше — привлечь к проверке кого-то ещё. В идеале — профессионального опытного редактора. Но любой новый читатель замечает описки быстрее, ведь он видит мой текст в первый раз. Кроме того, другому человеку легче отвлечься от смысла текста и проверить именно орфографию.
Вообще-то, я уже давно смирился с тем, что текстов (как и программ) совсем без ошибок не бывает. Может, и не обязательно с таким фанатизмом от них избавляться? Главное, чтобы сами тексты были интересными и/или полезными читателям. А уж описки и небольшие пунктуационные ошибки — это как трещинки кракелюра на старинной глиняной вазе: придают тексту человечности. Сразу видно, что писала не очередная нейронная сеть.
Ещё по теме: «Уж послала, так послала: 10 словосочетаний-паразитов в технических текстах».
Комментарии (38)
svob
24.12.2022 15:52+2Я с удивлением обнаружила, что такие штуки получаются не только в клавиатурно набранных текстах, но и в написанных от руки.
Несколько лет назад писала Тотальный диктант, и в результатах оказалась "орфографическая ошибка", а еще они загружали сканы работ на свой сайт, так что можно было посмотреть, где и что.
В общем, я полезла - батюшки! Слог пропущен, а в другом переставлены местами буквы. Проверяющий даже не зачеркивал эту абракадабру, просто обвел "слово" целиком))
vadimk91
25.12.2022 07:47+2Я тоже сталкивался с этим, когда пришлось писать длинный текст от руки (это был не диктант). Подумал, либо мозг уже слишком надеется на проверку машиной либо, увы, это уже старческое.
isden
25.12.2022 10:24+2А я просто отключил проверку и уже подсознательно перестал на неё рассчитывать, и глазами дополнительно вычитываю (если есть возможность, то через несколько часов после написания).
Плюс можно прогонять через сервисы вроде граммарли.
andyudol
24.12.2022 16:00+7Раз не замечают читатели, то точно так же может не заметить и автор.
На самом деле автору заметить ещё сложнее.
niccolo2019
24.12.2022 16:10Это в каком это госте есть такой вид документации, как мануал?
В течении дня - ОРФО тоже подчёркивает, как ошибку....Жаль только среди всех ИТ-шных льгот и субсидий не нашлось немного денег для ИНФОРМАТИКА с Институтом русского языка для допиливания ОРФО по качеству и в части поддержки других форматов и его принятия в качестве некоего базового уровня или стандарта.....usrsse2
24.12.2022 19:22+2Так там же говорится про manual, а не мануал, значит, документация на английском языке.
niccolo2019
25.12.2022 10:24Манулы и мануалы: можно ли избавиться от дурацких описок в технических текстах
В упор не вижу manual.usrsse2
25.12.2022 10:56+1Какая [высокоодарённая личность] за сутки до отправки заказчику во всей инструкции заменила manual на manul?
В тексте, а не в заголовке. В тексте нигде нет "мануал", есть только "manual".
zlat_zlat
25.12.2022 10:09+1Руководство оператора же)
niccolo2019
25.12.2022 12:17ГОСТ 34.201 не предусматривает такого документа как «Руководство оператора»
mayorovp
25.12.2022 12:36+2Тем хуже для госта. Давно известно что все стандарты на документацию полностью оторваны от жизни.
niccolo2019
25.12.2022 21:09Странно, но постоянно слышу такое именно от тех, у кого и продукты гуано, а документация нередко что фиговый листок... Вот у тех, у кого она нормальная есть, те да, могут указывать на определённые недостатки, но никогда не покрывают всё навозом огульно.
zlat_zlat
26.12.2022 13:41+2Извините, уж не знаком конкретно с этим ГОСТом. Но вроде ЕСПД предусмотрен такой. По крайней мере, множество раз его держал в руках ("34-й документ").
Arhammon
24.12.2022 16:32-1Корректоры - исчезающая профессия. По этому, при написании текста, остаётся надеяться на кооперацию с другим автором, у которого глаз не замылен, а он в свою очередь будет надеяться на ваш глаз.
Oleg_Mishutin
24.12.2022 16:51+3– Решено было не допустить ни одной ошибки. Держали двадцать корректур, и всё равно на титульном листе было напечатано: «Британская энциклопудия».
И.Ильф
AndreyDmitriev
24.12.2022 19:32+6В позапрошлом году имел удовольствие читать техзадание для одной системы и там были ляпы в каждом предложении из разряда "а гвозди забиваем деревянные, потому что читать эту фигню никто не будет". Я прочёл все девяносто страниц и потом вежливо поинтересовался у двух инженеров-системотехников, как они такое написали. Оказалось, что им как раз тогда выдали новые смартофоны и один из них обнаружил, что чудо современной техники позволяет больше не клацать по клавиатуре, а просто надиктовывать текст. Ну да, как слышится, так и пишется. Вычитывать опус при этом никто так и не стал. Причём куча вышестоящих менеджеров так и заапрувили это прозведение не читая.
georgevp
24.12.2022 20:35+4Однажды по требованию заказчика поменял глобально в куче файлов «датчик» на «сенсор», а потом вручную выкорчёвывал бесчисленные «пересенсоры» и даже «приёмопересенсоры».
Может, надо было вставить пробел перед словом "датчик"?
atrosinenko
24.12.2022 23:28+2Когда ищешь что-то в логе, то не всегда помогает — приходится использовать регулярки, что-нибудь вроде
\bдатчик
. Сначала подумал, что для "человеческого" текста, может, и вариант с пробелом сойдёт, но потом понял, что нет: в вашем же примере перед словом "датчик" не пробел, аоткрывающаякавычка. Ну и с заглавными/строчными буквами тоже придётся как-то разбираться.isden
25.12.2022 10:32+2А если как-нибудь так —
/[^\p{L}](датчик)/
?atrosinenko
25.12.2022 13:49+1"Любой символ, не являющийся буквой"? Согласен, по-хорошему, в моём примере первым делом нужно было бы уточнить, а как конкретно определяется "граница" (плюс в логах из примера обычно латиница, а тут ещё и о локали стоит задуматься). Но у вас, вроде бы, надо к случаю "любой символ кроме..." добавить "отсутствие символа" (т.е. начало строки). Как говорится, "у меня была проблема, и я решил использовать регулярные выражения..."
isden
25.12.2022 14:53+2о локали стоит задуматься
Врядли, это unicode category
\p{L} or \p{Letter}: any kind of letter from any language.
добавить "отсутствие символа" (т.е. начало строки)
Легким движением руки можно сделать как-то так
/([^\p{L}]|^)(датчик)/
IgorRJ
24.12.2022 20:57+1Например, совсем недавно я добавил в свой словарь своего приложения слово «фискализация». Главное — проверить, действительно ли то слово, которое вы добавляете, написано без ошибок.
Помогу автору исправиться:
а) свой словарь своего приложения - ну как-то не очень, согласитесь?
б) ... то слово, которое... - "то" здесь торчит, как шило в ... А вот и не угадали - в мешке оно торчит.
atrosinenko
24.12.2022 23:40+4Думаю, в качестве иллюстрации проблемы будет уместно вспомнить старую шуточную статью "Стоит ли до верится спел чек еру? Про стой пять ни чинный пост до бра".
Fedorkov
25.12.2022 07:27+5А ещё Д и Ж расположены рядом на клавиатуре. Периодически пишу "модно", и ни один спеллчекер, зараза, не поправит.
websitedev
25.12.2022 07:51+3Особенно красным подчеркиваются термины, которые словари не знают. Приходится для перепроверки каждый раз гуглить термин, чтобы не допустить ошибку. Лучше, конечно, один раз добавить в словарь и использовать постоянно — автоматизация.
Ещё лучше оставить текст полежать день или два, а потом перечитывать. В этом случае больше вероятности обнаружить какие-то незаметные ошибки.
vadimk91
25.12.2022 08:02+4Если опечатки за компьютерной клавиатурой - это только твои опечатки, то на смартфонах этому "способствует" чересчур активно вмешивающаяся виртуальная клавиатура. У меня она от MS, словари-то есть, но падежи и формы слова для неё неизвестны, поэтому пытается править якобы ошибки в меру своего интеллекта. Вот в этом тексте получилось "на смартфон ах" вместо "на смартфонах", причём вроде как сначала показывает именно то, что набрал, а жмёшь пробел - и получаешь "правильный вариант", потом на правку текста времени уходит больше, чем на набор, поди ещё попади пальцем именно в то место, где ошибка. Попал? Молодец, клавиатура любезно или выделяет слово целиком, или переставляет курсор в его конец.
Mike-M
26.12.2022 23:52+2Потому и считается, что для создания контента лучше ПК. Смартфон скорее для его потребления.
ne555
25.12.2022 08:28+2А знаете ли Вы, что что 90% людей не замечают в этом тексте повторение слова «что» в самом начале?
Итнересное и смелое утверждение, но неиверю. Можно было бы проверить теорию на пракьике, прикрепив его к опросу.
У меня тоже имеется теория (личная, не шучу): "тств" называется.
"соответсвующих" — в подобных словах 90% русскоязычных носителей пропустит вторую букву "т" в "тств" --> соответствующих.
Что касается грамотности, то в разное время на помощь приходили разные инструменты, от "т9" на кнопочных телефонах и красного подчеркивания в форме ввода, до спеллеров на Android в одно касание.
Примеры в спеллере вашей статьи и низкосортной
Первоисточник, где можно ознакомиться, как чекать орфографию с Android в два касания для поддержания качества собственных материалов.
Может, и не обязательно с таким фанатизмом от них избавляться?
ИМХО, все очень просто: зависит от вашей личной планки и сообщества/его деградации/наоборот, чем она ниже, тем и ниже Ваш авторитет в этой группе. Для наблюдения, сравните комментарии на Хабре и комментарии в соц. сети ВК, разные вселенные, где одна деградированная по орфоргафическому признаку.
MedicusAmicus
25.12.2022 12:40+1А поправьте:
Помнится мне, была в word-овском спеллчекере прям стилистическая настройка, для текстов деловой переписки и статьи о харизматичных котиках-тестировщиках.
Уже выпилено?
emusic
26.12.2022 01:04+1Иногда встречается опечатка "профессиоанальный". Порой она удивительно к месту, когда в тексте с пафосом подаются какие-нибудь "уникальные решения, не имеющие аналогов в мире", и в мире действительно трудно найти более кривые варианты. :)
Mike-M
27.12.2022 00:03+12. Не лениться добавлять в словарь новые правильные слова.
Скорее бы внедрили единый словарь на уровне операционной системы (с возможностью подключения других словарей, естественно).
Действительно утомляет добавлять одни и те же слова в Windows, Word, Firefox, etc.Если мне вдруг понадобится писать тексты по географии, экологии, гидродинамике и другим смежным дисциплинам, я его обязательно туда верну.
Неа, забудете )поменял глобально в куче файлов «датчик» на «сенсор», а потом вручную выкорчёвывал бесчисленные «пересенсоры»
А всего-то надо было включить опцию «Whole Word». Ну и «Match Case» при необходимости.Может, и не обязательно с таким фанатизмом от них избавляться? Главное, чтобы сами тексты были интересными и/или полезными читателям.
Безусловно, пить валерьянку из-за одной лишней запятой на весь лонгрид не стоит. Но и закрывать глаза на обнаруженные ошибки, прикрываясь мыслью «суть важнее», не следует. Иначе все мы постепенно превратимся в малограмотных )5. Внимательно перечитывать каждый готовый текст
По многолетнему личному опыту — это самый действенный совет.
Не торопитесь нажимать кнопку «Опубликовать». Лучше внимательно и без спешки перечитать текст через сутки. Ещё лучше — через двое-трое суток. В идеале — отдать текст на вычитку грамотному редактору/корректору. Уж такова природа человека: чужие ошибки мы замечаем легче, чем свои собственные.
diakin
И это тоже, но в основном потому что мы воспринимаем слова как цельные образы. Мы распознаем слова целиком, а не читаем "по-складам".
maedv
Добавлю. Много раз это уже здесь обсуждали ) Не только первая и последняя буква должна быть на месте. Остальные буквы не должны слишком уж скакать по слову, желательно перемещение внутри слогов. А то, знаете ли, трудно прототип узнать в питортопе
Robastik
Немного больше - устойчивыми словосочетаниями.
По этой же причине "правила языка" являются лютой плоскоземельщиной.