Даже в самых известных словарях бывают ошибки. Иногда на страницы изданий попадают несуществующие слова, которых на самом деле нет в английском.
Оксфордский, Кембриджский, Вебстер и десятки других менее известных словарей — во всех из них есть подобные лексемы, которые еще называют слова-призраки. Они как бы есть, но их на самом деле нет.
Со временем слова-призраки превратились из досадных ошибок в инструмент, который помогает составителям словарей защищать свои авторские права. Как это вообще произошло — сегодня говорим об этом.
Первое слово призрак: abacot
Составление словарей — это колоссальный объем работы, в котором участвует множество людей. Поэтому ошибки здесь — явление не редкое. Понятно, что филологи многократно проверяют записи, но в печатных версиях косяки все равно случаются.
Профессор Уолтер Скит, президент Лондонского филологического общества в 1886 году писал:
Доктор Мюррей, как вы можете вспомнить, написал очень хорошую статью, чтобы обосновать исключение из Словаря слова «abacot», которое Вебстер определяет как «государственный головной убор, который использовали английские короли, сделанный в форме двух корон». Оно было совершенно правильно и разумно отвергнуто редактором, потому что такого слова не существует, а заявленная форма является следствием совершенной ошибки… ошибки печатников или переписчиков, пылкого воображения или неграмотности редакторов…
Поэтому я предлагаю вашему вниманию еще несколько слов, похожих на «abacot»; слов, которые со временем просмотрит наш редактор, и я не имею сомнений, что он их отклонит. И чтобы было удобно коротко называть подобные слова, я предлагаю именовать их «слова-призраки». И я признаю название «слово-призрак» только за такими словами и словоформами, которые бессмысленны в принципе.
И таких слов-призраков оказалось довольно много. Что в целом и не странно. В Вебстерском и Оксфордском словаре сегодня есть около 470 000 лексем. Наличие в общем списке 20-30 слов, которых на самом деле не существует в английском языке — это малый процент ошибки в настолько огромном филологическом исследовании.
В доинтернетовскую эру контролировать наличие подобных лексем было крайне сложно. Даже гениальный редактор не будет знать все 470 000 терминов. Каждое более-менее редкое слово, а таких в крупных словарях свыше 80%, нуждалось в многоступенчатой перепроверке. И иногда налаженная система давала сбой.
Некоторые слова, которых вроде как не существует (но это не точно)
За многие века развития английского языка слов-призраков накопилось достаточно.
Интересно, что все они звучат вполне логично и соответствуют правилам английского языка. Более того, некоторые из таких ошибочных лексем реально со временем стали использоваться в повседневной жизни.
Мы собрали несколько примеров, которые сначала были ошибочными, но потом стали широко распространяться, а сейчас и вовсе считаются легитимными и официальными.
Сегодня это слово включено во все словари и означает «подливка из мясного сока».
Но в XIV веке оно пришло в английский благодаря ошибке переводчика, который адаптировал кулинарную книгу с французского. В оригинале было слово «grane», которое обозначало специи, но ошибка превратила его в «grave», а затем и в «gravy», попутно полностью изменив его смысл.
Сейчас это распространенное слово, но в XV веке оно было создано из-за невнимательности переписчика. В одном варианте перевода «Писем к Аттику» Цицерона греческое слово «sittybas» (таблица записей) было передано как «syllabus».
За сотню лет эту ошибку продублировали множество раз, поэтому уже в XVI веке оно стало вполне обычным. А сегодня оно есть во всех словарях на полных правах и означает «конспект».
Да-да, обычное и привычное нам слово «твид», которое обозначает вид ткани, — это тоже слово-призрак, которое появилось из-за ошибки.
В шотландском языке есть слово «twill», которое, собственно, и обозначает ту самую ткань, из которой шьют килты. При этом в Шотландии есть река Твид. Возможно, при торговле шотландцев с англичанами вторые зацепились за известное название и не стали перепроверять, как там правильно пишется. Так «twill» превратился в «tweed». И в 1800-х это уже было вполне легитимное слово.
Один из тех примеров, когда ошибочное слово все же было убрано из словаря Вебстер. А попало оно туда в 1934 году из-за недопонимания.
Редактор оставил составителю записку: «D or d, cont./density», имея и виду, чтобы к слову density добавили, что его могут обозначать с помощью аббревиатур D или d. Но составитель воспринял «D or d» как целое слово «dord» со значением «density» и добавил его в словарь.
Ошибку заметили только после печати словаря, а чтобы решить вопрос с ней окончательно и исключить слово, понадобилось целых 13 лет.
Как ошибки стали инструментом для защиты авторских прав
В 1886 году была принята Бернская конвенция по охране литературных и художественных произведений, которая стала одним из первых международных документов в области защиты авторских прав.
Словари как продукт интеллектуального творчества тоже попадали под защиту. Но перед составителями встал любопытный вопрос — как доказать, что авторские права были нарушены, если слова в английском общие и во всех словарях они повторяются?
Английский язык — это общенациональное достояние. И никто не мешает нечистым на руку авторам взять текст другого словаря и выдать его за собственные научные изыскания.
Решение получилось изящное. Составители словарей и энциклопедий стали намеренно добавлять ошибочные слова и дефиниции, которых в реальном языке не существует. Ведь если в чужом словаре вы находите термин, который придумали самостоятельно, то совершенно точно, что составители просто украли его у вас.
Подобные намеренные слова-призраки стали называть фиктивными записями. В эпоху печатных изданий они стали одним из самых эффективных способов защиты авторских прав.
В справочниках и энциклопедиях появлялись статьи про несуществующие виды спорта, а на картах вырастали несуществующие города и поселки — так называемые «бумажные города». При копировании «призраков» становилось вполне реально доказать факт хищения интеллектуальной собственности и нарушения авторских прав.
Один из примеров. Два несуществующих города Beatosu и Goblu, которые создатели карты поместили на карту штата Мичиган.
Неожиданно ошибки в словарях стали приносить пользу составителям. И действительно, даже десяток несуществующих слов в словаре на 100 000 лексем — это мизер. Простому пользователю они не мешали — на них не вела ни одна перекрестная ссылка и их можно было найти только прицельно. А вот для потенциальных злоумышленников они были как кость в горле — если копировать все подряд, был серьезный риск продублировать это самое фиктивное слово, а вместе с ним получить проблемы с законом.
От случайных ошибок словари все же старались избавиться, но при этом добавляли намеренные.
Интересная ситуация случилась с Новым Оксфордским словарем американского английского языка, когда в 2005 в нем нашли несуществующее слово «esquivalience», которому приписали значение «умышленное уклонение от должностных обязанностей».
Его добавили в 2001 году как инструмент для защиты авторских прав. Ведь словарь доступен в онлайн-режиме и скопировать его базу гораздо проще, чем в любой из печатных версий. И очень вероятно, что это далеко не единственное подставное слово-призрак.
Вот только лексема «esquivalience» стала очень популярной, когда сама история вскрылась. На нее стали делать ссылки и публиковать в СМИ. Сегодня слова «esquivalience» в Оксфордском словаре уже нет — его раскрыли как подставное, поэтому и нужда в нем пропала. Слова тайные агенты.
Причем так делали не только составители словарей, но также авторы энциклопедий, чартов, списков, справочников и других крупных текстовых материалов.
Новая энциклопедия Паули, изданной в 1996 году, содержала статью о вымышленном виде спорта — апопудобалии (apopoudobalia), в который якобы играли в Древнем Риме.
В Новой энциклопедии Колумбийского университета 1975 года была большая статья о Лилиан Маунтвизель — полностью выдуманной личности. Впоследствии о ней все равно узнали и имя стало нарицательным для подобных фиктивных записей — в англоязычной сфере их часто называют Маунтвизель (Mountweazel).
Рекордсменом в количестве фиктивных записей можно считать Циклопедию американской биографии Эпплтона — в шести томах исследователи нашли около 200 фиктивных записей. И авторы подошли к ним с большой фантазией.
К примеру, Уэ де Наварра был реальным человеком, но составители добавили вымышленных деталей в его жизнеописание. А Рафаэль Феррер, Джозеф Кантиллион и Уильям Теннер — полностью придуманные личности с довольно подробными биографиями. Всего вымышленных личностей около 45.
Зачем было придумывать так много — не ясно.
Со временем изменилась сама суть слов-призраков. Если еще сто лет назад они попадали в словари из-за невнимательности или ошибок, то сейчас — это вполне продуманные акции, чтобы обеспечить более высокий уровень защиты авторских прав.
А чтобы не попасться на удочку хитрых составителей словарей, изучайте лексику на проверенных ресурсах. Скачивайте приложение для тренировки словарного запаса ED Words и записывайтесь на бесплатный урок с преподавателем.
Онлайн-школа EnglishDom.com — вдохновляем выучить английский через технологии и человеческую заботу
Только для читателей Хабра первый урок с преподавателем в интерактивном цифровом учебнике бесплатно! А при покупке занятий получите до 3 уроков в подарок!
Получи целый месяц премиум-подписки на приложение ED Words в подарок. Введи промокод march2021 на этой странице или прямо в приложении ED Words. Промокод действителен до 01.05.2021.
Наши продукты:
ebragim
Напомнило старый способ поиска утечки информации из компании: когда документ для внутреннего пользования необходимо выслать нескольким сотрудникам, то в ряде мест документа делаются разные "маяки" (несколько пробелов подряд, лишняя точка, лишние переносы строк, замена шрифта для одной буквы в слове на выглядящий почти так же, простановка ударения для какого-то слова, замена обычного пробела на неразрывный итд). Избавиться от всех маяков сложно, так как нужно посимвольно проверять весь документ, визуально такие документы идентичны. Зато, если документ всплывёт где-то — мы можем вычислить, откуда была утечка.
bozman
Ну, не уверен насчет посимвольно…
s/\n/ /g
s/\s+/ /g
Код для ударения лень искать. Ну и шрифт переназначить одной командой.
alexxz
Это так, но только если знаешь все детали реализации маяков. Замена шрифта, размера, замена символов на схожие, невидимые символы (цвет и нулевая длинна). Там весьма широкий спектр
ebragim
Как уже ниже ответили, маяков много. И они разные, если будет утечка, а в информации часть маяков удалена — тоже показатель.
Тут основной расчёт на людей, кто не догадается о подобной защите, и перешлёт документ как есть.
Тут же как — можно упороться и нагородить защиты, когда ты нафиг никому не нужен со своими секретами. Так что или выдумывать скрипты и автоматизировать это всё, или сопоставлять затраты с результатом.
За 5 лет у меня только один раз "выстрелило", да и то комичным образом: подавали патент, и поверенный чуть не опоздал со сроками, клялся и божился что мы не давали ему сам реферат патента, и мы высылали повторно. А когда прошла публикация, я смотрю — он отдал на публикацию именно ту самую, первую версию, которую он якобы не получал...