Манипуляция с датой публикации позволяет убрать из поиска Google почти что угодно. Во всем виновата лазейка в авторском праве и это большая проблема для всего интернета.
Неприятно, когда в интернете о тебе пишут вранье. Еще хуже, когда ложь уходит в народ и начинает отнимать клиентов, потенциальные партнеры задают неудобные вопросы, да и перед близкими неприятно — они ведь тоже умеют пользоваться интернетом.
С негативом хочется разобраться побыстрее и относительно недавно на рынке появилось действенное решение — абуз DMCA или закона об авторском праве. Метод почти не дает осечек и мало кто задумывается, что за ним стоит воровство контента и русская рулетка с законом. Работает же, так чего думать?
Есть один нюанс — все действия по DMCA фиксируются в открытом доступе, что рано или поздно выстрелит в обратную сторону. Плюс никто не снимает с повестки вопросы этики, ведь никто не застрахован от абуза DMCA.
Обязательно прочтите это мини-расследование, если интересны неприятные стороны работы Google.
План статьи
Коротко об авторах расследования
Кратко о том, как работает авторское право в интернете
Как работает фейковый DMCA
Примеры фейкового DMCA
Почему абуз DMCA хуже, чем кажется на первый взгляд
Почему молчит Google
Коротко об авторах расследования
Расследование проведено репутационным агентством Digital Sharks.
В тексте нет имен наших конкурентов. Задача текста — раскрыть особенности конкретного инструмента, а не «топить» тех, кто его применяет.
Нам не под силу запретить вам использовать абуз DMCA. Вместо этого раскроем его риски: как очевидные, так и скрытые. Если вы не видите в них ничего предосудительного, это ваше право.
Репутационный рынок России станет лучше, когда все участники начнут честно говорить об используемых инструментах. По крайней мере, мы в это верим.
Кратко о том, как работает авторское право в интернете
Если мы попробуем найти пиратские копии фильма «Конек-горбунок», Google выдаст ссылки на официальные сервисы вроде «Кинопоиска» или ivi. При этом в конце страницы выйдет такое предупреждение:
Так поисковик дает понять: из выдачи изъяли часть незаконного контента. Более того, при нажатии на запросы выйдет копия жалобы. Например, такая.
Правообладатель Star Media пожаловался на пиратские сайты, скопировавшие фильм «Конек-горбунок». После обращения правообладателя ссылки деиндексируются — пропадают из выдачи. Найти их реально, если сохранилась прямая ссылка. Но и она скоро станет бесполезной, ведь в дело вступает Роскомнадзор. Его работа тоже фиксируется в базе данных.
На этом этапе появляется пара вопросов: что это за база данных и DMCA, которые используют как основание для жалобы?
The Lumen database — открытая база данных, собирающая юридические жалобы и запросы на удаление онлайн-материалов. Если сайт получает страйк за нарушение авторских прав, он сразу идет в Lumen и смотрит, кто инициировал жалобу. Пока запомните это, скоро мы вернемся к Lumen.
DMCA (Digital Millennium Copyright Act) — американский закон об авторском праве в цифровую эпоху. Суть DMCA: чтобы убрать из интернета украденный контент, не нужно идти в суд — достаточно доказать авторство.
Здесь начинается интересное. Поскольку контента крайне много, в большинстве случаев авторство определяют по дате публикации. Кто выпустил раньше, тот и прав. Это оставляет простор для различных манипуляций.
Как работает фейковый DMCA
Схема проста и эффективна как лом.
Допустим, 1 июля портал X опубликовал заметку, в которой критически высказался о предпринимателе Иванове. Ему это не понравилось, но тратить время на разбирательства в суде не хочется. Тогда Иванов платит нечестному сайту за публикацию этой же заметки, но с датой 30 июня. Когда дело сделано, подкупленный ресурс отправляет в Google жалобу по DMCA — якобы статью украли. С 90%-й вероятностью оригинальную заметку деиндексируют, а нечестный сайт через неделю-другую материал скроет. Негатив исчезнет, будто его и не было. |
Посмотрим на ситуацию подробнее. Перед нами рядовая жалоба на ворованный контент. Или все-таки нет?
Если зайти на сайт, который опубликовал оригинал статьи, появится сообщение о закрытии домена.
Более того, браузер предупредит, что ресурс незащищенный и относиться к нему нужно с осторожностью. При этом сайт, который якобы украл статью, работает. Жалобу подала некая Нона Бойдало. Посмотрим, к кому еще она предъявляла претензии.
В Lumen скопилось 3158 обращений Ноны Бойдало за полтора года! Это 316 страниц с отчетами. Изучение последних ста показывает: в 99 % из них упоминается в качестве источника неработающий today-news.press, а в самих статьях фигурирует казахстанский бизнесмен.
Последний процент касается нелегального интернет-магазина медицинских справок. Она жалуется на конкурента, скопировавшего тексты. Заявителем тоже числится Нона Бойдало.
Сама Нона — фигура непубличная. Простой поиск по имени ничего не дает, что не удивительно. Возможно, что 3158 обращений — это просто совпадение? Журналист-расследователь радеет за свое дело, а представляется другим именем, чтобы не подставляться? А услуги зачистки текстов для магазинов медсправок — просто подработка? Получается слишком много совпадений.
Примеры фейкового DMCA
Один из критических моментов использования фейкового DMCA — публичность и легкость раскрытия конечного заказчика. Хотя иногда используется прикрытие, созданное, чтобы запутать следы.
Якобы крупные предприниматели. Есть статья, включающая имена из списков Forbes. На деле споры из-за DMCA касаются конкретных порталов.
На первый взгляд все в порядке: человек жалуется, что его статью украли. Чтобы разобраться, необходимо вчитаться в текст.
Пока все кажется нормальным, но это только первое впечатление. Вот главная страница сайта:
Последние новости публиковались три месяца назад. Если посмотреть на историю запросов, где портал боролся за «свои» статьи, понятно, что активность закончилась примерно в тот же период. Задача портала была простая: убедить сотрудников Google в честности запросов. С этим справились.
Иными словами, работает псевдо-портал. Он оживает, когда нужно убрать из поиска статью N. В этот момент появляется активность и среди множества статей задним числом публикуется копия N, но на несколько дней раньше оригинала. Этого достаточно, чтобы убедить поддержку Google в реальности авторов.
Война компроматов. Дыры в DMCA используют порталы, специализирующиеся на компромате, чтобы зачистить конкурентов.
Большинство подобных сайтов действуют по принципу библиотек: собирают контент с газет, новостных сайтов и блогов. Источники одинаковые, поэтому почва для применения фейкового DMCA богатая. Здесь как на Диком Западе — кто первый выхватил пистолет, тот и прав.
Сведение личных счетов в университете. Тренд последнего десятилетия в университетской среде — «слить» дипломную работу, чтобы ее перепечатали порталы с готовыми ВКР. Проверки на плагиат заваливаются, что гарантирует недопуск студента к защите.
Юридически подкованные студенты борются со сливами фейковыми DMCA. Не осуждаем их за это.
Путинский сонник. Невозможно пройти мимо запроса авторов сонника «К чему снится президент Путин».
Если бы у нас был такой контент, мы бы тоже поставили на уши весь интернет.
Почему абуз DMCA хуже, чем кажется на первый взгляд
Любой инструмент можно использовать в разных целях и абуз DMCA не исключение. Почему бы не использовать его для реальной защиты доброго имени?
Частное мнение: фейковые DMCA — практика, бросающая тень на рынок репутационных услуг. Также она ставит под удар авторское право как явление.
Вот несколько аргументов:
В основе фейковых DMCA лежит воровство. Возможно, со стороны схема звучит романтично: обернуть закон об авторском праве против автора контента. Только в большинстве случаев от нее страдают живые люди, вложившие в контент силы, время и деньги.
Благодаря Lumen все ходы с авторским правом записываются, поэтому можно отследить источник неприятностей и обжаловать решение.
Единственный способ защититься от фейкового DMCA — мониторить интернет вместо завтрака, обеда и ужина.
Лазейку когда-нибудь закроют. Пока этого не произошло, но изменения неизбежны. DMCA не идеален, и это все понимают. Пока все спят спокойно, но иллюзия безопасности разрушится в самый неподходящий момент. Достаточно громкого прецедента или, как принято говорить в России, политической воли.
Почему молчит Google
Очевидно, Google в курсе практики абуза DMCA. О проблеме писала группа расследователей Web Activism еще в 2016 году, но тогда история не получила большой огласки.
В правилах Google есть дыры, но с таким масштабом сервиса это закономерно. С другой стороны, только архивов по отказным DMCA скопилось на 18 Гб. Их можно скачать, если интересно.
Также Google предварительно отправляет предупреждения о возможном воровстве контента. Если администратор сайта увидит, что попал под раздачу фейкового DMCA, можно подать встречную жалобу. В этом случае Google вернет все как было. После предложит спорящим пойти в суд и возвращаться, когда будет решение.
Возможно, пандемия отсрочила пересмотр политики об авторском праве, но точно не отменила его. Пока лазейка остается открытой, но все лазейки рано или поздно закрываются.
Можно ли использовать абуз DMCA в благородных целях? пусть каждый решает сам. Формально, это работает, но оставляет слишком много хвостов для вычисления конечного выгодополучателя.
Комментарии (46)
MAXH0
04.12.2021 11:57+7Хорошее подтверждение отстаиваемому мною термину, что копирайт это форма цензуры. Так он был задуман и так он и применяется. То что конкретные слуги олигархов, сейчас, как вы показали, нашли маленькую лазейку для того чтобы развернуть цензуру на пользу своим хозяевам - маленькая часть общей огромной проблемы. Одна ячейка общего пазла
laatoo
04.12.2021 13:00копирайт это форма цензуры
поздравляю вас с удивительным открытием. это by design, вообще-то.
следующий шаг, надо полагать, "копирайт — это легализованная монополия"?MAXH0
04.12.2021 13:23Кровавую Мэри поздравляйте. Её идея.. И да, работает это только в условиях монополии. Но тогда в Англии монополии были легальны. Такое соглашение "Мы отдаем вам цензуру на оут-сорс, и не мешаем насаждать монополию". Кстати, это хорошо объясняет почему с монополией Гугла ничего не делают...
tzlom
04.12.2021 11:59+3Также она ставит под удар авторское право как явление
И это прекрасно, потому что любой "пересмотр политики авторского права" будет в сторону правообладателей а не авторов или общества.
ifap
04.12.2021 12:56+5А почему это дыра DMCA, а не дыра в его применении совершенно конкретной корпорацией? DMCA требует подтверждения прав при жалобе, а что Google считает таким подтверждением публикацию с непроверяемой датой — не проблема DMCA, у него своих проблем хватает.
Victor_koly
04.12.2021 15:54+3Пускай Google считает датой публикации дату попадания страницы в свой индекс.
senka_pulemet
06.12.2021 14:57Google за распространение информации в любом ее виде. Но приходит государство и изобретает DMCA, просит его соблюдать “as it is”. А для Гугла это сродни модерации контента. Тем более, что законом не предусмотрено внятное расследование и проверка фактов. Скорее всего из-за низкого бюджета подразделения государства, за это отвечающего.
В США вообще интересно это устроено. Например, есть HIPAA, который вроде должен защищать святая святых, но бюджет подразделения $ 81 млн. Хватает на бумагу для принтеров и кофе…
Digital_Sharks Автор
06.12.2021 15:09У Google политика проста: если на жалобу не ответили и не доказали обратное, то он принимает сторону того, кто подал жалобу. В случае, если через некоторое время сайт оспаривает жалобу, то Google принимает сторону сайта и возвращает контент. И отправляет того, кто подал жалобу в суд. Google выбрал очень просотую позицию "моя хата с краю".
php7
04.12.2021 13:31А разве эти абузы кто-то проверяет, а не робот?
Их часто даже робот не проверяет.
Льются жалобы на никогда несуществовавшие страницы.
Digital_Sharks Автор
06.12.2021 15:11Да, в большинстве случаев это роботы. Люди подключаются только тогда когда скрипты роботов ломаются. Или вы ведете переписку напрямую со специалистом Google.
PereslavlFoto
04.12.2021 13:50Прошу вас, давайте повернём вопрос в другую сторону и раскроем его с другой стороны.
Что должен делать автор, чтобы защитить свой контент (свободно опубликованный тут на Хабре) от пиратского использования? Как DMCA поможет в этом вопросе? Что сделать, чтобы при помощи DMCA убрать из поисковой выдачи пиратов, которые нарушают свободную лицензию?
Спасибо.johnfound
04.12.2021 14:05+7Так, защита контента состоится в его копирования. Если какой-то контент скопирован много раз, на разных сайтов и дисков, то он защищен в максимальной мере. С ним уже ничего не может случится.
PereslavlFoto
04.12.2021 14:08Вы говорите про легальное копирование, а я про незаконное.
johnfound
04.12.2021 14:12+5Легальность, мне кажется, никак на надежности не влияет. Контент или скопирован и защищен, или нет и тогда не защищен. Незаконное копирование так же защищает контент как и законное.
PereslavlFoto
06.12.2021 17:35Речь идёт о защите контента от незаконного копирования.
johnfound
06.12.2021 17:52-1Незаконным может быть только копирование, признанное таковым судом.
И так как незаконное копирование никак не отличить от законным, вы хотите предотвратить всякое копирование.
Для этого есть два способа:
-
Не публикуйте произведение нигде. Однажды опубликованного контента, защитить от копирования невозможно в принципе.
-
Создавайте совершенно бесполезный контент. Тогда никто не будет копировать его, ибо бесполезно.
Любое опубликованное произведение, имеющее хоть какую-то ценность для человечества, будет скопировано. И это хорошо.
PereslavlFoto
06.12.2021 17:55+1Очевидно, что незаконным является копирование, при котором копировщик присваивает себе авторство, меняет название произведения, ограничивает его законное использование.
Незаконное копирование отличается очень легко: при незаконном копировании неизвестен источник заимствования.
В своих словах вы очень явно передёргиваете. Я веду речь о борьбе с незаконным копированием, а вы искажаете и говорите о борьбе с любым копированием.
Для примера подскажите, пожалуйста, куда скопированы произведения, напечатанные РИА «Новости» в буклетах о Золотом кольце России. Спасибо!
-
Digital_Sharks Автор
06.12.2021 15:15+1Делать все то же самое, что мы описали в нашей статье. Только не копировать чужой контент. В lumendatabase.org вы можете найти сотни примеров, как люди защищали свои музыкальные композиции, видео-контент и прочее.
Если вы публикуете статьи на публичных площадках, нужно иметь в виду, что они по правилам сайта могут становиться автоматически собственностью сайта и вам уже не будут принадлежать.
PereslavlFoto
06.12.2021 17:36На Хабре такого правила нет, по счастью. Поэтому автор может самостоятельно лицензировать свои работы для свободного использования.
kuokk
04.12.2021 14:55В статье не раскрыта тема: что делать авторам оригинального контента, чтобы минимизировать возможности абьюза?
Нужно перед публикацией заверять право на контент и дату публикации у "цифрового нотариуса"? Есть такое уже или нет? Логично эту функцию делать через Google/Yandex/etc
В научной среде есть неидеальный, но часто применяемый механизм: https://arxiv.org/
php7
04.12.2021 15:13Подавать встречное уведомление
https://support.google.com/legal/contact/lr_counternotice?product=websearch&hl=ru
SerjV
04.12.2021 22:10+1Нужно перед публикацией заверять право на контент и дату публикации у "цифрового нотариуса"?
И как у нотариуса можно заверить право?.. Ну в общем-то никак. Но можно заверить факт наличия у вас в такой-то момент времени такого-то произведения... Собственно, так в российском праве работает регистрация программ для ЭВМ - у вас есть регистрация, но это не мешает в судебном порядке оспорить наличие права.
Возможен ли "арбуз" в аналогичном случае?.. Но в общем-то да - если вы опубликовали, но не зарегистрировали - то зарегистрировать и тогда настоящий правообладатель будет "иметь секас" с оспариванием в суде (пример - регистрация товарного знака "умное голосование"). А если вы зарегистрировали - то опять подстроить публикацию с более ранней датой и оспорить ваше право вместе с регистрацией.
Похоже, единственный способ - "на системном уровне" не доверять дате публикации, не подтверждённой "средствами объективного контроля".
E11E
05.12.2021 11:00Как архивы, заверенная нотариусом дата публикации и прочее, повлияют на сайт абузера, который выставит дату публикации более раннюю? И его сайт не индексируется ни гуглом ни архивом - а страница для проверки есть, и дата там меньше, чем у вас - вы вор? Чем докажете?
senka_pulemet
06.12.2021 16:11Авторы такого контента обычно защищены платформой размещения, которая следит за девственностью текста. Плюс, чисто статистически, таким атакам подвергается контент, который кому то очень мешает и стал настолько популярен, что вышел в ТОП поиска.
aik
Нету в русском языке слова «обуз». Есть обуза — тягостная, неприятная забота, тяжкая, обременительная обязанность.
А abuse можно перевести как «злоупотребление».
MAXH0
Слова "нету" тоже нету! Точнее оно не литературное, а разговорное. Здесь же "обуз" вполне тянет на профессиональный жаргон.
uoak
Мне кажется что можно использовать почти любые слова , если они выполняют коммуникативную функцию. Но «обуз» — это уже, кажется, за той гранью, когда человека перестают понимать. Я вообще прочитал сначала, как «обоз».
Вроде бы, слово «абьюз» в русском языке относительно устоялось. Если оно кому-то и не нравится , то человека хотя бы скорее всего поймут. А вот «обуз»—это то же самое слово или новое ? Тот, кто злоупотребляет правилами dmca — это «обузер» или «абьюзер»???
amarao
"абузер" из "абьюзер" это как "чо" из "што". Неграмотно, но все понимают.
zede
Вот не надо тут, все эти изменения имеют обоснование. И если вы думаете, что главенствует фонетическая копирка для переноса слов в лингвистике, то глубоко ошибаетесь. Например: грамматически правильно лаптоп, хотя никому в голову не придет, что это ближе фонетически к laptop. Так и с другими словами, важнее то, как чаще говорят, а вовсе не то как это звучит в "оригинале". И лично я слышу абузить/абузер на порядок чаще чем абьюзить/абьюзер, следовательно это уже узус и должен в итоге стать "более правильным"(абьюзить чаще слышу в фем среде)
amarao
В целом, чем дальше в проф. среду, тем больше идёт смещение в фонетическое заимствование. Т.е. чем дальше человек от первоисточников и чем меньше он знает язык, тем хуже он произносит. Самый вопиющий вариант, который я слышал, это "стагинг" вместо "стейджинг".
zede
На самом деле, для заимствованных слов нет никаких правил для использования в нашем языке, кроме интуитивных, основанных на опыте использовании родного и иностранного языка. Вариант который станет основным выберется по тому как большей части народа комфортно это произносить и использовать, поэтому лишь время покажет какой вариант станет верным у того или иного заимствованного слова, а прямая копирка и так много проблем в русский язык принесла(да даже во времена Екатерины и вторжения французкого в русскую речь), сейчас тоже самое но с англ
AlexJameson
Хехе, как насчёт каллбак-функций? Рунглиш на пост-советских просторах рождает удивительных чудовищ. От слова "иссуи" я до сих пор избавиться не могу.
Cerberuser
Это точно не было эмоциональной оценкой качества окружающего кода?..
AlexJameson
Можно так подумать, но нет, это было вполне рутинное обсуждение механик реализации фичи. Просто это был рунглиш в исполнении программистов одного города В 170 километрах от Москвы
amarao
Я на Кипре, и есть большая разница между кало- (хорошо) и како- (плохо). Вот, разбирайтесь в сортах. А ещё есть район города "закАки" и деревня "педулос". Греческий - ох.
PS Каллбак это странно. Каллбэк уже лучше.
php7
Может колбэк?
amarao
/ˈkɔːlbæk/
Это, кстати, интересно. Если back ударный, то 'call' становится шва. Если call ударный, то back становится шва. Webster говорит, что ударение на первом. Я всегда думал, что ударный 'back', но все источники настаивают, что call. Тогда "коллбэк". Хотя мне всё равно шва слышится.
AlexJameson
Суть именно в том, что не-гуманитарию абсолютно неочевидно то, что побуквенно слова передавать не стоит.
Насчёт транскрипции слова - я изначально предполагал, что в составном слове будет два ударения. До этого момента мне казалось, что callback этот так называемый close compound, но, судя по всему, я был неправ.
MAXH0
Я полагаю, что "абуз" и "абьюз" в современном русском имеют разные значения. Вот не слышал я про сервера устойчивые к абьюзерам. Как, по аналогии с, "коммуна" и "коммюнити" имеют разное значение. "Обуз" это, конечно, безграмотно. И я надеюсь исправят.
uoak
Спасибо. То, что сервера почему-то именно абузоустойчивые действительно аргумент.
Digital_Sharks Автор
исправили)
aik
Разговорный русский язык — это тоже русский язык.
ОБУЗ — областное бюджетное учреждение здравоохранения.
tendium
В профессиональном жаргоне обычно говорят "абуза". Но не "обуз".
Digital_Sharks Автор
Спасибо, да обидная опечатка закралась. Поправили:)