Борьба с так называемым «пиратским» контентом продолжается. В эту борьбу правообладатели привлекают все большее количество сторон. В числе прочих партнеров правообладателей — корпорация Google. Сейчас руководство компании решило заняться проблемой очистки серверов Google Drive от контента, нарушающего чье-либо авторское право. Одна из первых введенных мер в рамках этой борьбы — уведомление пользователей о проблемах с авторским правом в случае «шаринга» контента такого типа. Для того, чтобы определить, какого рода контент размещается на сервисе (обычный или «пиратский»), Google использует сканирование по хэшам файлов.
Обычно хэшем файла или его хэш-суммой называют уникальный идентификатор файла, который генерируется при помощи специального ПО. В основе процесса обработки данных для получения хэш-суммы — ряд математических преобразований данных (обычно это алгоритмы SHA-1, MD5, CRC), которые содержатся в файле. Хэш может служить «отпечатком» файла и использоваться для подтверждения аутентичности этого файла. Дело в том, что если у двух файлов изменить имена или расширения, то их хэш-сумма будет по-прежнему одинаковой. При изменении содержимого файла автоматически изменится и хэш-сумма.
Руководитель подразделения корпорации Google, которое занимается вопросами авторских прав, пиратского контента и т.п., подтвердил, что Google Drive уже работает с хэшем файлов. Сейчас специальное программное обеспечение присваивает каждому файлу на серверах компании специальный хэш, что позволяет выявлять фильмы, музыку и другой контент, нарушающий автоорское право.
Пока что пользователи, которые размещают такой контент, получают лишь предупреждение. Никаких других действий в отношении «пиратов» Google не предпринимает. Если пользователь хочет разместить на Google Drive «пиратский» фильм, то он может это сделать без проблем, лишь получив уведомление. Оно гласит: «Не распространяйте защищенный авторским правом контент без разрешения, также не предоставляйте ссылки на сайты, по которым ваши читатели могут перейти и нелегально скачать защищенный авторским правом контент». Также в уведомлении говорится, что регулярное нарушение правил может привести к блокировке аккаунта.
Пока что неизвестно, блокировал ли Google чьи-либо аккаунты, следуя своим правилам или нет. К тому же, пока что уведомление получает не такой уж и большой процент пользователя «облака» Google. Тем не менее, Google Drive довольно часто используется для размещения любых типов защищенных авторским правом файлов. В качестве хранилища для таких файлов Drive используют некоторые «пиратские» ресурсы.
В 2014 году эти ресурсы разместили на серверах Google Drive более 18000 видеофайлов. Скорее всего, с течением времени количество таких видео многократно увеличилось. Ситуация усугублялась тем, что Google не выполнял проверки размещаемого контента. Видимо, после обращений правообладателей ситуация изменилась.
Один из читателей Torrentfreak рассказал представителям ресурса, что на днях он получил именно такое уведомление, о котором шла речь выше. Он разместил на своем Google Drive пиратский фильм и захотел получить общедоступную ссылку на этот файл. Но при попытке сформировать линк ничего не получилось.
Журналисты Torrentfreak пробовали повторить этот трюк, чтобы увидеть уведомление, но смогли получить лишь это:
Этот же ресурс попытался получить больше информации от Google относительно упомянутого выше вопроса. Но представители корпорации заявили, что не будут комментировать детали «антипиратского» механизма работы Drive.
Система Content-ID работает не только на Google Drive, ее используют также YouTube, Dropbox и некоторые другие сервисы. В справке видеосервиса Google говорится, что система Content-ID обеспечивает для правообладателей возможность идентифицировать свой контент на YouTube и управлять им. Видео, которые добавляют пользователи в систему, сравниваются с базой данных файлов, отправленных правообладателями в систему Content-ID. Если обнаруживается совпадение, то Content-ID в автоматическом режиме заявляет права на ролики и выполняет в автономном режиме заданные владельцем файлов действия.
Правообладателем может быть только зарегистрированный пользователь, который отвечает определенным критериям. По словам представителей YouTube, те правообладатели, которые часто подают необоснованные жалобы, могут быть лишены права работать с Content ID.
В числе прочих действий, которые могут выполнять правообладатели — отслеживание статистики просмотров ролика, отключение звука для аудиофайла, который используется неправомерно, блокирование ролика для просмотра, монетизация ролика с применением показов рекламы. В ряде случаев рекламных доход делится между правообладателем и пользователем, который загрузил видео.
Комментарии (97)
KorDen32
14.02.2017 13:01+3> Пиратская музыка
— Я купил альбом на идиотских Tidal Store, Beatport, Junodownload, тысячи их — которые разрешают скачать купленный альбом только один раз. Чтобы забэкапить, закинул на гуглодиск
ИЛИ
— Я скачал этот же альбом на трекере
Естественно, хеши в обоих случаях будут совпадать, если конечно создатель раздачи на трекере не менял метаданные, и если мы не говорим о каком-нибудь iTunes, который в метаданные добавляет информацию о покупателе.
С фильмами такое не прокатит, ведь стриминг, к сожалению, почти победил. А вот с теми же книгами тоже вполне актуально.sumanai
14.02.2017 15:38+1Естественно, хеши в обоих случаях будут совпадать
Но при бекапе вы не будете делать общедоступную ссылку, а при распространении будете.JerleShannara
15.02.2017 16:18+1Эх, чую вернутся времена шаринга пираток по почте — зводится почта, туда выкладывается что-то типа some-popular-movie.rar… r00… r01… r99, далее по принципу token-ring пароль с логином от ящика передается всем желающим скачать. Будут теже яйца, только через [any free popular cloud disk service name]
dimm_ddr
16.02.2017 11:07А если прикрутить к этому веб интерфейс, чтобы пользователь не видел что это все просто на почте лежит, то для большинства вообще ничего не поменяется.
JerleShannara
16.02.2017 11:48Бггг, для скачивания фильмов с мейлрушечки в те времена была утиль даже написана специальная. А с тем, что сейчас туева хуча сервисов умоляет «use our n3w c00l API», написать такое будет ещё проще.
KorDen32
15.02.2017 22:49Но при бекапе вы не будете делать общедоступную ссылку
А если мне захочется скинуть один трек другу послушать… Ах да, копирасты же негодуют даже от того, что мы друг другу диски даем и вообще друг у друга слушаем, Fair use надо испепелить, чтобы все сидели на подписках и покупаливоздухкопию.
Ommonick
14.02.2017 13:16Пора искать \ писать софт для перегенерации хэшей своего контента, поскольку ожидаемо, что проблемы как раз не столько с пиратским контентом будут, а с тем что твоя бережно хранимая коллекция
нажитая непосильным трудомпопадет под раздачу из за совпадений или законных бэкапов, как указано выше.rogoz
14.02.2017 13:36Зашифрованные архивы, или просто шифрование.
Ommonick
14.02.2017 13:40Допустим я хочу не испытывать неудобств с пользованием коллекции. Например мне нужна книга с моей библиотеки. Одно дело — скачать книгу, другое дело — архив. Его еще распаковывать надо. А если мобила без архиватора. В общем лишнее промежуточное звено. Но вариант работоспособный, если надо здесь и сейчас.
dartraiden
14.02.2017 15:02-2В Gmail, например, у вас просто не получится прикрепить архив с паролем к письму.
Rayslava
14.02.2017 15:15+1Давно? Я постоянно так всё отправляю.
dartraiden
14.02.2017 16:03Действительно, вы правы. Как-то нелогично у них запреты устроены. В правилах написано «запрещена пересылка исполняемых файлов, ..., архивов с файлами, которые защищены паролем, ...». Прикрепление исполняемых файлов (даже в архиве) реально запрещено, а архивов с паролем — пожалуйста.
vp7
15.02.2017 11:55+1Заблокировав передачу зашифрованных архивов можно чуть-чуть выстрелить себе в ногу.
Гуглопочтой пользуются и корпоративные клиенты, либо контрагенты корпоративных клиентов.
Часто по требованиям IT безопасности передача конфиденциальной информации по email допустима только в зашифрованных архивах (пароли от архивов передаются по отдельному независимому каналу). Не можешь передать/получить зашифрованный архив — твои проблемы.
saboteur_kiev
14.02.2017 15:55Можно прикрепить даже просто кусок рандомного бинарного файла, который на самом деле может быть архивом, в котором запаролен даже список файлов и поломана сигнатура.
Я даже не могу подсказать почтового провайдера, который бы рискнул сделать у себя подобное ограничение.
Alexeyslav
14.02.2017 15:47Собственный контент скорей всего не пострадает, если он не доступен большому кругу лиц, просто сделают его видимым только для вас, что предотвратит распространение. Пока они ставят такие цели — не поубивать копии у пользователей, а предотвратить широкое распространение. А если не будет распространения то скорей всего не будет и проблем у правообладателей, ибо контролировать и учесть оффлайн-копирование они пока не в состоянии, да и не нужно им — какая там скорость передачи данных флешками между пользователей? Мелочь…
Areso
14.02.2017 16:57+1Между прочим Амазон, в лучших традициях пост-апокалипсиса, уже возит грузовики, битком набитые жесткими дисками. Говорит, так быстрее доставить информацию в Glacier. Да и из Glacier есть опция доставки информации на физическом носителе.
ivan386
15.02.2017 23:16Как вариант можно к файлу дописать один байт и у него будет другой хеш. Можно в случайном месте поменять бит и хеш также поменяется. В случае с mp3 файлами также можно чуть изменить теги и опять же будет другой хеш.
Mad__Max
19.02.2017 02:07Это только если хэш один единственный на весь файл. Если хэши считаются для каждого куска скажем по 1 Мб длинной (как в торрент-файла или в той же IPFS которую тут упоминали, где дробление идет на 256 КБ блоки), то для опознания файла достаточно совпадения хэша всего одного такого куска.
Случайное совпадение хэшей даже у небольших кусков стремится к нулю, поэтому любое такое совпадение если не признак, того что это замаскированные файл, то как минимум файл с заимствованиями из закопирайченного файла.
Чтобы от такого маскироваться нужно все содержимое файла изменить — например перекодировать другим кодеком или случайного мусора более-менее равномерно по всему файлу накидать, если структура позволяет это сделать не испортив сам контент.ivan386
19.02.2017 10:17А можно добавить байт в начале тогда у всех блоков будет другой хеш благодаря сдвигу на один байт.
Labunsky
14.02.2017 15:34Интересно, сколько у них всего файлов на серверах располагается? А то есть подозрение, что на таких громадных объемах стоит ожидать коллизий даже от самых надежных хэш-функций, притом множество
sumanai
14.02.2017 15:44При использовании SHA-512 серверами гугла нужно будет заполнить всю галактику, чтобы поймать коллизию.
igrig
14.02.2017 16:11Если пойдет тенденция менять содержимое файлов перед заливкой, то скоро не останется ни одного повторяющегося файла на серверах гугла, прощай дедупликация.
Doverchiviy_kot
14.02.2017 19:00В определённый момент с таким круговым хэшированием придётся строить цод специально для хэшей или забыть всю эту идею с авторством.
Areso
14.02.2017 19:23Построят. Они и раньше ими пользовались, с целями дедупликации, а потом и для поиска детской порнографии в автоматическом режиме.
Labunsky
14.02.2017 18:16С одной стороны, SHA-512 пока вроде не имеет найденых коллизий даже с учетом парадокса дней рождения. С другой стороны — это гугл, количество файлов у них на серверах должно быть заоблачным. Потому и спрашиваю, есть ли какая информация об этом
sumanai
14.02.2017 19:03+1256 бит SHA-512 не идёт ни в какое сравнение не то что с числом файлов в гугле, но и с числом файлов вообще, как и с числом атомов во Вселенной, и с числом атомов во Вселенных в количестве числа атомов во Вселенной.
Labunsky
14.02.2017 19:11+1Вы мне напомнили реакцию гиков в одной старенькой статье.
Хэш-функции не идеальны, сотни миллионов пользователей теоретически вполне способны сгенерировать достаточное число файлов, чтобы появились коллизии. Но это не точно :)
JerleShannara
15.02.2017 16:22Checking MD5… pirated!
Checking SHA1… pirated!
Checking SHA256… pirated!
Ur pozt pirated movi! Собственно говоря — одновременная коллизия нескольких хеш-функций, причём одинаковая чуется мне, что вероятность этого будет около 10^(-999)
IgorGIV
14.02.2017 16:39Owncloud, Seafile, и.т.д. — ИМХО, лучшее решение.
Areso
14.02.2017 17:05У таких решений есть проблемы с надежностью. А городить географически разнесенное дублирование — уже дорого для домашнего пользователя.
Я бы предпочел систему типа торрентов. Сдавать свое место, получать за это рейтинг, тратить рейтинг на место на чужих жестких дисках (к примеру, сдавать свои 200 гб в обмен на 2 дублирующихся тома по 100 гб каждый у разных пользователей, или на 4 тома по 50 гб).IgorGIV
14.02.2017 17:53Безусловно, у всего есть своя цена. Но я убеждён, что хранение и сохранение информации — задача заинтересованного лица. Если не хотите решать эту задачу сами, тогда, увы, другие её решат за вас на своих условиях.
duke_saiko
14.02.2017 21:28+3Content-ID на Youtube — отстой десятой воды ржавого источника загрязнённой химикатами реки! Сколько уже раз наше образовательное учреждение размещало видеороликов, в которых звучит гимн России (sic!), столько же раз и получало уведомление, что музыка нарушает права какой-то конторы и ди-джея, впихнувшего гимн в своё "творение". Приходится каждый раз отписываться, что присвоение общественного достояния — уголовное преступление, и каждый раз получать ответ, что жалоба снята.
sumanai
15.02.2017 00:03и каждый раз получать ответ, что жалоба снята.
Вы добились адекватного ответа от гугла? Да ещё несколько раз? Как вам эту удалось? Делитесь секретом, куда и как писать.
Обычно пишут, что ролики автоматом блочат, а на ответы отвечает робот, от которого в принципе ничего не добиться.Deosis
15.02.2017 09:37присвоение общественного достояния — уголовное преступление
Гугл не хочет судиться, поэтому блокирует все при малейшем подозрении. В обратную сторону это тоже работает.
Equin0x
15.02.2017 08:11И нет никаких гарантий, что «антивирусы» и тот же Windows этим не занимаются/будут заниматься, выполняя заказ правительства или кто больше заплатит. Это я под впечатлением системы телеметрии десятого виндовоза.
Pakos
15.02.2017 11:57+1AVP в своё время тихо грохал кейгены и патчи, от чего был вой в ru.avp и они так же тихо откатили. Давно это было.
qw1
18.02.2017 14:40+1Windows Defender у меня пожирал эксплойты для получения root-прав в Android. Хотя казалось бы, какую опасность несёт ELF-бинарник под архитектуру ARM на Windows-системе.
bolk
16.02.2017 07:19> Обычно хэшем файла или его хэш-суммой называют уникальный идентификатор файла, который генерируется при помощи специального ПО.
Хеш-сумма не является уникальным идентификатором файла.
wtigga
Т.е. достаточно изменить одну букву в meta info видео/мп3 файла, и всё будет ок?
ploop
Да, будет ок, только этим мало кто заморачивается, в основном тупо копируют. Тот жалкий процент, кто этим озадачился, мало кого волнует.
wrewolf
про mp3 была инфа, что хешируют данные, без метаинформации, а скоро будут по слепку проверять, если не уже. Ссылку не найду уже.
nazarpc
Ну ладно, будут в zip архивах при надобности шарить:)
wrewolf
В zip же тоже смотрят ) (стойкая уверенность, что exe не переслать в zip без пароля в том же gmail)
А под пароль в архив оже противоречит пользовательскому соглашению.
9uvwyuwo6pqt
/del
buggykey
Гугл: «Вы не даете нам читать ваши письма — мы не даем вам пользоваться нашей почтой»…
Нормально так… Почти как роскомнадзор. И всегда можно отмазаться, кивнув на борьбу с терроризмом, вот это все…
SolidlSnake
А чего им отмазываться? Их почта — их правила. Никто же вас насильно не заставлял нажимать галочку с соглашением при регистрации или пользоваться гмейлом впринципе. :)
Alexey2005
Правила-то их, но это не значит, что пользователь не имеет права даже возмущаться ими и постить на всех ресурсах, что Google — уроды.
В следующий раз они так возьмут и перестанут принимать письма с посторонних почтовых сервисов. Разумеется, исключительно ради борьбы со спамом. Хотите переписываться с пользователями GMail — тоже заводите там аккаунт.
Имеет ведь Google право так сделать? Поменять, как они обычно делают, соглашение задним числом и разослать всем пользователям новые правила.
goricvet
Конечно имеют право. Такое же право имеет Apple — запретить входящие звонки с аппаратов других брэндов. И магазин у подъезда может брать деньги за вход. Другое дело, что пользователей/клиентов станет меньше и никто в здравом уме этого не станет делать.
aleksandros
Вот одной из задач госорганов является устранение таких перекосов и откровенных издевательств над здравым смыслом. А позиция «не нравится — не покупай, продажи упадут и они исправятся» работает только в сферическом вакууме рыночной экономики)
shifttstas
Ага, ФАС должен работать еще скажите, особенно в сфере нефтянки, да?
ploop
wrewolf
Конкретно там написано про шифрованные файлы и криптоконтейнеры.
То же самое и у DropBox, но на нем 5 лет вполне себе жил гигабайтный TrueCrypt образ. Инкрементальная синхронизация годная вешь. В гугл он недавно был загружен как бекап и пока гугл молчит про него.
ploop
Ну у меня там лежит KeePass'овский файл, по сути тоже шифрованный контейнер — проблем не было.
А вообще бред — файл он и файл, мой файл, что внутри — не ваше дело. Видимо просто перестраховываются этим пользовательским соглашением.
Mad__Max
C DropBox это хотя бы частично можно понять — у них архитекутра основана на блочном хранилище и индексации блоков по хэшам.
И любое шифрование данных рушит всю дедупликацию хранимых данных и мешает эффективно их индексировать. Т.е. сильно увеличивает их расходы на хранение пользовательских данных если пользователи вдруг начинают активно пользоваться шифрованием.
В случае же гугла это наглое заявление — не смейте мешать нам копаться в ваших данных, не для того мы их собираем, чтобы просто хранить.
Alexsandr_SE
С паролем уже тоже не переслать. Не хочет принимать :(
Areso
С паролем исполняемый не хочет передать? Или просто любой архив с паролем? Кроме того, есть такая опция, как шифрование названия файлов.
Alexsandr_SE
Уже проверяли с шифрованием файлов в т.ч. Большая часть писем возвращается. Хотя некоторые и уходят в таком виде. Статистику как-то не догадались изучить. Перешли на отправку ссылок на файлы (.
vp7
Тоже сталкивался с подобным, помогает метод «положить файл в архив, получившийся архив положить в зашифрованный архив». Включать опцию «шифровать имена файлов» тоже можно, но, кажется, однажды такой архив не добрался до получателя.
JerleShannara
Интересно, а от zip-bomb они защиту предусмотрели? Засовываем в архив нужный файл и парочку zipbomb.
saboteur_kiev
Конечно предусмотрели, это же бородато.
Проверка может запускатся в процессе с ограничением по памяти. И вполне может быть, что zip-бомб оно посчитает malware и не даст его отправить.
Mogwaika
А расширение менять если?
Kiborg777
По крайней мере, раньше этот метод работал
Alexsandr_SE
Тоже не прокатывает. Какие-то файлы несколько раз так передавали, но
это проблемы ведь и для принимающей стороны и никогда не знаешь пройдут файлы или нет. Проще избавиться от этого и гарантировано доставлять почту. Гугл банальный mdb с макросами может не пропустить даже.
Pakos
Пакуйте архиватором типа ain — он столь экзотичен, что даже следов в инете почти не найти и его не знает ни один антивирь чтобы распаковать (и гугл, наверняка. тоже; lha/ice, не говоря об arj, должны знать). Он, правда, DOS, но если внутрь положить rar с коротким именем, то он просто его перепашет до неузнаваемости сигнатур, чуть увеличив размер. а ещё можно рар превратить в ююки, которые пожать раром — размер вырастет, но попробуй распакуй (не гарантия).
instalator
Жму в архив, добавляю расширение file.rar.txt и всегда проходило
Finesse
Будем тогда в метаинформации кодировать пиратский контент
saboteur_kiev
На самом деле, за этим будущее. Пройдет лет 5-10, все перехешируют.
И тут внезапно появятся программы на дельфи и бейсике, с большими кнопками «скопировать контент с защитой от детекта», которые будут копировать файл, меняя пару байт в метаданных. Или может быть даже точку в каком-нить кадре. И все наработки по хешированию придется переделывать.
Затем появятся программы, которые будут добавлять маленький водяной знак в каждый кадр с краю экрана, и поломается проверка по хешированию разных блоков.
В общем рано переживать.
ploop
Согласен. Пока это выглядит как «охота на домохозяек», как примет массовый характер — появится соответствующее ПО.
trapwalker
Переживать никогда не рано, иначе риск оказаться в роли той варёной лягушки становится вовсе не риском, а вполне устоявшейся практикой.
Надеюсь времена дельфёвых кнопок «скопировать» прошли и человечество перешагнуло это как детский лепет. По современным стандартам должен появиться софт, который будет прозрачно и незаметно обфусцировать и деобфусцировать файлы на стороне клиентов, а торрент-клиенты научатся учитывать обфускацию.
Но вы прав и это классическое противостояние брони и пули. Правообладателей меньше, чем пользователей, но они сообща и знают чего хотят, в отличие от народных масс.
И тут я бы сам рад был видеть решение в стиле PGP, SSL, P2P, VPN, а не партизанского колхоза.
Но не переживайте. Как только корпоративные облака станут тесными и душными, появится спрос и возникнут предложения в виде нормальных P2P решений. BTSync был только первым шагом, причем проприетарным. Все впереди. Будет интересно.
ValdikSS
Tahoe-LAFS. Распределенное избыточное шифрованное хранилище файлов, где storage-ноды хранят кусочки файлов, не зная их содержимое. Клиент сам шифрует файлы перед загрузкой и расшифровывает после скачивания.
Уже существует облачный провайдер, предоставляющий серверы LAFS: https://leastauthority.com/
Подключайтесь к общему пулу хранилища в I2P: http://jf2g5hus6gp2jfgk7zgc2cxtzeedxbstr3ju374amtoaq6p2ax6a.b32.i2p
wrewolf
У меня 1 притензия к i2p она слишком много ресурсов CPU использует…
Но на посмотреть обязательно попробую.
orignal
Неужели и i2pd тоже? :)
У меня флудфил без ограничения трафика примерно 15-20% на VPS.
Кстати сегодня вышел новый релиз 2.12.0
wrewolf
его не пробовал. нагрузку 20-25 дает стандартный клиент с ограничением до 50кбс
rogoz
А как на i2pd торренты качать, кроме Vuze? Vuze я прицепил, но не уверен, что у него есть режим без gui(чтобы держать не на основном компе), да и сам он глюковат и тяжеловат. Оригинальный i2p мой роутерный девайс разорвёт.
orignal
i2psnark
transmission-i2p под линукс
Роберт для любителей питона
ValdikSS
Корректная ссылка: http://i2pwiki.i2p/index.php?title=Tahoe-LAFS
saboteur_kiev
У меня когда-то была идея создания распределенного архиватора, когда в публичном хранилище лежат готовые блоки данных, и архиватор, в случае наличия подходящего блока в публичном хранилище, просто сохраняет его индекс.
В результате получается «почти» вечный архиватор для отдельного пользователя.
ivan386
межпланетная файловая система
orignal
Что то похоже он даун — у меня нигде лизсет не находит.
ValdikSS
Да, что-то не работает. Эх. Но сам Tahoe-LAFS работает, ноды должны быть живыми. Там только веб-интерфейс был.
Mad__Max
На ютубе уже даже школьники (не все конечно, но многие) методы борьбы освоили — заливают копирайченный контент на свои каналы, прогнав видео через редактор, который добавляет какую-нибудь рамочку вокруг видео (заодно в стиль канала можно оформить или собственную рекламу пихнуть) и звук чуть-чуть ускоренный/замедленный/сдвинутый по тону. И обламываются не только простые проверки по хэшу, но и продвинутые алгоритмы Content-ID (там намного больше чем просто проверка файлов по хэшу, сложный анализ вплоть до нейросетей и зачатков ИИ) и копирайченный контент висит неопознанным.
Из-за этого гугл уже начал даже набор армии людей добровольцев-стукачей, которые должны среди полезных вещей в т.ч. стучать на нарушения авторских прав. Понимают что только на уровне ПО с этим полностью справится невозможно.
tunelix
возможно, они не считают хеш для всего файла, а бьют его на куски и считают для них по отдельности. поменяете в 1м месте в других останется. как при поиске плагиата.
lopatoid
Я уверен, что у Гугла используется перцептивный хэш, так что изменение одной буквы (и даже всего видео) не обманет систему Content-ID
https://en.wikipedia.org/wiki/Perceptual_hashing
https://habrahabr.ru/post/120562/
saege5b
На ютубе в хвост приклеивают дополнительное видео размером вполовину от цели и диким, какофоническим звуком.
Я так понимаю что этим занимаются несколько груп, там разные хвосты, одиноковые в пределах группы.