В популярном сериале «Рик и Морти» есть повторяющийся элемент — «Межпространственное ТВ». Это — специальная приставка к телевизору, с помощью которой герои получают доступ к всевозможным телевизионным каналам во всех параллельных вселенных. В нашей — этот прибор, к сожалению, не существует, но интернет позволяет нам наблюдать нечто очень похожее.

Если проанализировать «информационный шум», можно увидеть наш мир с новой точки зрения. И (скорее всего) он вам покажется незнакомым, непредсказуемым и даже немного инопланетным.

Расскажем, как все это осуществить.


Фото Bruce Warrington / Unsplash

Никому не нужные видео


Каждую минуту пользователи YouTube загружают более 500 часов видеоконтента, поэтому алгоритмы рекомендательной системы сервиса нацелены на то, чтобы показывать зрителю только то, что ему должно понравиться. Из-за этого можно наблюдать ситуацию, когда у трети всех видео на сайте оказывается меньше десяти просмотров. Это — огромный архив роликов, которые были записаны без претензий на профессиональность, преимущественно для себя или родственников. Это — жизнь обычных людей без цветовой коррекции и монтажа.

Но самое интересно здесь то, что для просмотра таких видео есть специальные сервисы, которые позволяют стримить ролики с малым количеством просмотров.

Astronaut.io [GitHub]. Это веб-приложение анализирует свежие загрузки, заголовки которых имеют стандартные названия, заданные смартфоном или камерой. Обычно они начинаются с IMG или DSC и заканчиваются порядковым номером файла. Логично предположить, что видео, название которых владелец не удосужился поменять, не предназначались для широкой аудитории и не будут пользоваться популярностью у миллионов зрителей YouTube. Попробовать себя в роли исследователя таких роликов достаточно легко — требуется только нажатие на кнопку «GO». Далее — каждые несколько секунд плеер будет автоматически переключаться с одного клипа на другой.

Стоит отметить, что у сервиса существуют альтернативы. Французский сайт PetitTube, работающий по другому алгоритму, не ограничивается новыми видео со стандартными названиями. На нем можно увидеть никому не нужную рекламу, видеозаписи МРТ и другой странный контент. Может показаться странным, но такие ролики (как явление) имеют преданную аудиторию. Маленькое, но живое сообщество IMGXXXX на Reddit посвящено поиску и обсуждению такого контента.


Реддит-сообщество DeepIntoYouTube — еще один источник похожих роликов, но здесь редко появляются видео, которые можно найти на «Астронавте». Вместо этого, фокус сабреддита — на любительском контенте, который по тем или иным причинам «не выстрелил». Там можно найти ролики, в которых человек в маске Шрека записывает тематический ASMR, еще есть большое количество абсурдных комедийных роликов и не обходится без странных пользовательских влогов.

Ctrl+Shift+Face. Еще несколько лет назад контент, который здесь публикуют, был бы невозможным — но и сейчас он воспринимается как нечто странное. Это — deepfake-видео, в котором лица комиков, актеров и других знаменитых людей заменяют на лица других. Конечно, такой контент оказывается гораздо популярнее нелепых роликов. На канале можно увидеть что-то вроде «альтернативной реальности», в которой главную роль в «Сиянии» Кубрика получил Джим Керри, а в «Богемской Рапсодии» снялся лично Фредди Меркьюри.


Может показаться странным, но это YouTube-видео содержит в себе собственный URL. Как такое возможно? Если верить создателю видео, ответ один — его загрузили из будущего.

Но на практике существуют способы, благодаря которым можно «зарезервировать» ID для своего ролика еще до начала загрузки. Но даже несмотря на объяснение, эта веб-аномалия кажется чем-то сверхъестественным. Похожие манипуляции можно произвести с твиттером — и создать рекурсивный твит, содержащий собственный адрес. Алгоритм, который позволяет предсказать адрес до загрузки контента, впервые опубликовали еще в 2009 году. Стоит отметить и эксперимент с гиф-анимацией, которая содержит собственный хэш.

Музыка, которую никто не слушает


Сервис Forgotify напоминает вышеупомянутый PetitTube, но вместо видео на YouTube он находит песни на Spotify, которые практически никто не слушал. Это — пятая часть от всего загруженного на площадку: от забытых исполнителей 60-х до рэперов, которым «не дано», или просто треков, о которых скорее всего забыли даже те, кто принимал непосредственное участие в их записи.


Фото Lex Aliviado / Unsplash

Вернемся к тому, с чего мы начали. В информационном шуме, который нас окружает в соц.сетях и глобальных видеосервисах, мы ориентируемся при помощи алгоритмов. Они ограждают нас от подавляющего большинства контента, который — по их оценке — нельзя назвать «качественным».

Но выясняется, что вокруг даже самых редких и бесполезных вещей вроде отображения непопулярных результатов поисковой выдачи формируются тематические сообщества и даже специальные сервисы вроде тех, о которых мы рассказали вам выше. Если вы хотели бы поделиться своими находками по теме, будем рады их увидеть и обсудить в комментариях к этому материалу.



Что еще почитать в нашем блоге:

Как треск костра, скрип дверей и обыкновенный шум становятся электроакустическими треками
«За нами следят»: что может происходить в неприметном минивэне прямо у вас под окном
«Находки аудиомана»: карты звуков как способ погрузиться в атмосферу незнакомого города
Феномен АСМР-аудио: мурашки и приятные покалывания
Что такое музыкальное программирование — кто и почему им занимается
«Гул Земли»: теории заговора и возможные объяснения
«Массаж для твоего мозга»: поговорим об ASMR


Комментарии (33)


  1. maxzhurkin
    15.09.2019 19:54
    +3

    Уже было подумал, что речь идёт о чём-то заметно более странном, например, записях «белого шума с телевизора»


    1. NeoCode
      15.09.2019 21:28

      Можно записать и выложить на ютуб. А через несколько лет проснуться знаменитым:)


      1. geher
        15.09.2019 22:16
        +3

        Скорее узнать, что вами были нарушены чьи-то авторские права.


        1. NeoCode
          18.09.2019 09:45
          +1

          Ну так в случае с белым шумом одно другому не помешает, а наоборот поможет:))


  1. qw1
    15.09.2019 19:59
    +1

    Интересная тема. На Astronaut.io у меня сплошные корейцы и японцы, наверное они больше всех загружают роликов. Вообще, похоже на github.com/ValdikSS/endless-sosuch, но последний более жёсткий треш выдаёт.


  1. usbstor
    15.09.2019 22:45
    +2

    интересно, если ю-туб разорится и начнёт распродавать имущество, на сколько упадут цены на б/у дисковые хранилища?


    1. NetBUG
      16.09.2019 14:01

      Почему на серверах Google никогда не закончится место
      image


      1. TimsTims
        16.09.2019 18:22

        Не так. Как говорит Гугл, место у вашего диска постоянно увеличивается, значит жёсткие диски должны быть в форме фермы-ранчо, где они растут из земли.


  1. tyomitch
    16.09.2019 11:57

    Упс, промахнулся.


  1. Master255
    16.09.2019 13:06

    Как мусор найти так все мастера, а слабо написать программу по поиску редких данных?
    Например музыка, фильмы. Все бьются над этим и только человек это может.
    Человека в поиске данных ещё ни разу не смог заменить компьютер!


    1. NetBUG
      16.09.2019 14:02

      Пойду скажу своему кластеру с Elastic, что он не может заменить человека при поиске в тех сотнях гигабайт данных, которые он индексировал


      1. Master255
        16.09.2019 15:16

        сотни гигабайт? Может сотнях Петабайт? Сотни гигабайт — это у меня на домашнем ноутбуке.
        Если гигабайт, то странно, что он их индексирует))) зачем? Вручную не найти или что там?)))

        Ну например, мне надо найти вот эту песню:
        RDGLDGRN — Lootin In London (explicit version)
        в формате без потерь естественно. Где и как я могу это сделать?
        И 200 треков ещё таких надо.
        Как человек я его прямо сейчас в интернете возьму и найду и скачаю 100% бесплатно, а программе? Слабо?


        1. Klaster
          16.09.2019 15:36
          +1

          Настолько толсто, что даже тонко.


          1. Master255
            16.09.2019 16:21

            ощущение, что отвечают тут роботы, а не люди.

            Настолько толсто, что даже тонко.

            Что толсто? Что тонко? Я задал прямой вопрос. Никаких толсто и тонко тут нет!
            Есть большие проблемы с софтом поиска данных. И раньше были и сейчас есть и ни разу ещё никто не исправлял их. Зато мусор регулярно ищут в сети.


          1. NightGhost
            16.09.2019 21:34
            +1

            Мне кажется, что он даже не понимает, в чём дело…


    1. Closius
      16.09.2019 15:13

      Что такое редкие данные?


      1. AllexIn
        16.09.2019 15:25
        +1

        Ну вот в фильме я видел картину на стене, она показалсь интересной, я загрузил скриншот в гугл поиск — он мне вывалил куча других картин с похожей цветовой гаммой.
        Вот эта картина на стене — редкие данные, потому что я может быть вообще единственный кто её искал. А поисковик вываливает самое популярное, ведь наверняка я ищу что-то что хотят и другие, а не уникальную вещь. И поисковик часто прав, но когда он не прав — найти что-то это боль.


        1. usbstor
          16.09.2019 16:17

          Что за картина-то, из какого фильма?


          1. AllexIn
            16.09.2019 16:24

            18+


            1. catharsis
              16.09.2019 18:30

              Гуглопоиск сейчас мне выдает один живой результат
              www.taringa.net/+arte/barry-gross-el-arte-de-la-soledad_gimvd
              Где искомое примерно 40-я картинка.

              tineye также позволяет предположить, что картинка понравилась не только вам


              1. AllexIn
                16.09.2019 19:51

                Похоже на то.
                А мне не выдал ни одного подходящего.
                Спасибо, кстати.


        1. xakep2011
          16.09.2019 17:32

          Пробовали Яндекс Картинки? От результатов поиска иногда становится не по себе, настолько похожие и редкие изображения находит.


          1. AllexIn
            16.09.2019 17:40

            Спасибо, попробовал! Как минимум нашел, что это скриншот из фильма!


        1. catharsis
          16.09.2019 19:00

          Если картина не попала ни в какие каталоги, то в интернете ее не найти.
          Особенно пока у каждого художника не было своего сайта.
          Информация, увы, теряется.


          1. Master255
            16.09.2019 20:31

            информация не теряется! А не находится! Это большая разница. Не путайте.
            У компании Google раньше (лет 5-10 назад) был хороший поиск… сейчас там не найти ничего. И дело не в том, что контента меньше стало, а в том, что очень много вырезается из найденного и много чего не кешируется и способы поиска не усложняются, а упрощаются. Скоро придётся платить не только за выход в интернет, но и за открытие сайтов. А поисковик будет совсем VIP сервисом для избранных. И все сайты в поисковике будут открываться за деньги :-)


            1. catharsis
              16.09.2019 21:32

              По некоторым оценкам, гугл индексировал 0.2-4% интернета в 2014 году.
              Не знаю, как изменяется эта цифра со временем, но держать малоиспользуемый индекс определенно дорого.
              К тому же, поиск по картинкам весьма не идеален, а лет 5-10 назад его вообще не было :)


              1. Master255
                16.09.2019 22:27

                Это:

                Экономически не выгодно

                выливается в живём в грязи и нищете все. Независимо от материального состояния. Огребаем все дружно.


                1. catharsis
                  16.09.2019 23:14

                  Это тратить ресурсы на то, чем вы будете пользоваться.
                  Я бы не называл возможность бесплатно найти любую песню в lossless жизнью в грязи и нищете.
                  Поддержите каких-нибудь DuckDuckGo чтобы они сделали то что вам нужно, если есть желание.


                  1. Master255
                    17.09.2019 00:40

                    Я бы не называл возможность бесплатно найти любую песню в lossless жизнью в грязи и нищете.

                    Вот это «возможность» — то о чём я написал в первом посте. Это не программа или система — это человек. И нужно работать в сторону автоматизации человека в программу. Над этим сейчас никто не работает. Например у Google наблюдается обратное развитие и этот поиск находит всё меньше результатов.

                    И не придумывайте. У нас есть ещё одно «Экономически не выгодно». Исполнителям не всегда хватает денег на студийную запись. Так что до сих пор в 2019 году выпускаются mp3 в качестве релиза.

                    Бедность у нас не в кармане уже, а в крови и мы её просто не замечаем.


                1. engine9
                  17.09.2019 09:01

                  В любой сфере, где продуцирование обгоняет утилизацию происходит образование помойки. Околоземная орбита ли, города, интернет, планета целиком. Всюду, где человек вмешался, мы видим некий культурный слой, разгребать который не выгодно или попросту невозможно. Я не даю этому оценку, лишь фиксирую наблюдение.


              1. ksr123
                17.09.2019 11:51

                Проценты от чего? Страницы, сайты?


      1. catharsis
        16.09.2019 21:44

        Что-нибудь вроде «в среднем меньше одного поискового запроса в пятьсот лет» (но это не точно).
        Раз столько еще не прошло, потенциальную популярность данных, которые никто никогда еще не искал, приходится угадывать.

        Беглый поиск показывает, что люди интересуются только тем, как добавить свой сайт в выдачу, поэтому все статьи и официальный хелп только об этом.
        Что происходит с данными без хозяина и коммерческой востребованности — никому не интересно.


  1. stalinets
    17.09.2019 23:11

    Пробовал специально смотреть видео с минимумом просмотров. В основном скучная хрень: чьи-то прогулки в парке, снятые на камеру без стабилизации, какие-то латиноамериканские вечеринки с ужасным качеством, личные видео с каких-то мероприятий типа выпускного или с пятничного вечера на работе, и прочая лютая хрень. Как правило снятая очень криво и некачественно.