Анализ более миллиона случайно выбранных URL с хостинга картинок Imgur выявил странную аномалию. Некоторые изображения встречаются необычно часто: одна странная картинка вернулась на 0,833% всех URL с картинками. Экстраполяция на всю базу Imgur даёт нам результат в 3,2 млн копий одной и той же картинки.

Раньше Imgur генерировал имена файлов из пяти символов (a-Z, 0-9), такие как BOOBs.jpg, а в 2013 году расширился до семи символов. Исследование провели только на пятисимвольных названиях файлов.

Из 1 001 506 запрошенных 573 156 URL вернули ошибку 404. А вот из остальных занятых адресов аж 3568 — это картинка человека вверху. Исследователи назвали его «богатый дядюшка» или «мистер Монополия» (Monopoly Man), как на обложке игры «Монополия».

На втором месте — белая линия (2652). На третьем месте — «водафоны» (телефоны Vodafone, 1601 результат). Эти картинки, получается, тоже закачаны в миллионных количествах.

Вопросы вызывают и другие картинки из списка самых популярных. Кто такой диджей Дэвис?



Исследователи также столкнулись с многочисленными случаями, когда удалённое владельцем изображение заменялось «богатым дядюшкой».

Обсуджение этой темы на Reddit несколько месяцев назад выдвинула несколько версий, из которых самая вероятная — что Monopoly Man каким-то образом используется внутри самой компании Imgur как некое тестовое изображение. Впрочем, это не снимает вопросов по другим «миллионникам». За каждым из них должна стоять какая-то история.

Комментарии (6)


  1. FakeFactFelis
    09.07.2015 14:41
    +4

    Огромное количество изображений на «Имейджере» — это просто картинки для веб-сайтов. Этому располагает тот факт, что картинки находятся в облаке. Даже если сайт упадёт (а это происходит часто), то картинки всё равно будут доступны. Ограничений на трафик нет (это не «Радикал», отдельные картинки запрашиваются миллионы раз в сутки, создавая терабайты трафика), ограничения на файл щадящие, загружать на сайт легко как через веб-форму (можно выгружать сразу по 80 картинок и немедленно получать ссылки на них), так и по АПИ. Вполне возможно, что частота этих изображений — это результат чьего-либо взбесившегося скрипта автозагрузки.



    1. KorDen32
      09.07.2015 16:41

      Ранее, когда был премиум, ограничения были жестче, особенно выбешивало ограничение на 200 изображений в аккаунте.

      Еще из плюсов Imgur — картинки доступны и по HTTPS


      1. FakeFactFelis
        09.07.2015 16:45
        +1

        Ограничение на количество изображений не означает, что старые картинки удалялись. Они просто не показывались в аккаунте. Без премиума картинки хранились минимум по полгода с момента последнего запроса, с премиумом (24 доллара в год) не удалялись никогда. Без премиума джипеги жались с качеством 80. С премиумом сжатия не происходило, хотя ненужная информация всё равно удалялась. С премиумом также были более мягкие ограничения на размер загружаемых изображений.

        Сейчас премиум убрали вообще, теперь все пользователи как бы с премиумом. Кстати, ХТТПС был не всегда, насколько я помню.


        1. KorDen32
          09.07.2015 16:55

          Они просто не показывались в аккаунте.

          Вот об этом я и говорю — я например загружал скриншоты результата работы своих юзерскриптов/плагинов, часто это были промежуточные и бета-версии, и я старался удалять неактуальные картинки, чтобы они не лежали мертвым грузом. Однако из-за этого лимита приходилось выбирать, что например эту картинку я загружу мимо аккаунта, т.к. её явно не собираюсь удалять (разве что перестанет быть акутальной и удалится сама), а эту загружу в аккаунт, т.к. возможно потом обновлю и старую лучше удалить. То же самое с альбомами.
          Да, можно было сохранять ссылки на удаление, но тогда вообще наличие аккаунта становилось бессмысленным.


  1. cjfynjy
    10.07.2015 04:13
    +1

    На втором месте — белая линия (2652)

    Это не совсем белая линия, а скриншот разделительной полосы из набора стандартных элементов интерфейса в винде. Чаще всего можно увидеть в разных окнах с настройками, где она разделяет разные области окна. Еще, например, так выглядит элемент
    <hr>
    
    при отсутствии каких-либо стилей. Думаю, это картинка, которую пихают в страницы тегом img вместо hr (для кроссбраузерности / кроссплатформенности, например; она отлично скейлится по горизонтали).