Изначально я придумал такой расклад: звездочки отвечают за высоту тона, просмотры за длительность ноты, комментарии за громкость звука, отметки «нравится» добавляют кольцевую модуляцию, отметки «не нравится» снижают объем звука (gverb/damp), а количество постов за день влияет на темп. Для постов пользователей и компаний предусмотрены разные наборы синтезаторов (выбор случайный).
Почистив данные в Excel (убрал лишние столбцы и очевидные несообразности типа 32767 плюсиков), я набросал скрипт и послушал, что получилось. Получилось так себе: во-первых, данных слишком много, и даже в очень быстром темпе слушать пришлось бы несколько часов; во-вторых, разброс по параметрам слишком высок, поэтому звучит очень монотонно, особенно вначале.
Тогда я попробовал разбить данные по месяцам, и после нескольких экспериментов немного поменял зависимости — количество просмотров стало влиять и на высоту тона, и на длительность, звездочки добавляют эффект «эхо», от перепадов темпа я отказался, потому что слушалось это ужасно, и в итоге количество постов за день задает высоту стартового тона.
В набор синтезаторов для пользователей и компаний включены шумы — должна же во всем многообразии постов быть какая-то доля шлака. Ну и просто для развлечения все это сопровождает евклидов бит по мотивам предыдущей статьи.
Итак, «хабр — начало»:
Не слишком впечатляет, не правда ли? (просто в первом файле оказалась всего одна запись)
Поначалу хабр звучит довольно монотонно, но уже к январю 2007 года входит в некий загадочный авангардный ритм:
Через год после запуска басовая линия идет уже довольно быстро, и появляются высокие ноты:
К началу 2008 можно слышать изредка уже какие-то интересные ходы:
Темп постепенно ускоряется:
И к 2009 году все звучит уже довольно бодро (хотя шума получается многовато):
Но это не предел:
К концу 2011 в быстром темпе начинают потихоньку появляться компании — их звуки имеют другой тембр:
С мая 2012 оказывается, что быстрый темп — это не то, что было раньше:
а к концу года это становится особенно заметно:
Хотя бывают и периоды некоторого спада:
На 13 треке я решил все-таки уменьшить темп, потому что слушать дальше стало уже очень трудно. Это март 2014, тут можно слышать много звуков компаний, и общая активность довольно высокая:
Март 2015 дает еще более плотную фактуру, и более интересную, на мой взгляд:
Последний месяц в данных — февраль 2016 — звучит вполне неплохо (или я просто привык):
Код можно посмотреть тут: github.com/hippus/habrasound
Надеюсь, никто не примет этот пост слишком серьезно. В конце концов, всякий может скачать код и сделать так, чтобы Хабр зазвучал сообразно его ожиданиям. Нет предела совершенству, особенно в тех вещах, что делаются из любопытства и желания поразвлечься.
UPD (который, вероятно, будет интересен aikixd и media_magnit): нам пишет Wolodya Dzyuba
Здравствуйте, hippus!
Не могу оставить комментарий к статье на Хабре — оставлю здесь. Вроде такие штуки называются "сонификацией". Я где-то видел презентацию про то, как озвучивают/сонифицируют сетевой трафик, чтобы админы могли на слух вычислять вирусы или DDoS, что-то вроде этого.
Комментарии (18)
aikixd
10.03.2016 15:55Звук получается можно использовать что-бы выискивать сложные зависимости, как инструмент дата майнинга. Если данных много, то по графикам сложно провести корреляцию, а звук мозг очень легко обрабатывает. Попробуйте использовать какие нибудь еще ресурсы, рынок валют например.
hippus
10.03.2016 16:21Интересная идея, только вот я что-то не могу представить, какие бы данные в виде звука обрабатывались лучше, чем глазами — пики какие-нибудь, или… что? можете привести пример?
aikixd
10.03.2016 19:16Корреляции. Когда нужно найти связь между 4-5 типов данных. Скажем связь между объемом рынка, активностью, размером сделок и количеством участников. Чтобы увидить глазами нужно 4 этих графика плюс графики преобразований и отношений. А ушами просто слушать.
jehy
10.03.2016 22:28Шикарно. Слушать некогда, но с удовольствием прочитал статью. Надо взять на заметку такой способ показывать заказчику статистику.
И не переживайте, что каждый может заставить звучать хабр так, как он хочет. Вся статистика субъективна и отвечает только целям создателя.
AndersonDunai
11.03.2016 15:44+1Восхитительно! Наверное, немало времени ушло на калибровку всех параметров.
Кстати, быстрые версии до боли напоминают Aphex Twin. Так что у вас получился некий настоящий IDM :)
Soboleva
11.03.2016 22:41Спасибо за пост, очень интересно. Пытаюсь установить формат, в котором исполнена эта замечательная публикация.
Звукографика? Sounds data minig? Анализ данных в виде звука? Визуализация данных в виде звука? Звуколизация данных?hippus
11.03.2016 23:32+1Я тоже размышлял на эту тему, но пока безуспешно — "аудиолизация" звучит как-то глупо… а если нет подходящего варианта, то надо подождать пока язык сам скажет за нас :)
Andrey_Perelygin
Это просто гениально! Большое спасибо автору, удивил.
hippus
Спасибо, тронут, воодушевлен, польщен
ozonar
А может вычислить среднее по месяцу, и слепить из этого общий аудиофайл всей наблюдаемой истории Хабра? Ну или брать, например, каждый десятый день?
hippus
Среднее что? Количество просмотров? Можно, конечно — все, что угодно, можно.