Как спрятать мусор в базе Spotify и превратить это в квест / forpes.ru

Главная
Как спрятать мусор в базе Spotify и превратить это в квест

Как спрятать мусор в базе Spotify и превратить это в квест +48

14.09.2020 04:46

koteeq 27 11900 Источник

Опасный хакер прячет Spotify-код с секретной информацией

Введение

Одной бессонной ночью мы с приятелем разговорились о Spotify-кодах.

Это такие картинки, которые можно отсканировать приложением и попасть на нужный трек/альбом/плейлист. Придуманы они, чтобы люди могли делиться музыкой в социальных сетях или в оффлайне.

Пример. Такая грусть у меня играет прямо сейчас.

Мы решили разобраться, как же Spotify кодирует в них ссылки.

Как работают коды?

Выяснилось, что помимо меню «Поделиться» в приложении, есть официальный сайт Spotify Codes, который генерирует такие коды.

Если скопировать ссылку на картинку с этого сайта, получится что-то такое: https://scannables.scdn.co/uri/plain/jpeg/000000/white/640/spotify:track:5jxN9knH0vlfpN2Ft7a5xi

Прекрасно! Динамическая ссылка, которая принимает на вход ID трека и возвращает изображение с баркодом — самое то для наших экспериментов.

Очень удобно, что генератор может рисовать коды и в SVG. Это позволило без головной боли понять, что столбики бывают восьми разных высот.

Первый и последний столбик всегда минимального размера, так что он, видимо, используется для ориентирования при сканировании, как и логотип Spotify, который на картинке всегда слева. Без них ничего не работает.

Получив число 556205622371746371156, приложение превращает его в 58992959842 с помощью таблицы Грея. Именно это делает распознаванием таким быстрым и устойчивым к ошибкам. Как узнали? К этому моменту мы уже набрели на патент Spotify, описывающий принцип работы таких кодов.

Остался последний вопрос: как же приложение превращает лаконичное 58992959842 в spotify:track:5jxN9knH0vlfpN2Ft7a5xi?

Очевидно, такое число не может вместить в себя все комбинации длинного цифро-буквенного ID, а значит никакого алгоритма нет и соответствие между кодом и ID трека хранится где-то в базе.

Можно проверить, подсунув генератору какой-нибудь очень длинный мусор, который точно не влез бы в число: https://scannables.scdn.co/uri/plain/jpeg/000000/white/640/spotify:track:thisisaverylongidentifierwhichwoulddefinitelyoverflowthatnumericcode

Сработало. Печально, а ведь было интересно научиться кодировать/раскодировать такие картинки полностью самостоятельно.

Решила проверить обмен приложения с сервером в момент распознавания и догадка подтвердилась:

На сервер уходит 58992959842, а возвращается трек 5jxN9knH0vlfpN2Ft7a5xi

Скука: дальше всё происходит за ширмой бэкенда. Расходимся?

Оченьдлинныймусор

Стоп, что? Генератор сделал картинку для оченьдлинногомусора?

Вероятно, он не проверяет реальность входных данных и бережно складывает наш мусор в базу, присваивая ему 11-значный числовой ID.

А что будет, если считать такой код приложением?

Это ожидаемая реакция. Наверное, сервер уже проверил и инвалидировал некорректный код. Интересно посмотреть, как выглядит такая ошибка, поэтому загляну в трафик ещё раз:

Великолепно. Spotify складывает в базу всё, что мы укажем в запросе к генератору, хранит это там, а при сканировании отдаёт обратно в первозданном виде, никак не валидируя.

Идея сделать из этого квест для любителей реверс-инжиниринга возникла уже где-то здесь, но он получился бы слишком скучным: ошибка при сканировании сразу наводила на мысли.

Всё лучше под музыку

Чтобы всё было аккуратно, нужно заставить приложение играть музыку, несмотря на чужеродные данные в ID трека.

Я уже собралась реверсить обфусцированный код Android-приложения, чтобы узнать, как работает парсер, но приятель предложил попробовать разделять музыкальный ID и нашу полезную нагрузку знаком вопроса. Идея сработала, но знак пришлось дважды пропустить через urlencode. Например, spotify:track:2ctvdKmETyOzPb2GiJJT53%253Fhi,habr!, выглядит вот так:

Такой код приложение считает как положено и включит песню, а посмотрев в трафик можно достать спрятанные данные, что и стало корнем моего квеста. Для удобства можно закодировать данные в Base64, влезет в URL их немало.

Выводы

Почему Spotify позволяет хранить в базе мусор? Вероятно, потому что генерацией и распознаванием кодов занимается отдельный микросервис, который должен отвечать моментально. Проверка на существование трека потребовала бы обращения к основному бэкенду, а это ресурсоёмкая задача.

Навредит ли это Spotify? Теоретически эта особенность позволяет заполнить таблицу соответствий кодов и исчерпать всю ёмкость, сломав генерацию картинок для настоящих треков, но на практике это займёт очень много времени. Я посчитала.

Полезно ли это на практике? Не знаю, как это использовать. Можете прятать номера телефонов любовниц в кодах с Егором Летовым и обклеивать ими стены, тогда ваша законная женщина покинет вас, сочтя сумасшедшим, будете свободны. Только имейте в виду, что запрос к API для считывания кода, к сожалению, требует авторизационный токен Spotify-аккаунта, в отличие от запроса для генерации картинки.

Оригинальный квест был здесь, послание было в Base64. Кто-то прошёл его за 42 минуты. На большее я не рассчитывала: имеющие привычку лезть в трафик приложений догадались бы сразу.

Помогал думать, предполагал хранение кодов в базе и решил добавить в ID знак вопроса приятель Эль.

UPD: утром 15 сентября, то есть спустя всего сутки после публикации, Spotify исправил ошибку.
Больше генератор кодов не принимает мусор, теперь работают только подходящие по формату ID.
Это очень обидно, потому что я думала, что им плевать и они сочтут это фичей. Могла бы в Bug Bounty податься :(

Комментарии (27)

Eirenliel
14.09.2020 08:09
#22065972
Spotify: *сделал прикольный сервис сокращения ссылок*
Аня: It's Free Real Estate

leverlever
14.09.2020 09:28
#22066208
Если прочитать этот пост под трек из "Реквиема по мечте", то вам может показаться что вы взломали пентагон и вскрыли супер важный для человечества заговор
1. isden
  14.09.2020 10:43
  #22066496
  С эпичной музыкой все становится эпичным.

ohm
14.09.2020 12:24
#22066936
+1
Я не сразу понял как сканировать код:

Открывайте поиск, жмите в поисковую строку и справа появляется камера.

middle
14.09.2020 14:26
#22067474
Spotify тут же пожалел, что пришёл в Россию :)
1. koteeq Автор
  14.09.2020 14:39
  #22067516
  Да я им шесть лет пользуюсь.
  1. trapwalker
    14.09.2020 16:30
    #22068022
    В смысле? Что вы там храните у них в БД?! =)
    
    koteeq Автор
    14.09.2020 16:41
    #22068064
    Ну… Обычно музыку, а тут как-то разошлась…

snowytoxa
14.09.2020 15:57
#22067852
отличная идея, но можно было и в баг-баунти сдать
1. pda11111
  14.09.2020 16:25
  #22067988
  Это не баг, это фича(с)
1. trapwalker
  14.09.2020 16:29
  #22068012
  Думаю уже поздно. Сейчас народ побежит делать FUSE-драйвера для хранения в спотифае своих бэкапов и коллекции порно.
1. koteeq Автор
  14.09.2020 16:42
  #22068068
  Я даже не стала пытаться, потому что это явно фича. Или скорее особенность реализации.

trapwalker
14.09.2020 16:11
#22067928
+1
А вы не думали сделать что-то большое, больше чем просто квест? Целую городскую легенду. Ассиметричную игру, где будет две команды: закрытая и открытая.
Закрытая команда творит дичь и делает загадочные вещи, а открытая команда не понимает, что играет в игру и пытается разобраться в загадках чисто из любопытства.

Основное правило — это не объявлять игру. Второе правило — у этой игры нет победителей и нет победы, есть лишь стратегия и тактика двух команд. Они не могут победить друг друга поскольку у них разные метрики: у закрытой команды — хайп, загадочность и резонанс, а у открытой — глубина найденых взаимосвязей в сети неявно связанных между собой загадок.

Первая команда может вербовать агентов и создавать изолированные, не знающие друг о друге и о большой Игре ячейки, а вторая команда вообще ничем не ограничена, но вынуждена жить в неопределенности, поскольку нет никакого валидатора ответов, и даже слив информации из первой команды не гарантирует распутывания всей сети из-за разветвленной структуры первой команды.
1. koteeq Автор
  14.09.2020 16:48
  #22068086
  Что-то вы сложное придумали, меня ж за экстремизм закроют.
  Я просто хотела маме похвастаться, что у меня теперь статья на Хабре есть, а там уже и рабочий понедельник настал: пришлось отложить деструктивные наклонности и вернуться в реальность.
  1. trapwalker
    14.09.2020 17:05
    #22068180
    Никакого деструктива.
    Всё началось с телефона в лесу. На старом дереве висит старый телефонный аппарат. Совершенно обычный с дисковым номеронабирателем. Провод от него уходит в небольшое природное дупло, а там прикручен к двум оцинкованным гвоздикам, забитым прямо в трухлявую древесину.
    Гвоздики можно выдернуть и вставить обратно, ничего не поломается. Также можно туда прикрутить любой обычный немодифицированный телефон и все будет работать.
    Если поднять трубку, слышен гудок. Набор валидного номера ведёт к обычным длинным гудкам вызова. Если повесть трубку, то через какое-то время телефон начнёт звонить… Да, как в матрице.
    А если поднять трубку во время звонка...
    
    Thoth777
    14.09.2020 18:02
    #22068398
    … то в ухо абонентся разряжается разряд в несколько киловольт, смодулированный песней «любопытство кошку сгубило»!
    
    trapwalker
    15.09.2020 08:56
    #22069576
    Теперь я понимаю, почему многие (хорошо, что не все) не просто не проявляют любопытство, но и выражают явное беспкойство при виде такой диковики в неожиданном месте.
    Самое для меня удивительное, что у некоторых беспокойство растёт вплоть до какого-то мистическоого ужаса, когда становится понятно, что телефон работает, а тем паче еще и звонит!
    
    Мне кажется кому-то надо смотреть больше научпопа вместо ужастиков. Насмотрятся всяких там "Звоноков" и телефонов боятся потом...

Mihanman
14.09.2020 17:12
#22068218
Можете прятать номера телефонов любовниц в кодах с Егором Летовым и обклеивать ими стены, тогда ваша законная женщина покинет вас, сочтя сумасшедшим, будете свободны.
Вечер необычных лайфхаков от Анны

ComodoHacker
14.09.2020 18:18
#22068438
Я уже собралась реверсить обфусцированный код Android-приложения, чтобы узнать, как работает парсер
А пореверсить может и стоило. Или пофаззить. В парсерах часто бывают ошибки, знаете ли. Неучтенные крайние случаи. Глядишь, и RCE где завалялось. А тут готовый канал доставки.

Temych
14.09.2020 18:50
#22068526
Ясно, теперь террористы будут общаться не в телеге, а в спотифай.
(роскомнадзор напрягся)
1. Oxyd
  15.09.2020 00:23
  #22069126
  SpotiChat

Taraflex
14.09.2020 23:33
#22069060
Для большей эффективности вместо base64 можно попробовать что-то из этого github.com/qntm/base2048#base2048
1. koteeq Автор
  14.09.2020 23:41
  #22069072
  Генератор кодов кушает только a-zA-Z0-9 и кучку простейших символов, даже кириллицу туда не впихнуть. Поэтому urlsafe base64 — лучший вариант, наверное.
  1. trapwalker
    15.09.2020 08:50
    #22069562
    Если попробовать использовать все допустимые после "?" ASCII символы в урле, а их там около 16 добавится сверх тех, что в base64, если я не ошибаюсь, то в тот же объем удастся впихнуть не более 5% (примерно) дополнительной информации. Сложность кодирования того не стоит. А ещё добавятся риски свалиться со специфическими исключениями где-то в недрах софта спотифая.

zzzzzzzzzzzz
16.09.2020 07:48
#22073454
Получив число 556205622371746371156, приложение превращает его в 58992959842 с помощью таблицы Грея. Именно это делает распознаванием таким быстрым и устойчивым к ошибкам.
Вот этот момент не понял. Как он от ошибок помогает?
(И ещё первое число длинное, а второе короткое, а коды Грея имеют ту же длину, что исходные данные… Видимо, придётся идти патент читать.)

koteeq Автор
17.09.2020 22:40
#22081874
Расстроилась я.
Была уверена, что они это багом не считают и фиксить не станут, что им плевать на эту особенность.
А они взяли и пофиксили, ещё и всего спустя сутки. Добавила об этом UPD.

Получается, можно было попробоваться в Bug Bounty, а если бы приняли, дали бы $250-300.

:c
1. Oxyd
  19.09.2020 16:42
  #22087750
  Всегда нужно пробовать влезть в баг баунти. Всегда!

Как спрятать мусор в базе Spotify и превратить это в квест +48

Введение

Как работают коды?

Оченьдлинныймусор

Всё лучше под музыку

Выводы

Комментарии (27)

koteeq Автор

koteeq Автор

koteeq Автор

koteeq Автор

koteeq Автор

koteeq Автор