О чем статья
Эта статья предназначена для тех, кто впервые сталкивается с получением или отправкой данных о музыке в одном из стандартов DDEX. Здесь будет представлена базовая информация и ссылки на ресурсы, где можно найти дополнительные материалы.
Что читать
База знаний DDEX — база знаний DDEX, ответит на большинство вопросов
Music Business Association — публикует различные документы по стандартам индустрии
Apple Music Style Guide — гайдлайн от Apple
DDEX Data Dictionary — словарь данных для стандартов
DDEX Allowed Value Sets — ожидаемый набор значений
DDEX
От момента записи до нажатия кнопки «play» музыка проходит через множество компаний. Каждая из них отвечает за свою часть процесса: запись, права, лицензии, дистрибуцию, стриминг и т.д. В 2006 году, чтобы упростить обмен информацией между ними, была создана компания DDEX. Основная её задача — поддерживать и развивать набор стандартов сообщений между участниками рынка.
![Находим себя на схеме и понимаем, какие стандарты нам нужны Находим себя на схеме и понимаем, какие стандарты нам нужны](https://habrastorage.org/getpro/habr/upload_files/6e7/f38/288/6e7f38288cf1c6457667bfa478f12c79.png)
Стандарты
Стандарты DDEX — это набор правил и схем в виде XSD, обеспечивающих однотипное заполнение и использование данных.
Существует 10 основных стандартов DDEX:
ERN — Electronic Release Notification
MEAD — Media Enrichment and Description
PIE — Party Information Exchange
TOC — Transfer of Catalogues of Releases and Resources by Reassignment of Rights Controller Information
DSR — Digital Sales Report
CDM — Claim Detail Message
MWDR — Musical Works Data and Rights
BWARM — Bulk communication of Work And Recording Metadata
RDR — Recording Data and Rights
RIN — Recording Information Notification
Что читать
В первую очередь, я рекомендую ознакомиться с базой знаний самого DDEX. Каждый из стандартов подробно описан, начиная со структуры сообщений и заканчивая его внедрением.
Помимо документации, DDEX публикует документы с описанием конкретных стандартов, краткими выжимками, презентациями:
Часть из этих документов может быть устаревшей, но для введения и общего понимания они подходят.
Полезной информацией также делится MBA (Music Business Association). Они публикуют документы по стандартам, гайдлайны и т.д. Например:
Если вы работаете с такими стандартами, как ERN, MEAD и PIE, вам могут помочь руководства крупных компаний, таких как Apple или Spotify. Например, Apple Music Style Guide 2.2.
Метаданные ERN, MEAD, PIE
Я выбрал эти три стандарта, так как, скорее всего, вы столкнулись именно с ними.
ERN
Electronic Release Notification (ERN) — это базовый файл, описывающий релиз. Он содержит основную информацию о релизе, такую как названия, артисты, даты выпуска и т.д. Это обязательный файл для любой поставки.
Диапазон версий ERN, на которые следует ориентироваться, находится в пределах 3.4–3.8, но и версии 4.x уже начинают внедряться, хотя и не повсеместно. В общем, всё находится в переходном состоянии, и это продлится ещё несколько лет, пока все полностью не перейдут на новую версию стандарта. Почитать про различия можно подробнее вот здесь.
![Сравнение 3 и 4 версии ERN. Вынесли отдельно участников. Сравнение 3 и 4 версии ERN. Вынесли отдельно участников.](https://habrastorage.org/getpro/habr/upload_files/f89/7aa/3c9/f897aa3c91c0eee0fcf649e0ef81e085.png)
Помимо основных блоков, сообщение может содержать дополнительные, такие как WorkList, который предоставляет данные о дистрибьюторе и записывающей компании. Это минорные данные, и без них сообщение может быть отправлено и обработано, но чем больше данных, тем лучше.
Блоки ссылаются друг на друга, как это показано на схемах. Например, DealList описывает, как и где должны быть доступны элементы в ResourceList и ReleaseList.
MEAD и PIE
MEAD и PIE — это расширения метаданных, основная задача которых — предоставление информации для поддержки новых сценариев взаимодействия с музыкой.
Когда создавался ERN, ещё не существовало колонок с голосовым управлением, сложных рекомендательных систем и других современных технологий. MEAD и PIE призваны восполнить этот пробел.
Эти стандарты содержат данные о настроении музыки (например, Angry, Dark, RainyDay), произношение, расширение по жанрам, участникам, месту записи, инструментам и т.д. Рекомендательные системы будут рады такому набору данных.
Пока эти стандарты используют не все, но многие уже начали их внедрять. Когда они будут полностью приняты, рекомендации музыки должны значительно улучшиться.
Как и какие данные извлекать?
Вытащить данные из XML с определенной XSD структурой относительно просто: следуете по пути и извлекаете необходимые элементы. Однако определить, какие данные нужно доставать, сложнее.
Каждое сообщение, особенно MEAD и PIE, содержит большой объем данных, которые могут пригодиться в разных сценариях. Очевидно, что есть базовые данные, которые должны перейти в атрибуты соответствующих сущностей.
Поэтому я рекомендую всегда сохранять полученное сообщение целиком, а затем извлекать нужные данные по мере необходимости.
Вместо заключения
Надеюсь, эта статья помогла вам c навигацией по материалам, разобраться, где и что можно изучить. Искренне желаю вам терпения в изучении структуры сообщений и всех элементов стандартов DDEX.