О чем статья
Эта статья предназначена для тех, кто впервые сталкивается с получением или отправкой данных о музыке в одном из стандартов DDEX. Здесь будет представлена базовая информация и ссылки на ресурсы, где можно найти дополнительные материалы.
Что читать
База знаний DDEX — база знаний DDEX, ответит на большинство вопросов
Music Business Association — публикует различные документы по стандартам индустрии
Apple Music Style Guide — гайдлайн от Apple
DDEX Data Dictionary — словарь данных для стандартов
DDEX Allowed Value Sets — ожидаемый набор значений
DDEX
От момента записи до нажатия кнопки «play» музыка проходит через множество компаний. Каждая из них отвечает за свою часть процесса: запись, права, лицензии, дистрибуцию, стриминг и т.д. В 2006 году, чтобы упростить обмен информацией между ними, была создана компания DDEX. Основная её задача — поддерживать и развивать набор стандартов сообщений между участниками рынка.
Стандарты
Стандарты DDEX — это набор правил и схем в виде XSD, обеспечивающих однотипное заполнение и использование данных.
Существует 10 основных стандартов DDEX:
ERN — Electronic Release Notification
MEAD — Media Enrichment and Description
PIE — Party Information Exchange
TOC — Transfer of Catalogues of Releases and Resources by Reassignment of Rights Controller Information
DSR — Digital Sales Report
CDM — Claim Detail Message
MWDR — Musical Works Data and Rights
BWARM — Bulk communication of Work And Recording Metadata
RDR — Recording Data and Rights
RIN — Recording Information Notification
Что читать
В первую очередь, я рекомендую ознакомиться с базой знаний самого DDEX. Каждый из стандартов подробно описан, начиная со структуры сообщений и заканчивая его внедрением.
Помимо документации, DDEX публикует документы с описанием конкретных стандартов, краткими выжимками, презентациями:
Часть из этих документов может быть устаревшей, но для введения и общего понимания они подходят.
Полезной информацией также делится MBA (Music Business Association). Они публикуют документы по стандартам, гайдлайны и т.д. Например:
Если вы работаете с такими стандартами, как ERN, MEAD и PIE, вам могут помочь руководства крупных компаний, таких как Apple или Spotify. Например, Apple Music Style Guide 2.2.
Метаданные ERN, MEAD, PIE
Я выбрал эти три стандарта, так как, скорее всего, вы столкнулись именно с ними.
ERN
Electronic Release Notification (ERN) — это базовый файл, описывающий релиз. Он содержит основную информацию о релизе, такую как названия, артисты, даты выпуска и т.д. Это обязательный файл для любой поставки.
Диапазон версий ERN, на которые следует ориентироваться, находится в пределах 3.4–3.8, но и версии 4.x уже начинают внедряться, хотя и не повсеместно. В общем, всё находится в переходном состоянии, и это продлится ещё несколько лет, пока все полностью не перейдут на новую версию стандарта. Почитать про различия можно подробнее вот здесь.
Помимо основных блоков, сообщение может содержать дополнительные, такие как WorkList, который предоставляет данные о дистрибьюторе и записывающей компании. Это минорные данные, и без них сообщение может быть отправлено и обработано, но чем больше данных, тем лучше.
Блоки ссылаются друг на друга, как это показано на схемах. Например, DealList описывает, как и где должны быть доступны элементы в ResourceList и ReleaseList.
MEAD и PIE
MEAD и PIE — это расширения метаданных, основная задача которых — предоставление информации для поддержки новых сценариев взаимодействия с музыкой.
Когда создавался ERN, ещё не существовало колонок с голосовым управлением, сложных рекомендательных систем и других современных технологий. MEAD и PIE призваны восполнить этот пробел.
Эти стандарты содержат данные о настроении музыки (например, Angry, Dark, RainyDay), произношение, расширение по жанрам, участникам, месту записи, инструментам и т.д. Рекомендательные системы будут рады такому набору данных.
Пока эти стандарты используют не все, но многие уже начали их внедрять. Когда они будут полностью приняты, рекомендации музыки должны значительно улучшиться.
Как и какие данные извлекать?
Вытащить данные из XML с определенной XSD структурой относительно просто: следуете по пути и извлекаете необходимые элементы. Однако определить, какие данные нужно доставать, сложнее.
Каждое сообщение, особенно MEAD и PIE, содержит большой объем данных, которые могут пригодиться в разных сценариях. Очевидно, что есть базовые данные, которые должны перейти в атрибуты соответствующих сущностей.
Поэтому я рекомендую всегда сохранять полученное сообщение целиком, а затем извлекать нужные данные по мере необходимости.
Вместо заключения
Надеюсь, эта статья помогла вам c навигацией по материалам, разобраться, где и что можно изучить. Искренне желаю вам терпения в изучении структуры сообщений и всех элементов стандартов DDEX.