Использование машинного обучения и цепи Маркова в создании музыки / forpes.ru

Главная
Использование машинного обучения и цепи Маркова в создании музыки

Использование машинного обучения и цепи Маркова в создании музыки +17

15.05.2015 10:25

Audioman 11 6589 Источник

В этой статье я представлю вам результаты исследований, которые проводил я сам. Алгоритмы или алгоритмические композиции использовались в создании музыки многие столетия. Например, западный контрапункт иногда может быть сведен к алгоритмической избыточности. Почему бы не использовать быстро обучаемые компьютеры, производящие миллиарды вычислительных операций в секунду, по назначению – для выполнения алгоритмов? В этой статье я этим и займусь, используя машинное обучение и цепь Маркова второго порядка.

Граф представляет матрицу переходов цепи Маркова (будет объяснена позднее) с разученными 8 композициями

Цепь Маркова?

Цепь Маркова, названа в честь Маркова Андрея Андреевича, и представляет собой псевдослучайный процесс перехода из одного состояния в другое. Переход происходит без запоминания предыдущего состояния (такой переход называется «марковостью»), и зависит только от текущего состояния и вероятностей, которые представлены в так называемой матрице переходов. Короче говоря, переход из одного состояние в другое – это случайный процесс, носящий вероятностный характер.

Основная идея

Цепь Маркова идеально подходит для создания алгоритмических музыкальных композиций. Ноты (128 из них) – это вероятностные состояния. Для реализации всего процесса я буду использовать цепь Маркова второго порядка, а это означает, что следующее состояние системы будет строиться на основании двух предыдущих (нот). Все вероятности хранятся в матрице размерностью 2^14x2^7. На входе синтезатор получает два целых числа (0 <= n, m <= 127), выступающих в качестве начальных нот. На их основании алгоритм вычисляет/генерирует следующую ноту и продолжает процесс вычисления до бесконечности (до тех пор, пока вы его не остановите). Для упрощения задачи, громкость звучания всех нот будет одинаковой (127), как и временной интервал между ними (300 мс).

Вычисление вероятностей и весов для матрицы переходов цепи Маркова второго порядка

Для вычисления матрицы переходов цепи Маркова используется матрица весов. Как я уже говорил, в алгоритме используется цепь Маркова второго порядка, поэтому в процессе вычислений участвуют три ноты. Для каждой комбинации из трех нот первые две всегда являются «начальным» состоянием, а третья «конечным»; результатом всегда является инкрементация соответствующего поля в матрице весов [первая нота*127+вторая нота][третья нота].

Разумеется, это всего лишь начало всего процесса. После расстановки всех весов в соответствии с нотами, матрица весов «нормализуется» (или конвертируется) в матрицу переходов путем замены целых чисел на их процентное отношение к сумме всех значений в строке. Отрывки кода ниже реализуют оба описанных процесса. Две матрицы сведены в одну, названную scoreMatrix.

Генерация матрицы весов:

	public static void updateWeight(int n1, int n2, int n3) {
    scoreMatrix[n1*127+n2][n3]++;
}

Нормализация матрицы весов/генерация матрицы переходов:

public static int sumAll(int pos) {
    int sum = 0;
 
    for(int i = 0; i < 128; sum+=scoreMatrix[pos][i++]);
 
    return sum;
}
 
public static void normalizeMatrix() {
    for(int i = 0; i < 128*128; i++) {
        int sum = sumAll(i);
        if(sum != 0)
            for(int j = 0; j < 128; j++) 
                scoreMatrix[i][j] /= sum;                   
    }
}

Непосредственно процесс обучения

Процесс обучения возвращает матрицу весов, которая после его завершения конвертируется в матрицу переходов. Алгоритм, описываемый в этой статье, использует для обучения MIDI-файлы (с расширением .mid). Алгоритм обрабатывает аудиофайл нота за нотой, параллельно обновляя матрицу весов, как было описано выше. Пошаговая обработка MIDI-файла обеспечивается за счет встроенного инструмента Java под названием Sequencer.

public Learn(String midiName) {
    try {
        Sequence sequence = MidiSystem.getSequence(new File(midiName));
 
        int id[] = {0, 0, 0};
        int nArr[][] = new int[2][2];
 
        for(Track track : sequence.getTracks()) {
            for(int i = 0; i < track.size(); i++) {              
                MidiEvent event = track.get(i);
                MidiMessage message = event.getMessage();
                if(message instanceof ShortMessage) {
                    ShortMessage sm = (ShortMessage) message;
 
                    if(sm.getCommand() == NOTE_ON) {
                        int key = sm.getData1();
 
                        for(int j = 0; j < 2; j++) {
                            if(id[j] == 2) {
                                id[j] = 0;
                                Score.updateWeight(nArr[j][0], nArr[j][1], key);
                            } else {
                                nArr[j][id[j]++] = key;
                            }
                        }
                    }
                }
            }
        }
 
        cnt++;
    } catch(InvalidMidiDataException|IOException e) {
        e.printStackTrace();
    }
}

Выбор правильной ноты

Ура! Мы дошли до самой важной части! Все строки кода, представленные выше, будут бесполезны, если мы не найдём способ генерировать правильную ноту. Процесс довольно прост и основан на случайных величинах: текущем состоянии (последние две ноты последовательности) и матрице переходов, полученной ранее. Вероятность генерируется случайно, с помощью функции Java Math.random(). Затем алгоритм просматривает матрицу переходов и возвращает ту вероятность, которая совпала (или оказалась наиболее близка) с вероятностью, сгенерированной функцией Math.random().

public static int nextNote(int n1, int n2) {
    double rnd = Math.random();
    double sum = 0.0;
 
    for(int i = 0; i < 128; i++) {
        sum += scoreMatrix[n1*127+n2][i];
 
        if(sum >= rnd)
            return i;
    }
 
    return (int) (rnd*127); /* In an off chance that no states are found (all have 0.0 probability of transition), the algorithm continues randomly */
}

Воспроизведение результата

Результат воспроизводится с помощью Synthesizer – встроенного инструмента Java, ноты для которого выбираются «на лету» из матрицы переходов по алгоритму, описанному выше. По большому счету, результат определяется двумя начальными нотами, сгенерированными случайным образом или выбранными пользователем.

try {               
    Synthesizer synth = MidiSystem.getSynthesizer();
    synth.open();
 
    final MidiChannel[] channels = synth.getChannels();
 
    int fn, sn, nn;
 
    fn = n1;
    sn = n2;
 
    while (!this.isInterrupted()) {
        nn = Score.nextNote(fn, sn);
 
        int octave = (nn/12)-1;
        String noteName = NOTE_NAMES[nn%12];
 
        channels[0].noteOn(nn, Info.NOTE_VELOCITY);
        Thread.sleep(Info.NOTE_PAUSE);
        channels[0].noteOff(nn);
 
        fn = sn;
        sn = nn;
    }
} catch(Exception e) {}

Конечный продукт (альфа-версия)

На изображении ниже представлен интерфейс приложения:

Сэмплы

Вот примеры композиций, созданных программой Markov composer. На основании проведенных экспериментов, должен сказать, что она способна создавать более длительные и интересные композиции.

Кода

Хотя это просто эксперимент, на выходе программы получается не полная дисгармония, а некоторые начальные комбинации могут привести к удивительным, приятно звучащим композициям.

Полный код программы, включая графический интерфейс, доступны в моем репозитории на GitHub.

Комментарии (11)

link0ln
15.05.2015 14:59
#8371350
А разнообразить разной длительностью звучания нот можно?
1. Shekeen
  15.05.2015 16:18
  #8371470
  Можно, конечно. И громкость можно. Для начала стоит взять эти три параметра независимыми (для упрощения вычислений), и можно делать для них все то же самое, что описано в статье. А вот аккорды прикрутить, подозреваю, уже не так просто.

Sadler
15.05.2015 21:16
#8371734
+2
Весьма наивный подход в алгоритмической композиции. Последовательность трёх нот сама по себе выражает не слишком много, пока мы не знаем хотя бы, к какой тональности она принадлежит. Такая система будет «плавать» как попало, вызывая весьма диссонансный эффект. Автору следовало хотя бы учить систему относительно тоники, а не по всему диапазону midi.

1eqinfinity
15.05.2015 22:17
#8371774
Это всегда очень весело :) Я так делал генератор восьмибитной Мешуги на Chuck когда-то. Более мелодичные вещи тоже получались.

vagran
15.05.2015 22:42
#8371790
+5
Слова для современных песен чем-то подобным подбирают.

m03r
16.05.2015 14:16
#8372020
У такого подхода есть фатальный недостаток: в модели предполагается, что мелодия — последовательный набор нот. Для человека имеют значение другие свойства. Поскольку музыка — искусство временнoе, «естественные» мелодии всегда каким-то образом организованы во времени. Это проявляется в определённых структурных связях между разными фрагментами мелодии на расстоянии. Структурные связи могут выявляться разными способами. Если мы говорим о классико-романтической музыке, то музыкальный метр, гармония и мотивная структура часто действуют вместе, делая слышимой музыкальную форму. Слышимая форма, в свою очередь, позволяет слушающему человеку укладывать слышимое в несколько уровней абстракции. Простейший пример: песня состоит из двух куплетов, соло и ещё куплета, в каждом куплете — запев и припев, в них — несколько (обычно четыре) сходных фраз, причём следуя структуре стиха первая обычно больше похожа на третью, а вторая — на четвёртую. И так далее. В академической музыке всё куда сложнее.
1. Sadler
  16.05.2015 14:26
  #8372028
  Полагаю, задача этой штуки — находить интересные шаблоны для их использования в своих произведениях, а не писать полноценные композиции. У меня для тех же целей куча самоделок, т.к. рассчитывать только на фантазию не всегда продуктивно.
  1. m03r
    16.05.2015 14:38
    #8372036
    В поиске «интересных шаблонов», думаю, можно обойтись и генератором случайных чисел.
    
    Sadler
    16.05.2015 15:05
    #8372048
    Генератор случайных чисел в чистом виде слишком режет слух. Да и у этого в основе тот же генератор, просто у него распределение вероятностей чуть более сложное получается.

KvanTTT
16.05.2015 18:50
#8372168
Статья явно для хабра