В списке потенциальных возможностей технологии — анализ систем с недоступным для наблюдения входящим возмущением, определение резонансных свойств таких систем, спектра и самого процесса внешнего возбуждения, спектральное оценивание процессов по их коротким реализациям, моделирование поведения систем при малой частоте дискретизации по времени и т.п.
ARMA-процессы, хорошо известные экономистам (точнее, «эконометристам»), ощутимо менее — специалистам по автоматическому регулированию, и, по-моему, почти не применяются инженерами-механиками и радиоэлектронщиками, особенно «старой закалки». В статье предпринимается попытка указать некоторые возможные области применения ARMA-теории в инженерной практике.
В двух словах, упрощенно, для незнакомых с предметом, о чем, собственно, речь. Стохастическому непрерывно-временному процессу x(t) по понятным «цифровым» причинам» на практике обычно сопоставляется дискретно-временная последовательность x[i] с интервалом дискретизации ?t.
В принципе, для любого процесса x[i] возможно представление вида
x[i] – a1· x[i-1] — a2 ·x[i-2] — … — ap· x[i-p] = b0 ·f[i] + b1 ·f[i-1] +...+ bq ·f[i-q] (1),
где ak и bk – постоянные (для данной модели) коэффициенты, называемое моделью авторегрессии-скользящего среднего с порядком по авторегрессии p и по скользящему среднему q. или ARMA(p,q)-моделью, f[i] — некий «входящий» процесс, о котором чуть ниже. Часто (1) записывают в немного иной форме(6).
В общем-то, это просто цифровой фильтр, имеющий как рекурсивную AR, так и нерекурсивную MA части.
Имеет место соответствие ARMA(p,q)-моделей линейным системам (например, механическим), например, описываемым хорошо всем известным линейным дифференциальным уравнением вида
где m,c,k – масса, жесткость и демпфирование механической системы, f(t) – внешнее силовое воздействие. ARMA-аналог выглядит так:
x[i] – a1· x[i-1] — a2 ·x[i-2] = b1 ·f[i-1] (3),
коэффициенты модели могут быть довольно легко найдены через собственные значения ?1 и ?1*(для краткости рассматривается «осциллирующий» случай ) линейной системы и ?t:
a1=z+z*, a2= — z·z*, b1= j(z*-z)· ?t/(2m?1),
где z = exp(?1 · ?t), ?1 = -?1 +j?1, j- мнимая единица, *- комплексное сопряжение
для справок:
Для тестовой системы было принято m=1 кг, c= 100 Н/м, k=0,75 кг/с, ?t=0,12 с.,
получена ARMA(2,1)-модель
x[i] — 0.69433x[i-1] +0.91393 x[i-2] = 0.010696·f[i-1]
(Очень краткое пояснение, как из (2) вообще получается (3). Импульсная переходная функция нашей линейной системы, т.е. отклик системы на единичный импульс:
Запись (2) в «интегральной» форме зовется «сверткой» f(t) и h(t), по смыслу предполагает рассмотрение внешнего воздействия, как последовательности элементарных импульсов. В дискретном времени записывают, ну например, так:
Сложением x[i], x[i-1] и x[i-2] с применением подобранных множителей 1, a1 и a2 добиваются взаимного уничтожения бесконечных «хвостов» h[i] – в правой части остаются f[i]·h[0]=f[i]·0 и f[i-1]·h[1]=f[i-1]·b1. С точки зрения ARMA-теории, произведено преобразование бесконечномерной модели скользящего среднего МА(?) в ARMA(2,1) (хотя некоторые скажут, что случайно получилась вообще чисто авторегрессионная модель AR(2) = ARMA(2,0)).
Замечание 1. Сведующий в цифровой обработке процессов читатель скажет, что просто так дискретизировать h(t) не очень правильно — надо ограничить функцию h(t) по частоте до 1/(2?t) (отфильтровать). Иначе присутствует ошибка маскирования частот. На изображенных графиках АЧХ и ФЧХ нашей системы, «аналитической» и ARMA-модели, видно, почему этой ошибкой в большинстве инженерных случаев можно, скорее всего, пренебречь (рис. 1) (здесь АЧХ — в логарифмической шкале).
рис.1 АЧХ и ФЧХ тестовой системы.
Замечание 2. На практике порядок ARMA-модели может быть существенно больше, чем рассмотренный выше пример, вследствие, скажем, нескольких степеней свободы механической системы или сложного спектра реального внешнего воздействия.
Замечание 3. Очень важно. Существуют методы (здесь не рассмотренные — про них еще много статей можно написать), позволяющие оценить параметры ARMA-модели (а именно, порядок модели p и q и коэффициенты ak и bk ) только по результирующему процессу x[i], в предположении, что f[i] — гипотетический белый шум, дисперсию которого также можно оценить. В общем-то, такое оценивание и есть главная часть всей ARMA-теории. Особым совершенством пока эти методы не отличаются, но интерес представляют немалый.
Теперь о том, для чего, собственно, всё это можно (или можно было бы) применить на деле. Кроме вполне очевидного — быстрого построения «вручную» затухающих (и незатухающих) синусоид по двум первым точкам и двум коэффициентам a1 и a2, есть, по-моему, более серьезные приложения этих моделей в инженерной практике.
1. Ну, собственно, для симуляционного моделирования работы системы — подаем реальный внешний сигнал f[i] на вход, получаем x[i] на выходе:
x[i] = a1· x[i-1] + a2 ·x[i-2] + … + ap· x[i-p] + b0 ·f[i] + b1 ·f[i-1] +...+ bq ·f[i-q] (6)
ARMA-модель справляется с задачей лучше, чем конечноразностная модель, правда, заметно это только при больших интервалах дискретизации ?t. (на рис. 2, ?t = 0,12с (слева) и 0,03 с). В каких случаях есть смысл возиться с ARMA — решать вам.
рис. 2. Отклик тестовых систем на единичный импульс.
2. Для спектрального оценивания, особенно при недостаточной доступной для наблюдения длине реализации стационарного процесса. Возможно, это наиболее известное инженерное приложение ARMA-моделей. Поскольку для изучаемого процесса будет получен и некий цифровой фильтр, и дисперсия входящего в него белого шума, задача построения оценки СПМ решается очевидным образом. Действительно, можно получить внешне очень «гладкие» графики СПМ и при этом создающие впечатление высокого разрешения. Ожидаемые улучшения оценки связывают с тем, что исследователь привносит в построение оценки внешнюю информацию о природе процесса — обычно, задавая известный порядок модели.
Короче, надо знать, как примерно должна выглядеть эта СПМ. «Разведочные» исследования данной реализации с помощью классических методов могут мало что дать, в основном имеются ввиду классические (на основании БПФ) исследования похожих по природе, но ощутимо более длинных реализаций. Существует вероятность грубых ошибок.
3. Для анализа резонансных свойств системы и спектра внешнего воздействия, в случае, когда истинное внешнее воздействие недоступно для наблюдения. Как уже отмечалось, можно, зная процесс x[i], определить все коэффициенты модели ak и bk (и дисперсию входящего белого шума). По ним, определяя корни двух полиномов с соответствующими коэффициентами, легко уже найти p «полюсов» и q «нулей» модели ( ?k и ?k) и построить ее передаточную функцию — можно, наверное, даже не в ARMA-виде (здесь не приводится), а в привычном «аналитическом» виде — как мы выяснили выше (рис.1), разница невелика. Например, для p=5, q=3 (отвлекаясь пока от имеющихся, по-видимому, ограничений на соотношение p и q), как вариант, имеем:
Все очень-очень упрощенно, конечно. Исходя из известной природы исследуемого объекта (например, это полигонные испытания плавности хода автомобиля) и внешнего воздействия (микропрофиль дороги), передаточную функцию исследователь решил вот переписать, например, так:
Рис.3 Анализ спектра сигнала с выделением входящего возмущения
и прокомментировал — часть модели, связанная с ?1, это, очевидно (с точностью до возведения в квадрат и умножения на дисперсию входящего гипотетического белого шума) «розовый» микропрофиль дороги (рис.3)(т.е. мы выделили неизвестный спектр реального входящего сигнала — выбрали вручную — вроде как «похож»), ?2 и ?3— резонансные свойства кузова на подвеске (возможно, продольно-угловая и вертикальная формы колебаний). Главная проблема будет, конечно, в определении параметров ARMA-модели. Для только что описанного иногда можно безо всяких ARMA по-старинке «ползать» (хоть и в электронном виде) по графику спектральной плотности и измерять ширину пиков на уровне -3 дБ и т. п., или применить курвфиттинг, иногда даже с бОльшим успехом.
3. Для линейного предсказания x[i]. По-видимому, основное приложение ARMA у «эконометристов». Из (6) видно, что, если коэффициенты модели удалось оценить методами, в общих чертах упомянутыми выше, очередное значение x[i] можно оценить с точностью до недоступного наблюдению гипотетического белого шума b0 ·f[i], дисперсию этого белого шума оценивают вместе с коэффициентами модели. Обычно в данном случае подразумевается динамическая (в реальном времени) корректировка параметров модели. По-видимому, может быть полезно в системах активного вибро- и шумоподавления. Специалистам по ТАР виднее.
4. Для восстановления недоступного для наблюдения входящего процесса. При разделении модели на части, как было показано выше в п.3, основываясь на знаниях о природе изучаемого процесса, можно оценить отдельно спектр входящего возмущения, отдельно — осцилляторные свойства физической системы (разделить модель на части). Можно пойти дальше — сформировать фильтр (ARMA-модель, обратная части первоначальной модели), связывающий выход системы с входом, и с его помощью из результирующего процесса x[i] получить временнУю реализацию входящего возмущения. Например, попытаться восстановить неискаженный сигнал, записанный с точно неизвестными линейными искажениями аппаратурой, недоступной для отдельного исследования (скажем, полученный по телеметрии).
Исходя из своих скромных познаний, в итоге выскажу такое субъективное суждение. Применимость ARMA-технологий к инженерным задачам сильно зависит от совершенства методов оценки параметров этих моделей по результирующему сигналу, точнее, по-моему, сильно сдерживается несовершенством этих методов. Наработка опыта применения ARMA в инженерном деле, похоже, имеет смысл, в основном, именно в преддверии весьма вероятного «прорыва» в этой сфере.
Комментарии (2)
crowncork Автор
12.04.2019 20:02Нет, нет. Многоканальное ARMA тоже есть и тоже представляет немалый интерес, но пока разговор про анализ одного-единственного процесса — считаем, что ничто иное нам недоступно для наблюдения. Для целей предсказания самое простое как для применения, так и для понимания — чисто авторегрессионная модель (AR(p), или, иными словами, ARMA(p,0), то есть прогноз следующего значения x[i]- это линейная комбинация p предыдущих x[i-1]a1+x[i-2]a2+… Коэффициенты a1...ap зовут «коэффициенты линейного предсказания». Для поиска обычно используют систему линейных алгебраических уравнений с ковариационными коэффициентами — (для стационарных процессов — значениями автокорреляционной функции)(т.наз. уравнения Юла-Уокера(aka Юла-Уолкера). Они очень просты, если сподоблюсь, что-нибудь про это на днях напишу. Правда, скорее, больше про спектральное оценивание.
pallada92
Спасибо за статью. Мне немного стыдно писать свой комментарий т.к. я как программист не сталкивался с проблемой оценивания спектра внешнего воздействия по коэффициенту демпфирования механической системы.
Но про то, как применяют эту модель эконометристы, было бы интересно узнать поподробнее. Как я понял, у нас есть «черный ящик», мы знаем историю входящего значения и историю результата и мы хотим предсказать следующий результат. Для этого нам нужно как-то подобрать линейные коэффициенты модели.
Я правильно понимаю, что это классический случай задач в стиле Flu Trends? То есть у нас есть история поиска лекарств в Google в реальном времени и официальные данные по гриппу с задержкой и мы хотим оценить текущую заболеваемость (Google, кстати, в итоге признали, что модель не работает).
Еще мне вспомнилась недавняя статья "Представление произвольных полиномов в виде конечных разностей с произвольным шагом". Это частный случай этой модели, когда коэффициенты b_i равны нулю и процесс моделируется полиномом степени p.
В общем было бы очень интересно узнать про методы подбора коэффициентов у эконометристов.