Стандартная гауссова статистика работает на основе следующих предположений. Центральная предельная теорема утверждает, что при увеличении числа испытаний, предельное распределение случайной системы будет нормальным распределением. События должны быть независимыми и идентично распределены (т.е. не должны влиять друг на друга и должны иметь одинаковую вероятность наступления). При исследовании крупных комплексных систем обычно предполагают гипотезу о нормальности системы, чтобы далее мог быть применен стандартный статистический анализ.

Часто на практике изучаемые системы (от солнечных пятен, среднегодовых значений выпадения осадков и до финансовых рынков, временных рядов экономических показателей) не являются нормально-распределенными или близкими к ней. Для анализа таких систем Херстом [1] был предложен метод Нормированного размаха (RS-анализ). Главным образом данный метод позволяет различить случайный и фрактальный временные ряды, а также делать выводы о наличии непериодических циклов, долговременной памяти и т.д.

Алгоритм RS-анализа


  1. Дан исходный ряд image. Рассчитаем логарифмические отношения:

    image
  2. Разделим ряд image на image смежных периодов длиной image. Отметим каждый период как image, где image. Определим для каждого image среднее значение:

    image
  3. Рассчитаем отклонения от среднего значения для каждого периода image:

    image
  4. Рассчитаем размах в пределах каждого периода:

    image
  5. Рассчитаем стандартное отклонения для каждого периода image:

    image
  6. Каждый image делим на image. Далее рассчитываем среднее значение R/S:

    image
  7. Увеличиваем image и повторяем шаги 2-6 до тех пор, пока image
  8. Строим график зависимости image от image и с помощью МНК находим регрессию вида: image, где H – показатель Херста (см. рисунок).


Проверка значимости


Далее проверяем полученный результат на значимость. Для этого проверяем гипотезу о том, что анализируемая структура является нормально-распределенной. R/S являются случайными переменными, нормально распределенными, тогда можно предположить, что H также распределены нормально. Асимптотическим пределом для независимого процесса является показатель Херста равный 0.5. Энис и Ллойд [2], а также Петерс [3] предложили использовать следующие ожидаемые показатели R/S:
image
Для n наблюдений находим ожидаемый показатель Херста: image.

image

Ожидаемая дисперсия будет следующей: image, где T — количество наблюдений в выборке.

Выборочная статистика: image.
Сравниваем ее с критическим значением нормированного нормального распределения.

Если выборочное значение меньше критического, то гипотезу о нормальном распределении системы не отвергаем на данном уровне значимости. Структура случайна и имеет нормальный закон распределения.

Список литературы:

  1. Херст, Г. Э., 1951. «Долгосрочная вместимость водохранилищ». Труды Американского общества гражданских инженеров, 116, 770-808.
  2. Anis, A.A., Lloyd, E.H. (1976) The expected value of the adjusted rescaled Hurst range of independent normal summands. Biometrica 63: 283-298.
  3. Peters, E.E. (1994) Fractal Market Analysis. Wiley, New York. ISBN 0-471-58524-6.

Комментарии (5)


  1. markhor
    22.04.2015 20:20

    А откуда брать критическое значение нормированного нормального распределения при данном уровне значимости?
    Правильно ли я понял, что E(H) находится «в лоб», с помощью того же самого МНК?


    1. alexandergoncharenko Автор
      22.04.2015 21:11
      +1

      Уровень значимости задаем сами (традиционно 0.1, 0.05 или 0.01). Критические значения 1.2815, 1.6448, 2.3263 соответственно.
      E(H) находится также через МНК.


  1. iEcho
    23.04.2015 08:44

    Помню писал курсовую работу по вычислению показателя Херста.
    Собственно, R/S-анализ далеко не самый точный алгоритм вычисления показателя Херста, есть штук 5-6 более точных, но литература по ним очень труднонаходима. Ибо занимаются показателем Херста в основном китайцы.


  1. xaoc80
    23.04.2015 11:44

    Пробовал при помощи показателя Херста детектировать шумы в звуковом сигнале (чистый шум/зашумленный сигнал). Удалось достаточно точно детектировать чистый шум (наводки). С зашумленным сигналом лучше работает автокорреляционная функция. Однако, с точки зрения вычислительной сложности, R/S — анализ более интересен.


    1. alexandergoncharenko Автор
      23.04.2015 13:42

      Если AR хорошо справляется, значит шум имеет краткосрочную память. Что качается долгосрочной памяти и циклов, AR плохо фильтруют. Как раз при анализе валют, исходный ряд фильтрую с помощью AR(1), и далее RS анализ. Так высокие частоты часто идентичны белому шуму, на более низких глобальная структура более очевидна.