1. Наряду с проверкой различия параметров положения двух генеральных совокупностей часто требуется проверить различие двух параметров масштаба.
Пусть– случайная выборка объёмас плотностью распределенияи– случайная выборка объёмас плотностью распределения, где– симметричная функция плотности распределения случайной величины, .
Отметим, что в оговоренных условиях, имеем
откуда, в частности, следует
2. Интересующая нас гипотеза имеет вид
где. Далее рассматривается, основанная на рангах, процедура для проверки указанной гипотезы – тест Флигнера-Киллина (Fligner-Killeen test), а также строятся точечная оценка и доверительный интервал для параметра.
3. Так как тест для проверки гипотезыдолжен не зависеть от параметров положения, то следует центрировать имеющиеся наблюдения. В параметрическом F-тесте (var.test {stats}
), основанном на отношении выборочных дисперсий, для этой цели используются выборочные средние; вместо них мы применим, равные им в силу симметрии, медианы:
Исключив из дальнейшего рассмотрения возможные нулевые значения, найдём логарифмы абсолютных величин центрированных наблюдений. В результате получим две выборкии, разница в параметрах положения которых (ключевой момент!) равна.
Таким образом, задача о различии параметров масштаба сведена к задаче о различии параметров положения. Применим для её решения анализ, основанный на score функциях, разбор которого начат в предшествующей статье «Статистически устойчивый анализ данных: тест Манна-Уитни-Уилкоксона и Score-функции».
4. Так как логарифмическая функция монотонно возрастает, то ранги исходных наблюдений и ранги их логарифмов совпадают. Это позволяет сформировать следующую статистику
где ранги рассчитываются по объединенной выборке. Данная статистика может быть использована для проверки исследуемой нулевой гипотезыо величине параметра[см. пункты 6, 7 прошлой статьи].
Напомним, что в условиях нулевой гипотезы распределение статистикиасимптотически нормально, с нулевым математическим ожиданиеми дисперсией
Это позволяет использовать стандартизованную статистику
чтобы отвергнуть гипотезуна уровне значимости, если, где– квантиль уровнястандартного нормального распределения.
Решение вопроса о том, какую score функцию использовать при расчете статистикизависит от вида функции. В распространенном случае, когдаимеет нормальное распределение, оптимальной является квадратичная нормальная score функция (squared-normal score) вида
где– cdf стандартного нормального распределения, FK – аббревиатура, соответствующая работе Fligner и Killeen (1976) [1], где данная функция была предложена.
5. Для демонстрации изложенной выше методики рассмотрим данные конкретного эксперимента (Doksum and Sievers (1976) [2]) о влиянии озона на прирост в весе у крыс. Контрольная группа крысв течениедней находилась в обычной среде, в то время как экспериментальная группа крысв течение 7 дней находилась в среде с повышенной концентрацией озона. В конце недели изменение в весе каждой крысы были взяты в качестве отклика.
Следующая программа на зыке R содержит алгоритм расчета статистикии соответствующего значения p-value для проверки двухсторонней гипотезы о различии параметров масштаба двух выборок.
> x <-
+ c(
+ 41.0, 38.4, 24.4, 25.9, 21.9,
+ 18.3, 13.1, 27.3, 28.5, -16.9,
+ 26.0, 17.4, 21.8, 15.4, 27.4,
+ 19.2, 22.4, 17.7, 26.0, 29.4,
+ 21.4, 26.6, 22.7)
> y <-
+ c(
+ 10.1, 6.1, 20.4, 7.3, 14.3,
+ 15.5, -9.9, 6.8, 28.2, 17.9,
+ -9.0, - 12.9, 14.0, 6.6, 12.1,
+ 15.7, 39.9, -15.9, 54.6, -14.7,
+ 44.1, -9.0)
>
> # Зададим squared-normal score функцию
> fkscores = new(
+ "scores",
+ phi = function(u) {
+ (qnorm((u + 1) / 2)) ^ 2 - 1
+ },
+ Dphi = function(u) {
+ qnorm((u + 1) / 2) / dnorm(qnorm((u + 1) / 2))
+ }
+ )
> # Проверим гипотезу о равенстве 0 параметра Delta
> zed = c(abs(x - median(x)), abs(y - median(y)))
> n1 = length(x)
> n2 = length(y)
> n = n1 + n2
>
> # В расчётe используется стандартизированная score функция
> rz = rank(zed)/(n + 1)
> afk = Rfit::getScores(fkscores, rz)
>
> # Расчет статистики Sfk, zfk, p-value
> Sfk = sum(afk[(n1+1):n])
>
> varfk = ((n1 * n2)/(n*(n-1))) * sum(afk^2)
> zfk = Sfk/sqrt(varfk)
> see = "two.sided"
> if (see == "two.sided") {
+ pvalue = 2 * (1 - pnorm(abs(zfk)))
+ }
> if (see == "greater") {
+ pvalue = 1 - pnorm(zfk)
+ }
> if (see == "less") {
+ pvalue = pnorm(zfk)
+ }
>
> # Вывод результатов
> res <- list(statistic = zfk, p.value = pvalue)
> with(res, cat("statistic = ", statistic, ", p-value = ", p.value, "\n"))
statistic = 2.095976 , p-value = 0.03608434
Стандартизованная статистика теста Флигнера-Киллина имеет значениеc p-value, то есть можно сказать, что наличие озона влияет на вариабельность в приросте веса у крыс.
6. Для того чтобы получить точечную оценку и доверительный интервал для параметра сформулируем нашу задачу в виде лог-модели. Пусть
– вектор-индикатор, с первымиэлементами равными нулю и последнимиэлементами равными единице. Тогда регрессионная задача [см. пункт 8 прошлой статьи] имеет вид
Применяя алгоритм построения ранговой регрессии (rfit {Rfit}
) с использованием квадратичной нормальной score функцийможно найти оценкупараметра. Откуда оценка для параметраполучается в виде.
Далее, используя найденную в ходе построения регрессии величину стандартной ошибки, можно построить, например, приблизительныйдоверительный интервал для, основанный на квантиле уровняt-распределения сстепенями свободы
где– объем выборки,. Рассчитанные границы также преобразуются в соответствующие границы доверительного интервала для:. Отметим, что найденные таким образом доверительные границы всегда положительны.
7. Следующая программа на языке R содержит алгоритм расчета точечной оценки и доверительного интервала для параметра.
> # Подготовим данные
> xs = abs(x - median(x))
> xs = xs[xs != 0]
> xstarl = log(xs)
> ys = abs(y - median(y))
> ys = ys[ys != 0]
> ystarl = log(ys)
> n1s = length(xs)
> n2s = length(ys)
> ns = n1s + n2s
>
> # Построим уравнение регрессии
> cvec = c(rep(0, n1s), rep(1, n2s))
> zed = c(xstarl, ystarl)
> fitz = rfit(zed ~ cvec, scores = fkscores)
> (sumf = summary(fitz))
Call:
rfit.default(formula = zed ~ cvec, scores = fkscores)
Coefficients:
Estimate Std. Error t.value p.value
(Intercept) 1.42288 0.38905 3.6573 0.0007044 ***
cvec 0.86586 0.42783 2.0238 0.0493802 *
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Multiple R-squared (Robust): 0.07815811
Reduction in Dispersion Test: 3.56096 p-value: 0.06608
> delta = coef(sumf)[2, 1]
>
> # Оценка отношения параметров масштаба
> (eta = exp(delta))
[1] 2.377049
>
> # Построим доверительный интервал
> conf.level = 0.95
> se = coef(sumf)[2, 2]
> tc = abs(qt(((1 - conf.level)/2), ns - 2))
> lb = delta - tc * se
> ub = delta + tc * se
> conf.int = c(exp(lb), exp(ub))
> cat(100 * conf.level, " percent confidence interval:\n", conf.int)
95 percent confidence interval:
1.002462 5.636488
Таким образом, ранговая оценка параметраравнаcдоверительным интервалом. Это также подтверждает вывод о том, что нулевую гипотезу о равенстве параметров масштаба следует отвергнуть.
8. В заключение отметим, что рассматриваемая в статье ранговая процедура на основе предложенной Флигнером и Киллингом квадратичной нормальной score функции позволяет успешно проверять гипотезы о различии параметров масштаба, в двух важных случаях:
когда плотность распределение функции ошибкисимметрична, то есть процедура обобщает чувствительный к отклонениям от нормальности F-критерий;
когда распределение генеральной совокупности относится к классу засорённых нормальных распределений (skewed contaminated normal distributions). В этом случае случайная величина получается по закону, гдеиимеюти распределения соответственно,– имеет распределение Бернулли с вероятностью успехаи,инезависимы в совокупности.
Ссылки на литературу:
Fligner, M. A. and Killeen, T. J. (1976), Distribution-free two-sample test for scale, Journal of the American Statistical Association, 71, 210-213.
Doksum, K. A. and Sievers, G. L. (1976), Plotting with confidence: Graphical comparisons of two populations, Biometrika, 63, 421-434.