В качестве ответа на комментарий https://habr.com/ru/posts/848370/#comment_27385020

В рамках комментария картинки будут совсем не видны. А при создании поста- только одно изображение .

Собственно тема скользящей средней и медианы описана давно и не является чем-то новым и данная статья - не исключение. Скорее заметка на память .

Скользящая медиана дает вам более плавный и стабильный график, который можно использовать при анализе ситуации и отправления автоматических алертов
Скользящая медиана дает вам более плавный и стабильный график, который можно использовать при анализе ситуации и отправления автоматических алертов

Рисунок и подпись взяты здесь: Описательная статистика перформанс-распределений / Хабр (habr.com)

В качестве дополнительной иллюстрации - пример из жизни

Длительность сбора данных: 10 часов.

Периодичность сбора данных: 1 минута.

Период сглаживания: 1 час.

Эксперимент 1 - Исходные данные.
Эксперимент 1 - Исходные данные.
Эксперимент 2 - Исходные данные.
Эксперимент 2 - Исходные данные.

Скользящая средняя

Значение в момент t = среднее арифметическое отрезка [Y(t) ; Y(t - период) ].

Эксперимент 1 - Скользящая средняя
Эксперимент 1 - Скользящая средняя
Эксперимент 2 - Скользящая средняя
Эксперимент 2 - Скользящая средняя

Скользящая медиана

Значение в момент t = медиана отрезка [Y(t) ; Y(t - период) ].

Эксперимент 1 - Скользящая медиана
Эксперимент 1 - Скользящая медиана
Эксперимент 2 - Скользящая медиана
Эксперимент 2 - Скользящая медиана

Кстати , о выбросах

Исходные данные / Скользящая медиана / Скользящая средняя
Исходные данные / Скользящая медиана / Скользящая средняя

Добавлено

Принципиальное отличие в сглаживании скользящей средней и скользящей медианой хорошо заметно на данных реальной нагрузки на СУБД

Реальные данные и сглаживание средней и медианой
Реальные данные и сглаживание средней и медианой

Как было указано выше:

Скользящая медиана дает вам более плавный и стабильный график, который можно использовать при анализе ситуации и отправления автоматических алертов

Вопрос

Какой метод сглаживания сырых данных будет эффективнее для исключения выбросов и при сборе показателей для дальнейшего анализа ?

Комментарии (14)