Продолжение Применение статистического анализа для определения причин деградации производительности СУБД
Часть 2 — ложное оповещение о деградации производительности
На первый взгляд имеется, что-то похожее на классическую аномалию:
-
Сдвиг
Задача обнаружения сдвига в данных неплохо исследована, поскольку встречается в обработке сигналов.
Источник: Обнаружение аномалий в данных сетевого мониторинга методами статистики / Хабр (habr.com)
Порядок анализа
1. Статистические показатели производительности СУБД
14:05 - 14:41 — Высокая производительность
Важная деталь: распределение производительности и нагрузки на СУБД — симметричное. Нагрузка — постоянная.
14:41 - 15:11 — Изменение производительности
Важная деталь: Нагрузка — постоянная.
15:11 - 15:45 — Низкая производительность
Важная деталь: распределение производительности и нагрузки на СУБД — симметричное. Нагрузка — постоянная.
Выводы
Нагрузка на СУБД в период низкой производительности СУБД (15:11–15:45) — не изменилась
В период изменения производительности СУБД (14L41–15:11) — обратная корреляция между количество активных сессий и производительностью СУБД — отсутствует. Или другими словами — снижение нагрузки на СУБД коррелируется со снижением производительности СУБД.
Распределение производительности СУБД в период высокой нагрузки (14:05–14:41) и низкой нагрузки (15:11–15:45) — симметричное.
2. Анализ ожиданий и производительности СУБД
14:05 - 14:41 — Высокая производительность
14:41 - 15:11 — Изменение производительности
15:11 - 15:45 — Низкая производительность
Выводы
Корреляция и состав ожиданий в период высокой(14:05–14:41) и низкой(15:11–15:41) — производительности — полностью не совпадает
Общий вес по событиям ожидания в период низкой(15:11–15:41) производительности существенно ниже, чем в период высокой (14:05–14:41).
Вывод и общие итоги
Снижение производительности СУБД в период 15:11 — 15:45 вызвано изменением характера запросов к СУБД и не является инцидентом по деградации производительности СУБД .
Использование статистического анализа позволило резко снизить время на поиск возможным причин инцидента производительности.
Симметричное распределение производительности СУБД можно с некоторой долей уверенности считать признаком штатной работы СУБД.