Продолжение Применение статистического анализа для определения причин деградации производительности СУБД

Часть 2 — ложное оповещение о деградации производительности

Нужно ли открывать инцидент о деградации производительности СУБД ?
Нужно ли открывать инцидент о деградации производительности СУБД ?

На первый взгляд имеется, что-то похожее на классическую аномалию:

  • Сдвиг

    Сдвиг в данных временного ряда
    Сдвиг в данных временного ряда

    Задача обнаружения сдвига в данных неплохо исследована, поскольку встречается в обработке сигналов.

Источник: Обнаружение аномалий в данных сетевого мониторинга методами статистики / Хабр (habr.com)

Порядок анализа

1. Статистические показатели производительности СУБД

14:05 - 14:41 — Высокая производительность

Статистика 14:05-14:11
Статистика 14:05-14:11

Важная деталь: распределение производительности и нагрузки на СУБД — симметричное. Нагрузка — постоянная.

14:41 - 15:11 — Изменение производительности

Статистика 14:41-15:11
Статистика 14:41-15:11

Важная деталь: Нагрузка — постоянная.

15:11 - 15:45 — Низкая производительность

Важная деталь: распределение производительности и нагрузки на СУБД — симметричное. Нагрузка — постоянная.

Выводы

  1. Нагрузка на СУБД в период низкой производительности СУБД (15:11–15:45) — не изменилась

  2. В период изменения производительности СУБД (14L41–15:11) — обратная корреляция между количество активных сессий и производительностью СУБД — отсутствует. Или другими словами — снижение нагрузки на СУБД коррелируется со снижением производительности СУБД.

  3. Распределение производительности СУБД в период высокой нагрузки (14:05–14:41) и низкой нагрузки (15:11–15:45) — симметричное.

Распределение производительности СУБД в период 14:05-14:41
Распределение производительности СУБД в период 14:05-14:41
Частотная диаграмма распределения производительности СУБД в период 14:05-14:41
Частотная диаграмма распределения производительности СУБД в период 14:05-14:41
Распределение производительности СУБД в период 15:11-15:45
Распределение производительности СУБД в период 15:11-15:45
Частотная диаграмма распределения производительности СУБД в период 15:11-15:45
Частотная диаграмма распределения производительности СУБД в период 15:11-15:45

2. Анализ ожиданий и производительности СУБД

14:05 - 14:41 — Высокая производительность

Ожидания и корреляция по SQL запросам в период 14:05 - 14:41
Ожидания и корреляция по SQL запросам в период 14:05 - 14:41

14:41 - 15:11 — Изменение производительности

Ожидания и корреляция по SQL запросам в период 14:41-15:11
Ожидания и корреляция по SQL запросам в период 14:41-15:11

15:11 - 15:45 — Низкая производительность

Ожидания и корреляция по SQL запросам в период 15:11-15:45
Ожидания и корреляция по SQL запросам в период 15:11-15:45

Выводы

  1. Корреляция и состав ожиданий в период высокой(14:05–14:41) и низкой(15:11–15:41) — производительности — полностью не совпадает

  2. Общий вес по событиям ожидания в период низкой(15:11–15:41) производительности существенно ниже, чем в период высокой (14:05–14:41).

Вывод и общие итоги

Снижение производительности СУБД в период 15:11 — 15:45 вызвано изменением характера запросов к СУБД и не является инцидентом по деградации производительности СУБД .

Использование статистического анализа позволило резко снизить время на поиск возможным причин инцидента производительности.

Симметричное распределение производительности СУБД можно с некоторой долей уверенности считать признаком штатной работы СУБД.

Комментарии (0)