Задача

Проанализировать результаты бенчмарка СУБД с использованием скользящей дисперсии.

Реализация

Описание методики сбора данных по бенчмарку СУБД

Статистический анализ результатов benchmark PostgreSQL / Хабр

Тестовая виртуальная машина расположена в облачном хранилище.

Расчет скользящей дисперсии

По каждой точке t вычисляется дисперсия по выборке для входных значений (квадрат отклонения по выборке) за период [ t; t-60 минут].

Использование дисперсии при анализе производительности СУБД. Точка излома графика дисперсии / Хабр

Статистические результаты

Рис.1. Статистически показатели производительности СУБД - результат бенчмарка
Рис.1. Статистически показатели производительности СУБД - результат бенчмарка
Рис.2 Таблица частотной диаграммы производительности СУБД - результат бенчмарка
Рис.2 Таблица частотной диаграммы производительности СУБД - результат бенчмарка
Рис.3. График частотной диаграммы производительности СУБД
Рис.3. График частотной диаграммы производительности СУБД
Рис.4. График изменения производительности СУБД за весь период теста. Желтые точки - результат бенчмарка
Рис.4. График изменения производительности СУБД за весь период теста. Желтые точки - результат бенчмарка
Рис.5. График скользящей дисперсии за период теста
Рис.5. График скользящей дисперсии за период теста
Рис.6 Дифференцирование значений скользящей средней с периодом 1ms
Рис.6 Дифференцирование значений скользящей средней с периодом 1ms

Статистические показатели результативного периода

Рис.7. Производительность СУБД за результативный период
Рис.7. Производительность СУБД за результативный период
Рис.8. Скользящая дисперсия за результативный период
Рис.8. Скользящая дисперсия за результативный период
Рис.9 Дифференцирование значений скользящей дисперсии с периодом 1ms
Рис.9 Дифференцирование значений скользящей дисперсии с периодом 1ms

Сравнительные результаты статистических значений разных периодов работы виртуальной машины

Рис.10. Таблица граничных показателей за период рабочего времени
Рис.10. Таблица граничных показателей за период рабочего времени
Рис.11. Таблица граничных показателей за период нерабочего времени
Рис.11. Таблица граничных показателей за период нерабочего времени

Никаких неожиданностей: во внерабочее время - посторонняя нагрузка на СУБД расположенной в облаке - значительно ниже.

Сравнение графиков статистических показателей производительности СУБД в рабочее и нерабочее время

Рис.12. График производительности СУБД в рабочее время
Рис.12. График производительности СУБД в рабочее время
Рис.13. График производительности СУБД во внерабочее время
Рис.13. График производительности СУБД во внерабочее время
Рис.14. График скользящей дисперсии производительности СУБД в рабочее время
Рис.14. График скользящей дисперсии производительности СУБД в рабочее время
Рис.15. График скользящей дисперсии производительности СУБД во внерабочее время
Рис.15. График скользящей дисперсии производительности СУБД во внерабочее время
Рис.16. Значение результата дифференцирования скользящей дисперсии производительности СУБД в рабочее время
Рис.16. Значение результата дифференцирования скользящей дисперсии производительности СУБД в рабочее время
Рис.17. Значение результата дифференцирования скользящей дисперсии производительности СУБД во внерабочее время.
Рис.17. Значение результата дифференцирования скользящей дисперсии производительности СУБД во внерабочее время.

Итоги и выводы

  1. Использование скользящей дисперсии позволяет оценить неоднородность показателей производительности СУБД и исключить из рассмотрения данные в которых влияние внешних факторов сильно влияет на результат

  2. Скользящую дисперсию можно использовать для оценки изменения нагрузки на СУБД при продуктивной нагрузке. Результаты будут интересные и наверное позволят сделать вывод о переходе продуктивной СУБД в нештатный режим работы.

Комментарии (0)