Предпосылка к исследованию
Исследование гипотезы СУБД по природе своей является стохастической, а не детерминированной системой.
С целью проверки утверждения и в связи с началом работ по подготовке методики статистического анализа СУБД в условиях облачной среды, была начата серия экспериментов для определения влияния внешних/случайных факторов инфраструктуры на производительность СУБД .
Инструмент и сценарий тестирования
Для тестирования используется стандартный инструментарий - утилита pgbench
Параметры pgbench
pgbench_init_param= --no-vacuum --quiet --foreign-keys --scale=100 -i test_pgbench
pgbench_param= --progress=60 --protocol=extended --report-per-command --jobs=1 --client=100 --time=14400 test_pgbench
Сценарий: начальная серия эксперимента состоит из 4-х замеров статистических показателей производительности СУБД в течении 1 часа.
Производительность СУБД: рассчитывается по методике описанной в статье Корреляционный анализ для решения инцидентов производительности СУБД / Хабр (habr.com)
Для снижения влияния выбросов показателей производительности, используется медианное сглаживание с периодом 10 минут.
1-й час
Статистические показатели производительности СУБД
Распределение вероятности
Корреляция между ожиданиями и производительностью СУБД
Для простоты показаны только события с коэффициентом корреляции > 0.5 и процентом наблюдений > 50%
2-й час
Статистические показатели производительности СУБД
Распределение вероятности
Корреляция между ожиданиями и производительностью СУБД
Для простоты показаны только события с коэффициентом корреляции > 0.5 и процентом наблюдений > 50%
3-й час
Статистические показатели производительности СУБД
Распределение вероятности
Корреляция между ожиданиями и производительностью СУБД
Для простоты показаны только события с коэффициентом корреляции > 0.5 и процентом наблюдений > 50%
Ожидание немедленной синхронизации файла данных отношения с надёжным хранилищем.
Судя по всему , данное событие, оказывающее существенное влияние на производительность СУБД ,вызвано изменением состояния инфраструктуры .
4-й час
Статистические показатели производительности СУБД
Распределение вероятности
Корреляция между ожиданиями и производительностью СУБД
Для простоты показаны только события с коэффициентом корреляции > 0.5 и процентом наблюдений > 50%
Итоги по 1-й части тестирования
Дисперсия производительности СУБД - меняется в довольно широком диапазоне.
Период сглаживания = 10 минут , слишком мал, для устранения влияния выбросов.
Использование результатов нагрузочного тестирования для анализа влияния изменений в конфигурационных параметрах СУБД и проведение нагрузочного тестирования, при проведении одиночного теста - не могут являться достоверными , по причине непредсказуемого влияния инфраструктуры на производительность СУБД .
Для проведения нагрузочного тестирования и анализа влияния изменений конфигурационных параметров СУБД на производительность СУБД в условиях облачной инфраструктуры - требуется серия испытаний и дальнейший статистический анализ результатов.
geotech
Если ваша СУБД написана для стохастической операционной системы, она по дизайну является стохастической, когда такая операционная система размещена в стохастическом окружении (облако) - это не добавляет детерминированности. Мне казалось, что всё, что не real-time является стохастическим, да и в rt детерминированность указывается диапазонами.