Этюд — логическая репликация для копирования баз данных PostgreSQL / forpes.ru

Главная
Этюд — логическая репликация для копирования баз данных PostgreSQL

Этюд — логическая репликация для копирования баз данных PostgreSQL +3

14.05.2021 13:08

rinace 17 2500 Источник

Постановка задачи

От бизнеса поступила задача — необходимо регулярно сохранять копии отдельных баз данных, расположенных в разных кластерах PostgreSQL.

Упрощенно говоря — бекапить отдельные базы данных, на случай сверки или потери данных в исходных базах.

Первое и самое очевидное решение — pg_dump

Достоинства — простота решения. Штатные методы. Все отработано, документации и материалов великое множество.

Но, достоинства есть продолжения недостатков.
Во-первых: объемы дампов.
Во-вторых: и это самое неприятное, были случаи несовпадения исходной и целевой БД при восстановлении из дампа.

Возможно этот случай заслужит отдельной заметки. Как оказалось, не все так однозначно, с pg_dump

В-третьих: время, сначала на создание дампа, потом на восстановление БД из дампа.

В итоге — нужно искать другой путь копирования БД между серверами. Бизнес требовал, задача интересная.

Не факт, что решение получилось максимально эффективным и не будет изменено/улучшено. Но как этюд на тему использования возможностей PostgreSQL, идея показалась как минимум интересной.

В результате анализа и выбора вариантов замены pg_dump, для копирования БД между серверами, возникла идея — использовать механизм логической репликации PostgreSQL.

Термины и исходные данные

Исходный кластер -кластер PostgreSQL содержащий БД которую нужно скопировать.
Исходная БД — объект копирования, БД на исходном кластере
Клон БД — копия исходной БД на исходном кластере
Кластер хранения копий БД — отдельный кластер PostgreSQL.
Копия БД-целевая копия БД на кластере хранения копий БД

Решение было реализовано в виде bash-скрипта, запускаемого на кластера хранения копий БД. Входными параметрами скрипты являются: имя исходного кластера, имя исходной БД.
Результат работы скрипта: копия БД в кластере хранения копий БД. Упрощенно, процесс можно представить последовательностью следующих шагов.

Шаг 1

Создается клон БД

CREATE DATABASE ... TEMPLATE = Исходная БД

фрагмент скрипта

CLONE_DB=$source_db_name'_'$timestamp_label
psql -h $source_host_name -U postgres -Aqt -c "UPDATE pg_database SET datallowconn = FALSE WHERE datname = '$source_db_name'" >>$LOG_FILE 2>&1
psql -h $source_host_name -U postgres -Aqt -c "SELECT pg_terminate_backend(pid) FROM pg_stat_activity WHERE datname='$source_db_name'" >>$LOG_FILE 2>&1
psql -h $source_host_name -U postgres -Aqt -c "CREATE DATABASE $CLONE_DB TEMPLATE=$source_db_name " >>$LOG_FILE 2>&1
psql -h $source_host_name -U postgres -Aqt -c "UPDATE pg_database SET datallowconn = TRUE WHERE datname = '$source_db_name'" >>$LOG_FILE 2>&1

Шаг 2

Загружается схема клона БД

pg_dump --shema_only --file=$DUMP_FILE ...

фрагмент скрипта

pg_dump -h $source_host_name -U postgres --schema-only --verbose --file=$DUMP_FILE $source_db_name 2>$SCHEMA_DUMP_LOG_FILE

Шаг 3

Создается пустая БД копия БД

createdb ...

фрагмент скрипта

createdb $CLONE_DB

Шаг 4

Создается схема клона БД в копии БД

psql ... < $DUMP_FILE

фрагмент скрипта

TARGET_SCHEMA_DUMP_LOG_FILE=$FILE_LABEL'target.log'
psql -U postgres -d $CLONE_DB  < $DUMP_FILE > $TARGET_SCHEMA_DUMP_LOG_FILE 2>&1

Шаг 5

Создание логической репликации.

Создание публикации в клоне БД

CREATE PUBLICATION ... FOR ALL TABLES

фрагмент скрипта

PUBLICATION_NAME=$CLONE_DB'_pub'
psql -h $source_host_name -U postgres -d $CLONE_DB  -c "CREATE PUBLICATION $PUBLICATION_NAME FOR ALL TABLES " >>$LOG_FILE 2>&1

Создание подписки в копии БД

CREATE SUBSCRIPTION ...

фрагмент скрипта

SUBSCRIPTION_NAME=$CLONE_DB'_sub'
CONNECTION_STR="CREATE SUBSCRIPTION $SUBSCRIPTION_NAME CONNECTION 'host=$source_host_name port=5432 user=postgres dbname=$CLONE_DB' PUBLICATION $PUBLICATION_NAME"
psql -U postgres -d $CLONE_DB  -c "$CONNECTION_STR" >>$LOG_FILE 2>&1

Шаг 6

Синхронизация клона БД и копии БД

SELECT count(*) FROM pg_stat_subscription WHERE subname =... AND relid IS NOT NULL

БД считаются синхронизированными, если нет процесса синхронизации между таблицами. Клон БД для работы приложения не используется, что гарантирует идентичность баз.

фрагмент скрипта

flag=0
while [[ $flag = '0' ]];
do
    COUNT_STR="SELECT count(*) FROM pg_stat_subscription WHERE subname ='$SUBSCRIPTION_NAME' AND relid IS NOT NULL "
    subscription_process_count=`psql -At -U postgres -d $CLONE_DB -c "$COUNT_STR"`
    if [[ $subscription_process_count = '0' ]];
    then
        break
    fi
    sleep 60
done

UPDATE.

Как показала практика для мониторинга процесса синхронизации лучше использовать запрос к каталогу pg_subscription_rel
SELECT count(*) FROM pg_subscription_rel ; 
SELECT count(*) FROM pg_subscription_rel WHERE srsubstate ='r' ;
Первый запрос выдает общее количество таблиц в подписке которые будут синхронизированы. Второй запрос выдает количество синхронизированных таблиц.

Шаг 7

Удалить логическую репликацию

DROP SUBSCRIPTION...

фрагмент скрипта

psql -d $CLONE_DB -Aqt -c "DROP SUBSCRIPTION $SUBSCRIPTION_NAME" >> $LOG_FILE 2>&1

DROP PUBLICATION ...

фрагмент скрипта

psql -h $source_host_name  -d $CLONE_DB -Aqt -c "DROP PUBLICATION $PUBLICATION_NAME" >> $LOG_FILE 2>&1

Шаг 8

Удалить клон БД

DROP DATABASE ...

фрагмент скрипта

psql -h $source_host_name -U postgres -Aqt -c "UPDATE pg_database SET datallowconn = FALSE WHERE datname = '$CLONE_DB'" >>$LOG_FILE 2>&1
psql -h $source_host_name -U postgres -Aqt -c "SELECT pg_terminate_backend(pid) FROM pg_stat_activity WHERE datname='$CLONE_DB'" >>$LOG_FILE 2>&1
psql -h $source_host_name -U postgres -Aqt -c "DROP DATABASE $CLONE_DB " >>$LOG_FILE 2>&1
psql -h $source_host_name -U postgres -Aqt -c "UPDATE pg_database SET datallowconn = TRUE WHERE datname = '$CLONE_DB'" >>$LOG_FILE 2>&1

Результат

Проведено копирование БД между серверами с минимальными издержками на передачу и хранение данных.

За рамками данного этюда — задача удаления старых БД на сервере хранения копий по заданному параметру глубины хранения и логирование процесса.

Комментарии (17)

galaxy
14.05.2021 17:45
#23034932
+1
Во вторых-и это самое неприятное, были случаи несовпадения исходной и целевой БД при восстановлении из дампа.

Какие еще несовпадения? Вы ожидали совпадения на какой момент?
В начале дампа pg_dump начинает serializable транзакцию, все, что произошло в исходной БД после, в дамп не попадает.
Думаете, копия через create database как-то по-другому работает?

В третьих-время, сначала на создание дампа, потом на восстановление БД из дампа.

Неужели репликация быстрее? Хмм…

В итоге единственное преимущество — экономия на месте для дампов (временных).

rinace Автор
14.05.2021 18:36
#23035132
Какие еще несовпадения?

Несовпадение количество строк в некоторых таблицах в исходной и целевой БД, после выполнения pg_restore (Исходная БД не использовалась в процессе копирования, если, что ).
Ситуация иногда случалась при использовании формата directory. В случае использования формата plain — ситуация исключалась. Но plain огромный размер дампа.
Это кажется странным и я бы сам не поверил, если бы не видел собственными глазами.
Причем на некоторых БД все нормально, но некоторых проблема.

В итоге единственное преимущество — экономия на месте для дампов (временных).

Плюс простота организации и управления хранением.
БД все таки управляются проще чем гигабайтные файлы.
1. galaxy
  14.05.2021 21:41
  #23035638
  +1
  Несовпадение количество строк в некоторых таблицах в исходной и целевой БД, после выполнения pg_restore (Исходная БД не использовалась в процессе копирования, если, что ).
  не верю (с)
  Имхо, лучше бы вы поисследовали эту проблему и про нее написали статью. Было бы гораздо полезнее разобраться, если что-то такое действительно может иметь место.
  
  Но plain огромный размер дампа.
  Включите сжатие (custom/directory сжаты по умолчанию, отсюда вся разница).
  
  К слову об экономии места: копия БД весит заведомо больше, чем любой дамп. Так что сомнительная у вас экономия даже на этом.
  
  Плюс простота организации и управления хранением
  
  Не знаю…
  Если свежесть данных некритична (или БД можно отключить от пользователей), что-то проще dump/restore придумать сложно.
  
  Если важна полнота данных (как, например, при онлайн миграции на новую версию), то дамп схемы + логическая репликация с живой БД — канонический способ, описанный примерно везде.
  1. rinace Автор
    14.05.2021 21:47
    #23035664
    не верю (с)
    Имхо, лучше бы вы поисследовали эту проблему и про нее написали статью.
    
    Я и сам не поверил. Пока не сделал select count(*) на таблицах исходной и целевой БЛ после pg_dump->pg_restore. Факт есть факт. Проблема повторялось. И проблему надо было решать. Был использован план Б — не использовать сжатие и использовать формат plain.
    Возможно будет статья. Может быть приведу и цитаты переписки со службой техподдержки по проблеме. Пока не решил, стоит ли тратить время на глубокий разбор, поскольку сейчас проблема уже потеряла свою актуальность.
    
    копия БД весит заведомо больше, чем любой дамп
    
    БД размером 3GB, дамп в формате plain весит порядка 14-17GB.
    
    galaxy
    14.05.2021 23:38
    #23035922
    БД размером 3GB, дамп в формате plain весит порядка 14-17GB.
    
    Эм… Что это такие у вас за данные?
    Куча огромных текстовых полей, что ли? Разве что в этом случае внутреннее сжатие даст такую разницу (и то сомневаюсь).
    
    rinace Автор
    15.05.2021 06:36
    #23036394
    Базы данных 1С

bankinobi
14.05.2021 19:36
#23035288
Странное решение с клонированием. Если база размером несколько сот гб, то напрягать сервер копированием не совсем правильно.
Если придерживаться такого решения задачи, то я бы сделал через снапшоты zfs:
1. Реплику на zfs
2. beginBackup
3. zfs create snapshot
4. zfs send | zfs recv
5. endBackup
6. recover clone (wal or replicatoin)

lokks
15.05.2021 10:59
#23036714
А клиенты нормально переносят UPDATE pg_database SET datallowconn = FALSE и pg_terminate_backend(pid)?
Как-то не продакшн-рэйди выглядит, а скорее ночной скрипт когда все точно с рабочих мест ушли.
1. rinace Автор
  15.05.2021 11:33
  #23036816
  Именно,ночной скрипт. На сервере хранения копий, каждую ночь обновляется набор баз с разных серверов.
  В рабочее время - по согласованному запросу и с остановкой приложения.
  Есть мысль попробовать запустить логическую репликацию и всегда иметь копию БД. Но в силу ограничений логической репликации ,есть подозрения что БД будут не идентичны.
  Пока тема в разработке. Бывали случаи когда синхронизация не завершалась. Может быть для данного приложения (1С) и не получится.

cccco
16.05.2021 12:26
#23039632
А не проще настроить потоковую репликацию с исходного кластера на кластер хранения и делать копию уже на кластере хранения?
1. rinace Автор
  16.05.2021 13:49
  #23039810
  Потоковую репликацию не получится настроить - исходных кластеров несколько.
  1. cccco
    16.05.2021 20:33
    #23040588
    Потоковая репликация может быть и логической.
    
    rinace Автор
    16.05.2021 22:28
    #23040800
    Спасибо за идею.
    Надо будет проверить такой сценарий - запуск логической репликации между исходной БД и копией бд , синхронизация , закрытие репликации.
    Однако в этом сценарии есть одна проблема - процесс синхронизации гораздо дольше, чем процесс создания клона БД. А на этапе синхронизации желательно, чтобы исходная БД не изменялась.
    
    cccco
    17.05.2021 21:48
    #23045452
    Вы меня не поняли.
    
    У Вас есть две роли серверов БД: исходный сервер БД и сервер хранения БД. Каждая роль может включать в себя несколько серверов БД. Зависит от Ваших потребностей. Но не суть.
    
    Вы настраиваете потоковую логическую репликацию базы с исходного сервера БД на сервер хранения БД. Т.е. изменения в этой базе на исходном сервере БД в реальном времени накатываются на реплику этой базы на сервере хранения БД.
    
    Таким образом, в любой момент времени на сервере хранения БД у Вас уже есть экземпляр этой базы в актуальном состоянии. Поэтому в любой момент времени Вы можете сделать копию данной базы уже на самом сервере хранения БД, не трогая при этом исходный сервер БД.
    
    Если необходимо, чтобы база на момент создания копии не изменялась, Вы всегда можете просто поставить репликацию на паузу, сделать копию, а потом обратно включить репликацию. Тут надо помнить, что во время паузы начнут накапливаться валы (wal).
    
    rinace Автор
    18.05.2021 10:02
    #23046882
    На самом деле именно такой сценарий:
    
    Вы настраиваете потоковую логическую репликацию базы с исходного сервера БД на сервер хранения БД. Т.е. изменения в этой базе на исходном сервере БД в реальном времени накатываются на реплику этой базы на сервере хранения БД.
    
    и планировался с самого начала.
    Но, выяснился неприятный момент — копия БД иногда не открывается приложением 1С(копируются БД для 1С). Возникают разнообразные ошибки со стороны 1С.
    Поэтому и был выбран другой вариант, для надежности.
    Вообще 1С и PostgreSQL это отдельная тема для исследования.
    
    cccco
    18.05.2021 12:58
    #23047920
    Две схемы работы:
    
    1) Исходный сервер БД —> копия базы на исходном сервере БД —> логическая репликация копии базы на сервер хранения БД.
    2) Исходный сервер БД —> логическая репликация базы на сервер хранения БД —> копия базы на сервере хранения БД.
    
    В обоих схемах используется как копирование базы, так и логическая репликация.
    
    Используя первую схему, Вы излишне нагружаете исходный (как я понял — продуктовый) сервер БД:
    — постоянным копированием базы;
    — каждый раз новой (т.е. с нуля) логической репликацией.
    
    Я бы тут попытался разобраться, почему одни и те же операции дают, как Вы утверждаете, разный результат.

Dmitry2019
18.05.2021 09:57
#23046846
У логической репликации есть неприятные моменты, где она не может реплицировать изменения в схеме и блобы

Этюд — логическая репликация для копирования баз данных PostgreSQL +3

Постановка задачи

Термины и исходные данные

Шаг 1

Шаг 2

Шаг 3

Шаг 4

Шаг 5

Шаг 6

Шаг 7

Шаг 8

Результат

Комментарии (17)

rinace Автор

rinace Автор

rinace Автор

rinace Автор

rinace Автор

rinace Автор

rinace Автор