Очереди сообщений в Postgres Pro: отказ от внешних брокеров ради транзакционной надёжности / forpes.ru

Главная
Очереди сообщений в Postgres Pro: отказ от внешних брокеров ради транзакционной надёжности

Очереди сообщений в Postgres Pro: отказ от внешних брокеров ради транзакционной надёжности +17

12.11.2025 15:32

slonik_pg 16 5400 Источник

В эпоху распределённых систем, где каждая компонента должна быть не только эффективной, но и предсказуемой, вопрос надёжности обмена данными становится критическим. Представьте: пользователь нажимает кнопку «Сгенерировать отчёт», и в этот момент должны синхронизироваться десятки процессов — от создания документа до его отправки по email. Но что если почтовый сервер временно недоступен? Или обработчик задач падает, не завершив операцию? Именно здесь на сцену выходят очередь сообщений — механизм, который превращает хаотичные запросы в управляемый поток, гарантируя, что ни одна задача не потеряется в пути.

История создания расширения встроенных очередей в PostgreSQL началась с простой боли: внешние брокеры вроде RabbitMQ или Kafka, хотя и мощные, добавляли слои сложности. Управление ими требует выделенных ресурсов: отдельные серверы, настройка кластеров, мониторинг доступности. В enterprise-среде, где системы развертываются тысячами экземпляров, каждый новый компонент увеличивает риски и административную нагрузку.

Зачем подключать отдельный брокер, если очередь уже встроена в базу данных и работает «из коробки»? Это не только экономит время, но и исключает проблемы согласованности: если транзакция откатывается, сообщение автоматически возвращается в очередь для повторной попытки, без единой строчки дополнительного кода.

Два подхода к очередям: Log-based и AMQP/JMS

В мире распределенных систем сформировались два подхода к обработке сообщений:

Log-based-очереди (например, Kafka). Работают как непрерывный журнал событий. Данные записываются строго последовательно, и потребители читают их в том же порядке. Это идеально для синхронизации данных между микросервисами или репликации баз данных. Однако их сила — в линейности — становится слабостью, когда нужна гибкость: выборка сообщений по приоритету или фильтрам здесь невозможна.
AMQP/JMS-брокеры (например, RabbitMQ). Позволяют не просто передавать сообщения, но и управлять их жизненным циклом: устанавливать приоритеты, фильтровать по условиям, обрабатывать ошибки. Такие очереди позволяют имитировать асинхронное RPC, где задача может быть повторена при сбоях. Но их главная слабость — фундаментальная проблема, общая для любого внешнего брокера, включая Kafka: невозможно гарантировать транзакционную целостность с базой данных.

Проблемы внешних брокеров: транзакционность и сложность

Использование внешних брокеров, таких как Kafka или RabbitMQ, в enterprise-средах часто сопряжено со скрытыми сложностями:

Рассогласование данных. Представьте сценарий: приложение отправляет сообщение в RabbitMQ и начинает транзакцию в базе данных. Сообщение уже ушло в брокер, но в момент коммита транзакции в БД происходит сбой. Результат — рассогласование: задача будет обработана, но данные для неё не сохранены. Попытки гарантировать атомарность через двухфазный коммит (2PC) усложняют архитектуру, требуя дополнительного координатора транзакций, а также заметно снижают производительность.
Административная нагрузка. Внешние брокеры требуют отдельной инсталляции, настройки, мониторинга и резервного копирования. Это создаёт дополнительные точки отказа (например, сетевые сбои между сервером приложений и брокером) и усложняет поддержку, особенно если за СУБД и брокер отвечают разные команды.

Postgres Pro Enterprise Queues: транзакционность и автоматизация с pgpro_queue

Новое расширение pgpro_queue — это ответ на «боль» разработчиков, уставших бороться с рассогласованием данных. Интеграция очередей непосредственно в СУБД устраняет необходимость во внешних компонентах. Сообщения хранятся в обычных таблицах, реплицируются через стандартные механизмы PostgreSQL и участвуют в тех же транзакциях, что и бизнес-логика приложения.

Установка и настройка

Интеграция pgpro_queue начинается с простых шагов, знакомых любому DBA:

Добавление в shared_preload_libraries. В файле postgresql.conf необходимо добавить расширение в список предварительно загружаемых библиотек:
```
shared_preload_libraries = 'pgpro_queue'
```
Создание расширения. В нужной базе данных выполняется команда:
```
CREATE EXTENSION pgpro_queue;
```
Инициализация. Для хранения служебных объектов (таблиц метаданных, очередей) создаётся отдельная схема pgpro_queue_data. Это делается с помощью функции:
```
SELECT queue_initialize();
```
Такое разделение обеспечивает корректную работу pg_dump и репликации.

Ключевые возможности и их реализация

1. Retry-on-rollback (автоматический повтор при откате).
Это главная особенность pgpro_queue. Если транзакция, в которой было прочитано сообщение, откатывается (например, из-за недоступности внешнего сервиса), сообщение не теряется, а автоматически возвращается в очередь для повторной обработки.

Управление. Поведение повторов настраивается как на уровне очереди, так и для каждого сообщения. При создании очереди с помощью CREATE_QUEUE можно задать параметры q_retries (максимальное количество попыток) и q_retrydelay (задержка в секундах перед следующей попыткой).
Важный параметр. Для работы механизма повторов необходимо явно указать базу данных в конфигурационном файле postgresql.conf:
```
pgpro_queue.database_with_managed_retry = 'имя_вашей_бд'
```
Без этой настройки сообщения при откате транзакции будут удаляться, а не ставиться на повтор.

2. Фильтрация и приоритеты.
pgpro_queue позволяет гибко управлять потоком сообщений:

Приоритеты. При вставке сообщения с помощью INSERT_MESSAGE можно указать q_msg_priority. Чем ниже значение, тем выше приоритет. Сообщения с более высоким приоритетом обрабатываются в первую очередь.
Фильтрация. Функции чтения READ_MESSAGE и READ_MESSAGE_XML принимают параметры q_msg_hfilter и q_msg_pfilter, позволяя извлекать сообщения по содержимому их заголовков или свойств.

3. Поддержка форматов JSON и XML.
Расширение предоставляет отдельные функции для работы с разными форматами данных, что упрощает интеграцию с различными системами:

INSERT_MESSAGE и READ_MESSAGE для JSONB;
INSERT_MESSAGE_XML и READ_MESSAGE_XML для XML;
READ_MESSAGE_ANY для чтения сообщений любого формата из одной очереди.

4. Отложенная обработка.
При вставке сообщения можно указать параметр q_msg_enable_time, чтобы задача стала доступна для обработки только при наступлении указанного времени.

Что мы положили под капот?

В основе расширения pgpro_queue лежит простой и надёжный принцип: сообщения хранятся в обычных таблицах PostgreSQL. Такой подход позволяет использовать всю мощь стандартных механизмов СУБД, включая репликацию и восстановление через WAL-файлы. Каждое сообщение, попавшее в очередь, записывается в WAL, что гарантирует его восстановление даже после аварийного отключения сервера. Ключевая особенность pgpro_queue — это глубокая интеграция с транзакционной моделью PostgreSQL, реализующая механизм retry-on-rollback. Он работает как страховка: если транзакция, обработавшая сообщение, откатывается из-за любой ошибки, pgpro_queue автоматически возвращает это сообщение в очередь для повторной попытки. Это гарантирует, что задача будет считаться выполненной только тогда, когда вся связанная с ней работа успешно зафиксирована в базе данных.

Ещё одна сильная сторона pgpro_queue — синергия со встроенным в Postgres Pro Enterprise планировщиком фоновых задач (Scheduler). Этот компонент, работающий как cron внутри базы данных, может запускать периодические родительские задачи, которые, в свою очередь, наполняют очередь подзадачами для асинхронного выполнения. Например, массовую генерацию отчётов для клиентов из разных часовых поясов можно разбить на этапы: основная задача в планировщике создаёт подзадачи для каждого региона, а те, в свою очередь, помещают сообщения в очередь с учётом локального времени.

Внешние брокеры, такие как Kafka, справедливо славятся своей «непотопляемостью»: они действительно спроектированы выдерживать серьёзные сбои. Однако эта надёжность относится к самому брокеру в изоляции. В реальной системе слабое звено появляется в точках интеграции, и общая стабильность оказывается зависима от внешних факторов: сети, конфигурации, транзакционной согласованности с базой данных. Но pgpro_queue исключает эти риски: очереди живут в той же экосистеме, что и данные приложения. Сообщения не теряются при сбоях, так как их сохранность гарантируется механизмами репликации и восстановления СУБД. Администраторам больше не нужно настраивать отдельные системы мониторинга для очередей: всё управляется через знакомые инструменты PostgreSQL.

Важные технические особенности

Для корректной работы с pgpro_queue специалистам следует учитывать несколько моментов:

Уровень изоляции. Расширение может использоваться только в транзакциях с уровнем изоляции READ COMMITTED.
Подготовленные транзакции. При использовании двухфазного коммита (2PC) есть нюансы. Если транзакция с READ_MESSAGE() подготавливается через PREPARE TRANSACTION, сообщение блокируется до выполнения COMMIT PREPARED или ROLLBACK PREPARED. При этом ROLLBACK PREPARED только разблокирует сообщение, но не активирует логику повторных попыток.

Что ждет встроенные очереди: дорожная карта

Развитие pgpro_queue сфокусировано на расширении сценариев использования. Уже в ближайших версиях появятся две ключевые возможности:

Система подписок (Pub/Sub). Будет реализован механизм, аналогичный Exchange в RabbitMQ. Продюсер сможет отправлять сообщение в «тему», а не в конкретную очередь. Все потребители, подписанные на эту тему, получат свою копию сообщения. Это открывает путь к созданию полноценных событийно-ориентированных архитектур.
Callback-уведомления. Появится возможность настроить «обратный вызов» — HTTP-запрос к внешнему сервису при появлении сообщения в очереди. Это позволит СУБД самой инициировать обработку, а не ждать, пока приложение опросит очередь.

Функциональность Dead Letter Queue (DLQ) для «отравленных» сообщений также остаётся в планах, но на более долгосрочную перспективу.

Заключение

Для корпоративных клиентов ключевое преимущество — предсказуемость. Каждое сообщение обрабатывается в рамках транзакций СУБД, что исключает рассогласование данных. Инфраструктура становится проще: вместо набора разнородных сервисов — единая база данных, где очереди, бизнес-логика и планировщик работают как части одного организма.

Такие решения идеальны для проектов, где цена ошибки высока: банковские транзакции, медицинские системы, государственные реестры. Если вашему приложению критически важны атомарность операций и минимизация ручного вмешательства, встроенные очереди PostgreSQL — не выбор, а необходимость. Они не просто обрабатывают сообщения, а становятся страховкой от хаоса в мире распределённых систем.

Комментарии (16)

impwx
12.11.2025 16:47
#29101516
Есть сравнительные данные о производительности, условно говоря - какое сообщений в секунду потянет kafka, rmq и ваше решение на одинаковом железе?

Debrainer
12.11.2025 16:47
#29102850
Если уж оракл не справляется со своим advanced queue на серьезных нагрузках, то не стоит надеяться что постгрес справится. Для небольших монолитов идущих в сторону распила, но не готовых ввязываться в распределенный блудняк может и подойдёт. Но предел производительности БД очевиден особенно при пиковых вбросах. Делить функциональную основную бизнес нагрузку с нагрузкой по очередям на одном сервере такое себе. А стоимость железа под БД обычно выше чем стоимость железа под кластерные брокеры. Короче есть плюсы, но есть и масса минусов, особенно для растущих по нагрузке баз.