PostgreSQL не тормозит. Почему мы перестали масштабировать базу данных и начали масштабировать архитектуру / forpes.ru

Главная
PostgreSQL не тормозит. Почему мы перестали масштабировать базу данных и начали масштабировать архитектуру

PostgreSQL не тормозит. Почему мы перестали масштабировать базу данных и начали масштабировать архитектуру +15

16.06.2026 12:02

JCode_TV 21 16000 Источник

Каждый раз, когда в компании возникают проблемы с производительностью PostgreSQL, обсуждение обычно идет по одному и тому же сценарию.

Сначала DBA оптимизируют запросы. Потом появляются новые индексы. Потом увеличивается размер серверов. Затем появляются реплики. Потом еще реплики. И через некоторое время выясняется, что значительная часть бюджета на инфраструктуру уходит на обслуживание системы, которая изначально должна была просто хранить данные.

Недавно мы в Tarantool столкнулись именно с такой ситуацией у одного из клиентов. В этой статье расскажем подробно об этой ситуации, поделимся, как мы ее решили и почему такой подход в целом стоит использовать практически всем, кто имеет дело с PostgreSQL.

Описание проблемы

У клиента была хорошо знакомая многим архитектура. PostgreSQL выступал мастер-системой и источником истины для бизнеса. Внутри базы хранились данные, необходимые для расчетов. Отдельные сервисы периодически забирали эти данные, выполняли вычисления и записывали результаты обратно. После этого десятки других сервисов использовали уже рассчитанные данные для своей работы.

Схема выглядела примерно так:

На первый взгляд все выглядело правильно, но:

количество данных росло;
количество сервисов росло;
количество пользователей росло.

А вместе с ними росли и счета за инфраструктуру.

Самое опасное решение — заменить PostgreSQL

В такие моменты часто появляются радикальные идеи: перейти на другую БД, переписать все на новый стек, перенести данные в распределенную систему. На практике подобные проекты редко бывают дешевыми и быстрыми.

Важно помнить, что PostgreSQL является одной из самых надежных и зрелых СУБД на рынке. Во многих компаниях вокруг нее построены десятки сервисов, процессов и интеграций. Поэтому мысль просто взять и заменить PostgreSQL обычно вызывает примерно такую же реакцию, как предложение заменить фундамент у уже построенного дома.

Технически возможно, но на практике — крайне болезненно. Поэтому мы начали искать другой путь.

А точно ли проблема в PostgreSQL

Когда мы начали разбирать нагрузку, оказалось, что большая часть ресурсов PostgreSQL тратится вовсе не на транзакции и даже не на запись данных. Основная нагрузка приходилась на чтение, причем зачастую сервисам были нужны не исходные данные, а уже готовый результат расчетов.

Приведем упрощенный пример. В PostgreSQL хранятся:

clients
contracts
accounts
limits
transactions
products
risk_profiles

Сервису нужен ответ вида:

{
  "client_id": 123,
  "active_limit": 100000,
  "contracts": 5,
  "risk_level": "LOW"
}

Чтобы получить его, база данных каждый раз выполняет:

несколько JOIN;
агрегации;
сортировки;
вычисления.

Когда запрос один — это не проблема. Когда их сто тысяч в секунду — это совсем другая история. Но зачем заставлять PostgreSQL каждый раз собирать один и тот же ответ?

Не база данных, а пути данных

Вместо очередной реплики PostgreSQL мы решили посмотреть на систему целиком. Если сервисам нужен готовый результат расчетов, возможно стоит хранить этот результат отдельно от исходных данных. Так появилась идея операционной витрины данных.

В этой системе PostgreSQL остается источником истины и все транзакции продолжают выполняться именно в нем. Расчетные сервисы тоже продолжают работать как раньше. Но результат расчетов начинает поставляться в отдельное высокопроизводительное хранилище, оптимизированное под чтение.

Архитектура начинает выглядеть так:

В роли витрины данных может выступать не только Tarantool. Подойдет любая технология, которая соответствует требованиям вашей компании по производительности, надежности, стоимости владения и эксплуатационным процессам.

Почему это дешевле

На первый взгляд кажется, что раз мы добавляем еще одну систему, то расходы должны только вырасти. Но на практике экономика часто работает наоборот.

Представьте компанию, которая ежегодно увеличивает нагрузку на 30–50%. Каждый новый этап роста приводит к покупке:

новых серверов PostgreSQL;
дополнительной памяти;
новых реплик;
дополнительных мощностей для резервного копирования;

А еще к увеличению затрат на сопровождение.

Через несколько лет стоимость владения начинает расти быстрее самой нагрузки. В такой ситуации инвестиции в специализированный слой данных могут оказаться дешевле постоянного горизонтального масштабирования основной базы данных. Фактически компания покупает не еще одну базу данных, а возможность наконец перестать бесконечно наращивать инфраструктуру PostgreSQL.

Что получает бизнес

Если посмотреть на ситуацию глазами CTO или руководителя платформенной команды, преимущества выглядят не как «база стала быстрее». Гораздо важнее другое. Компания получает возможность:

отложить масштабирование PostgreSQL;
уменьшить количество реплик;
снизить требования к вычислительным ресурсам;
сократить расходы на инфраструктуру;
ускорить работу клиентских сервисов;
сделать время ответа более предсказуемым.

Особенно хорошо подобный подход работает в системах, где доля операций чтения превышает 80–90%.

Когда такой подход не нужен

Любая архитектурная оптимизация имеет свою цену. Если PostgreSQL загружен на 20–30%, а бизнес не испытывает проблем с производительностью, строить отдельную витрину данных, скорее всего, не имеет смысла. Но если каждое новое бизнес-требование заканчивается покупкой дополнительных серверов, возможно стоит задать себе вопрос: мы действительно масштабируем данные или на самом деле масштабируем архитектурную ошибку?

Что делать на практике

Если вы решили отделить контур хранения данных от контура доставки данных, то на чем строить такую витрину? Вариантов достаточно много: это и Elasticsearch, и Redis, и специализированные кэши.

В нашем случае нужно было:

быстро доставлять данные сервисам;
поддерживать постоянную синхронизацию с PostgreSQL;
работать с готовыми объектами данных;
не заставлять команды переписывать существующие приложения;
не превращать решение в еще один инфраструктурный проект на год.

Поэтому в качестве витрины данных мы предложили клиенту использовать Tarantool Database.

Как мы реализовали витрину данных

PostgreSQL продолжил выполнять роль мастер-системы и источника истины. Все бизнес-транзакции, расчеты и процессы записи остались на своих местах. Мы не меняли существующие процессы и не заставляли команду переписывать приложения — изменился только путь доставки данных до сервисов.

Изменения из PostgreSQL начали передаваться через CDC в Tarantool, где формировались уже готовые представления данных для клиентских сервисов. В результате сервисы перестали обращаться напрямую к PostgreSQL за каждым запросом. Для них появилась специализированная витрина данных, содержащая уже подготовленные объекты.

Как данные попадали в витрину

Здесь может возникнуть опасение: получается, что данные придется записывать сразу в две системы? На практике это не так.

PostgreSQL продолжает оставаться единственной системой записи. После изменения данных информация автоматически передается через TCDC (Tarantool Change Data Capture) в Tarantool DataBase.

То есть приложения продолжают работать с PostgreSQL как и раньше, а витрина данных получает изменения автоматически и поддерживает актуальное состояние данных. С точки зрения разработчиков ничего принципиально не меняется, но чтение и запись начинают жить в разных контурах.

Как выглядит объект витрины

Представьте, что информация о клиенте хранится в нескольких таблицах:

clients
accounts
contracts
limits
transactions
risk_profiles

Для большинства сервисов вся эта структура избыточна, ведь им нужен уже готовый результат. Поэтому в витрине данных формируется объект наподобие такого:

{
  "client_id": 12345,
  "client_name": "ООО Ромашка",
  "contracts_count": 5,
  "active_limit": 1000000,
  "risk_level": "LOW",
  "last_transaction_date": "2026-08-15"
}

Для клиентского сервиса это уже полноценный объект ClientProfile: без JOIN, агрегаций и дополнительных вычислений. То есть сервис получает ровно те данные, которые необходимы ему для работы.

Что изменилось для бизнеса

На этапе обсуждения проекта клиент не спрашивал про производительность, RPS или миллисекунды. Его интересовало, как долго существующая архитектура сможет выдерживать рост нагрузки без очередной закупки оборудования.

А возник именно такой вопрос вот почему. В компании запускался новый цифровой продукт, и, по прогнозам команды, количество запросов к данным должно было вырасти почти вдвое в течение ближайшего года.

Первый вариант решения выглядел привычно: увеличить ресурсы PostgreSQL и подготовить дополнительные read-replica. Но при оценке стоимости стало понятно, что инфраструктурные расходы будут расти практически теми же темпами, что и бизнес-нагрузка. По предварительной оценке, в течение ближайшего года потребовалось бы развернуть как минимум две новые read-replica PostgreSQL для обслуживания растущего числа сервисов и пользователей.

Именно тогда команда начала искать способ масштабировать потребление данных без бесконечного масштабирования основной базы данных.

После появления операционной витрины данных большая часть запросов на чтение ушла из PostgreSQL. Это позволило отказаться от планов по развертыванию дополнительных реплик на ближайшем этапе развития платформы и использовать существующие мощности значительно дольше.

То есть задача проекта заключалась не в том, чтобы ускорить PostgreSQL. Задача заключалась в том, чтобы рост бизнеса перестал автоматически приводить к росту инфраструктурных расходов. Именно этот эффект оказался наиболее ценным для заказчика.

Какие метрики действительно улучшились

Предсказуемость затрат. Команда получила более понятный горизонт планирования инфраструктуры. Вместо регулярных обсуждений очередного масштабирования PostgreSQL появилась возможность использовать существующие мощности значительно дольше.

Скорость запуска новых сервисов. Раньше появление нового сервиса автоматически означало увеличение нагрузки на мастер-систему. Каждая новая команда становилась еще одним потребителем PostgreSQL. После появления витрины данных новые сервисы могли использовать уже подготовленные данные без дополнительной нагрузки на основную систему.

Снижение стоимости роста. Рост количества пользователей перестал автоматически означать рост количества серверов. Это не означает, что инфраструктура перестала расти совсем. Но стоимость обслуживания каждого нового клиента стала заметно ниже.

Устойчивость платформы. Одним из побочных эффектов стало снижение зависимости клиентских сервисов от текущего состояния PostgreSQL. Даже во время пиковых нагрузок на мастер-систему пользовательские сервисы продолжали получать данные из специализированной витрины.

Для бизнеса это означает более стабильный пользовательский опыт — а стабильность пользовательского опыта обычно конвертируется в конкретные показатели:

меньше обращений в поддержку;
меньше инцидентов;
меньше потерянных операций;
выше удовлетворенность пользователей.

Что оказалось самым ценным в этом проекте

Если попросить меня выделить главный результат такого подхода, я бы назвал не производительность или экономию. Самым ценным оказалось разделение ответственности между системами.

PostgreSQL продолжил заниматься тем, что умеет лучше всего: надежно хранить данные и обеспечивать консистентность. А витрина данных взяла на себя задачу быстрой доставки информации до клиентских сервисов.

На практике именно такое разделение позволило компании перестать рассматривать масштабирование инфраструктуры как единственный способ решения проблемы роста нагрузки.

Именно поэтому подобная архитектура может быть полезна не только крупным компаниям. Любая система, в которой количество операций чтения значительно превышает количество операций записи, рано или поздно сталкивается с похожими вопросами.

Заключение

За годы работы с высоконагруженными системами я заметил одну закономерность: когда система начинает упираться в ограничения, мы почти всегда сначала покупаем новое железо. Намного реже мы задаем вопрос, правильно ли вообще движутся данные внутри системы.

В случае нашего клиента PostgreSQL продолжил отлично выполнять свою работу. Мы не меняли фундамент — мы просто перестали использовать его в качестве несущей стены для всего здания. И именно это позволило масштабировать бизнес быстрее, чем инфраструктурные расходы.

Комментарии (21)

XelaVopelk
16.06.2026 13:04
#30117556
Судя по картинке все сервисы лазиют в одну базу на RW. Ничего не перепутано? У вас там точно "микросервисы" были.
1. JCode_TV Автор
  16.06.2026 13:04
  #30117964
  Да, схема намеренно упрощена.
  
  Под микросервисами здесь скорее подразумеваются любые потребители данных, а не строгое определение микросервисной архитектуры с отдельной БД на каждый сервис.
  
  Основная мысль была в другом: PostgreSQL выступает источником правды, и в какой-то момент к нему начинает приходить не только транзакционная нагрузка, но и большое количество запросов на чтение от разных систем.
  
  Поэтому вопрос был не столько в записи данных, сколько в том, что разные сервисы постоянно читают и собирают одни и те же данные.
  
  Собственно, эту часть нагрузки и предлагается вынести отдельно. PostgreSQL остаётся мастер-системой, а контур чтения берёт на себя повторяющиеся запросы, чтобы не масштабировать основную БД только из-за роста нагрузки на чтение.

skovpen
16.06.2026 13:04
#30117622
Правильно я понял, что в статье изобретен кэш?
1. hazard2
  16.06.2026 13:04
  #30117940
  Скорее материализованные вьюхи
  1. savostin
    16.06.2026 13:04
    #30119062
    Вот кстати да, очень мало материалов по материализованным вьюхам. Есть какие-то минусы использования? Как по мне так очень удобно.
    
    Gromilo
    16.06.2026 13:04
    #30119794
    Присматривался к ним и не понравилось: обновление по требованию и очень долго на большом объёме
    
    XelaVopelk
    16.06.2026 13:04
    #30120190
    если как в ms sql в момент транзакции обновляемые indexed views - тут вы можете сильно просадить запись, которая очень тяжело масштабируется.
    
    gsl23
    16.06.2026 13:04
    #30120886
    Да не только в mssql, в целом тупиковый путь строить витрины для аналитики в операционной БД, тем более на мат.вьюхах.

os9
16.06.2026 13:04
#30117826
Когда мы начали разбирать нагрузку, оказалось, что большая часть ресурсов PostgreSQL тратится вовсе не на транзакции и даже не на запись данных. Основная нагрузка приходилась на чтение, причем зачастую сервисам были нужны не исходные данные, а уже готовый результат расчетов.

То есть до этого вызывали какую-то функцию без понимания, что она читает в БД, а потом решили разобраться?
1. JCode_TV Автор
  16.06.2026 13:04
  #30117948
  Проблема была не в плохом запросе или непонимании, как работает PostgreSQL. Это типичная история растущих систем: сервисов становится больше, нагрузка на чтение растёт, и PostgreSQL начинает тратить всё больше ресурсов на выдачу одних и тех же данных разным потребителям.
  
  Поэтому вопрос был не что оптимизировать?, а зачем каждый сервис постоянно ходит в источник правды за данными, которые можно подготовить один раз и отдавать из отдельного контура чтения? Собственно, об этом и статья. PostgreSQL остаётся системой хранения и транзакций, а контур чтения выносится отдельно, чтобы не масштабировать основную БД только из-за роста количества запросов.
  1. XelaVopelk
    16.06.2026 13:04
    #30118066
    read-модель можно и на postgre сделать. Внеся в техстек проекта тарантул вы повышаете требования к команде разработке, что чревато увеличением стоимости разработки/обслуживания. Почему в проект добавлен именно тарантул? Что он дал для read-модели в сравнении с альтернативой, тем же постгре, к примеру?
    
    trinxery
    16.06.2026 13:04
    #30121388
    Почему в проект добавлен именно тарантул?
    
    "Недавно мы в Tarantool столкнулись именно с такой ситуацией у одного из клиентов<...>"
    
    Внеся в техстек проекта тарантул вы повышаете требования к команде разработке
    
    Это не баг, это фича вендор-лок
    
    Как увидел этот комментарий и сопоставил с названием компании-блога, так сразу всё и понял.
    
    XelaVopelk
    16.06.2026 13:04
    #30121514
    "Недавно мы в Tarantool столкнулись именно с такой ситуацией у одного из клиентов<...>"
    
    у меня сейчас на проекте как раз тарантул есть. Вот было интересно заче его выбрали для read-модели. Например, "шардирование из коробки" - хороший повод.
    
    Но может быть и так было:
    
    Шёл мимо нашего автосалона мужик грустный. Я спросил: "Чо такой грустный". М: "Да вот картошку на рынок возить надо, думаю как". Продал ему Tank 700 в топовой комплектации в кредит. Я классный менеджер по продажам. Завидуйте молча!

titan_pc
16.06.2026 13:04
#30118396
Хорошо живут люди. У них dba есть. Тут сам метрики смотришь, идёшь запросы оптимизировать. Потом чтения слишком много - ну кеш делаешь, любой какой побыстрее, хоть в самом микросервисе. Ну да - Рутина рядового бекендера.

А Они такие точку read нагрузки передвинули и такие - хобана статья на хабр.

Представляете говорят - базу можно задолбить оптимальными на чтение запросами. И оказывается - если их просто слать в другое место - базе станет лучше.

А для olap нагрузки говорят - витрины данных и мать вьюхи бывают.

Это эти чтоли повылазили, которые говорили, что "преждевременная оптимизация хужа пожара" - на любое слово, отличное от того что им известно) Не понимаю слово кэш - не ставлю его в место высокой нагрузки. Чтоб точно субд не сожгла бюджет в цод-е.

nmouse
16.06.2026 13:04
#30119450
Я в такие оптимизации еще в 2009м играл, тогда мы транзакционную платформу со 100тпс входящих финансовых транзакций раскачали так, что больше 90% запросов летели в кеш у СУБД, которой была MS SQL 2000, правда, Enterprise версия, но без включения кластеризации. И никаких микросервисов, но модульная архитектура :)

Вопрос: Что произошло за пятнадцать лет, что разработчики стали больше думать не о том, как правильно спроектировать и разработать систему, а о том как модно-современно?

Кстати, а конфигом не могли бы поделиться железки под Тарантул? А то у меня были проекты с несколькими командами, которые на него залазили, так у одной в требованиях значился bare metal с 4ТБ оперативы, а всего таких нужно было 3 из-за георезервирования.
1. Fafhrd
  16.06.2026 13:04
  #30127860
  Что-что, стали на собеседованиях везде одинаковые мантры читать и систем-дизайн спрашивать. Каждый теперь -- архитектор =) Вера в Единую Правильную Архитектуру цветет.
  1. nmouse
    16.06.2026 13:04
    #30128084
    Системдизайн интересное, на мой взгляд, движение и я периодически какой-нибудь кейс, например, у Саша Поломодова возьму да почитаю (хотя я Рукпроекта уже много лет и в техничку мне нечасто надо). Но всё я его рассматриваю больше как кукибук, который возвели в обязательность, что в свою очередь привело к обычной проблеме: народ боится спорить с the best practices, причем срабатывает это на уровне подсознания и приходится, иногда, народ месяцами качать, чтобы ребята решились более творчески посмотреть на задачу.

IVA48
16.06.2026 13:04
#30119560
Описанная ситуация типичная, когда в одну БД (не только postgresql) пытаются "запихнуть" все вместе. Это лишний раз подтверждает известную истину: правильно проектировать структуру БД, физически разделять ПО для бизнес-логики от ПО для обработки и доставки данных клиентам. Причем уже на этапе проектирования самой ИС необходимо рассматривать варианты возможного будущего расширение ее функционала и, соответственно, БД. Конечно, можно сказать, что на "берегу" все сразу не предусмотреть. Но надо донести до заказчика, что не продуманные до конца его потребности могут в дальнейшем привести к проблемам. Тип инструментов (выбор ЯП, СУБД) тоже очень важен, но вторичен. Это классика и в этом заключается квалификация разработчика.

Scank
16.06.2026 13:04
#30121174
Ничего не понял из статьи - какое архитектурное решение ? какая нагрузка на БД была\стала ? Сколько времени затрачено на реализацию ? Какой лимит такого масштабирования ?

Anarchist
16.06.2026 13:04
#30121186
А пробовал клиент сделать витрину на простых постгресовых триггерах? Вынести табличку, а добавление, удаление или изменение исходных данных просто делало точечные инкременты/декременты? Например, появился новый контракт - инкрементируем триггером количество контрактов на витрине. Я там понял, постгрес записью был не слишком обременен…

Devdmitry
16.06.2026 13:04
#30124288
Проблема кажется типичной для ситуации когда вокруг одного "источника истины" навтыкали кучу сервисов, обозвали их микросервисами, а потом задолбались масштабировать этот "источник". (типа у нас микросервисы и типа warehouse :) )

Визуально напоминает монолит, который начали пилить на сервисы и новые рядом пристраивать, вешая всё на один источник данных.

Архитектурная ошибка, которую как бы поглубже закапали за ещё одним уровнем представления данных.

З.Ы. поправьте, если не прав