Правильный порядок колонок в B-tree индексах PostgreSQL или правило ESR / forpes.ru

Главная
Правильный порядок колонок в B-tree индексах PostgreSQL или правило ESR

Правильный порядок колонок в B-tree индексах PostgreSQL или правило ESR +16

22.05.2025 06:15

dipweb 14 4200 Источник

Когда в проекте используется составной B-tree индекс, важно не просто "создать индекс", а сделать это правильно — иначе запросы могут не только не ускориться, но и начать работать медленнее. Возникает логичный вопрос: как выбрать порядок колонок, чтобы индекс действительно работал эффективно? Брутфорсом? По интуиции? По селективности?

В этой статье я расскажу, как подходить к построению составных индексов в PostgreSQL, на что реально влияет порядок колонок. Также разберём простое правило ESR, которое помогает упростить выбор и получать стабильный прирост производительности на всех стендах.

Леонард Эйлер - считается одним из основателей теории графов благодаря решению задачи о кёнигсбергских мостах

Скрытый текст

В каждой статье стараюсь дать историческую отсылку к теме — на этот раз вспомним Эйлера как первопроходца в структурировании информации.

Я — Дмитрий Денисенко, Sofware Developer. Хочу делиться и рассказывать про интересные моменты на этапах разработки.

Вводная часть - как работает поиск в B-tree индексе

Для понимания того, как правильно создать составной индекс, сначала поймём, что из себя представляет B-tree в PostgreSQL.

Скрытый текст

В идеале можно посмотреть официальный код от команды PostgreSQL, но здесь я хочу больше рассказать по главной теме, а не уходить в дебри.

B-tree или же многонаправленное сбалансированное дерево (что значит B в B-tree — точно не знает никто: есть версии как balanced, broad или просто Bayer, по имени автора). В PostgreSQL представляет под собой 3 основных элемента:

Корневой узел
Внутренние узлы
Листовые узлы

Для более глубокого понимания корневого узла и внутренних узлов советую почитать информацию на специализированных статьях, у них есть крутые плюшки в виде метаинформации. Но это я думаю нужно людям, которые напрямую работают с БД, оставим это базистам настраивающим эту инфраструктуру на проекте.

Нас же интересуют листовые узлы и логика поиска в них.

Листовой узел (leaf node) — это страница дерева на самом нижнем уровне, содержащая реальные данные индекса. В листовом узле - данные хранятся через Page - специальный блок, который хранит в себе информацию по ключам индекса и TID (Обычно это 8 KB). Сам PostgreSQL хранит листовые ноды в виде двухсвязного списка (будет важно чуть ниже).

Для начала приведём пример как выглядит дерево на 1 колонке индекса

-- Таблица
CREATE TABLE IF NOT EXISTS public.bank_transactions
(
    id integer NOT NULL DEFAULT nextval('bank_transactions_id_seq'::regclass),
    sender_id integer NOT NULL,
    receiver_id integer NOT NULL,
    amount numeric(12,2) NOT NULL,
    transaction_date date NOT NULL,
    payment_type text COLLATE pg_catalog."default" NOT NULL DEFAULT 'СБП'::text
)

Нагенерим данных

INSERT INTO bank_transactions (sender_id, receiver_id, amount, transaction_date, payment_type)
SELECT
    (random() * 100000)::int,                          -- sender_id
    (random() * 100000)::int,                          -- receiver_id
    ROUND((random() * 50000)::numeric, 2),             -- amount
    DATE '2023-01-01' + (random() * 365)::int,         -- transaction_date
    (ARRAY['СБП', 'SWIFT', 'ВНУТРЕННИЙ', 'Межбанк'])[floor(random() * 4)::int + 1]  -- payment_type
FROM generate_series(1, 1000000);

Теперь попытаемся найти sender_id = 444

-- Запрос
EXPLAIN (ANALYZE, BUFFERS)
SELECT * 
FROM bank_transactions
WHERE bank_transactions.sender_id = 444

-- План
Gather  (cost=1000.00..15098.43 rows=11 width=36) (actual time=0.203..47.653 rows=6 loops=1)
  Workers Planned: 2
  Workers Launched: 2
  Buffers: shared hit=7749 read=1140
  ->  Parallel Seq Scan on bank_transactions  (cost=0.00..14097.33 rows=5 width=36) (actual time=0.692..20.904 rows=2 loops=3)
        Filter: (sender_id = 444)
        Rows Removed by Filter: 333331
        Buffers: shared hit=7749 read=1140
Planning:
  Buffers: shared hit=5
Planning Time: 0.433 ms
Execution Time: 47.677 ms

Тут мы видим, что SQL просто прошёлся Seq Scan по всей таблице, отбросил кучу строк (Rows Removed by Filter), и в итоге выдал нам 6 строк. Т.е. чтобы найти нужную нам строчку, ему пришлось очень много читать и отбрасывать.

Добавим индекс по sender_id и посмотрим, как изменится план.

-- Индекс
CREATE INDEX idx_sender_id ON bank_transactions (sender_id);

-- План
Bitmap Heap Scan on bank_transactions  (cost=4.51..47.49 rows=11 width=36) (actual time=0.036..0.043 rows=6 loops=1)
  Recheck Cond: (sender_id = 444)
  Heap Blocks: exact=6
  Buffers: shared hit=6 read=3
  ->  Bitmap Index Scan on idx_sender_id  (cost=0.00..4.51 rows=11 width=0) (actual time=0.032..0.032 rows=6 loops=1)
        Index Cond: (sender_id = 444)
        Buffers: shared read=3
Planning:
  Buffers: shared hit=15 read=1
Planning Time: 0.725 ms
Execution Time: 0.061 ms

Bitmap Index Scan - находит в B-tree индексе все строки, где sender_id = 5203, получает список TID (указатель на физическое расположение строки в таблице).
Bitmap Heap Scan — По списку TID идёт в таблицу (heap) и проверят существуют ли такие строчки в таблице.

Немного визуализируем

Визуализация Bitmap Index Scan по нашей таблице для одиночного индекса

Отлично, поняли что и как для индекса с 1 колонкой.
Теперь поймём как это работает для составных индексов.

В составных индексах — Page хранит ключ индекса уже в виде тех колонок, что мы задаём в индексе.

Теперь, наша задача, найти отправителей за конкретную дату. Сделаем это без индекса (и старый удалим).

EXPLAIN (ANALYZE, BUFFERS)
SELECT * 
FROM bank_transactions
WHERE bank_transactions.sender_id = 444
	AND bank_transactions.transaction_date = '2023-09-24'


--План
Gather  (cost=1000.00..16139.10 rows=1 width=36) (actual time=0.203..54.237 rows=1 loops=1)
  Workers Planned: 2
  Workers Launched: 2
  Buffers: shared hit=7877 read=1012
  ->  Parallel Seq Scan on bank_transactions  (cost=0.00..15139.00 rows=1 width=36) (actual time=9.925..26.461 rows=0 loops=3)
        Filter: ((sender_id = 444) AND (transaction_date = '2023-09-24'::date))
        Rows Removed by Filter: 333333
        Buffers: shared hit=7877 read=1012
Planning:
  Buffers: shared hit=5 dirtied=1
Planning Time: 0.443 ms
Execution Time: 54.256 ms

То же самое, полный последовательный просмотр всех строк подряд, чтобы найти нужную.
Добавим индекс (выбираем по селективности)

-- Индекс
CREATE INDEX idx_sender_date
ON bank_transactions(sender_id, transaction_date);

-- План
Index Scan using idx_sender_date on bank_transactions  (cost=0.42..8.45 rows=1 width=36) (actual time=0.046..0.046 rows=1 loops=1)
  Index Cond: ((sender_id = 444) AND (transaction_date = '2023-09-24'::date))
  Buffers: shared hit=1 read=3
Planning:
  Buffers: shared hit=18 read=1
Planning Time: 1.122 ms
Execution Time: 0.062 ms

Тут мы прошлись Index Scan и быстро нашли всё что нам нужно
Прежде чем будем визуализировать, отмечу, что поиск осуществляется в порядке, заданном в индексе. Это означает, что PostgreSQL использует порядок колонок в индексе слева направо: сначала фильтруется sender_id, затем transaction_date.

Визуализация Bitmap Index Scan по нашей таблице для составного индекса

Скрытый текст

Отмечу, что если бы мы поставили дату первой, то получили бы листовые узлы по датам и список выглядел куда больше, возможно, было бы несколько листовых узлов с датами и операциями по ним

Практическая часть - ESR как правило при составлении индекса

Нельзя создать универсальный индекс, который одинаково быстро будет работать для всех задач, если сделать универсальным — то это не максимальный прирост скорости.

В реалях разработки, обычно идёт выбор того или иного решения, ведь индекс не воздушный и занимает как память, так и влияет на производительность. Хочу сразу сказать, что составление индекса — дело супер прикладное, решения для одной базы, может не подходить для решения в другой. Но по англо интернету гуляет правило (встречал вскользь и в других русскоязычных статьях на Хабре) ESR (Equality, Sort, Range).

ESR — говорит о том, что в составных ключах для B-tree сначала столбцы с равенством, затем сортировка, затем диапазоны.

Что такое правило ESR?

ESR = Equality → Sort → Range

При создании составного B-tree индекса:

E — Equality: сначала колонки, по которым в запросе стоит =
S — Sort: затем те, по которым идёт сортировка (ORDER BY)
R — Range: и только в конце — колонки с диапазонами (>, <, BETWEEN)

В официальной документации в рамках этого правила есть всего 1 абзац

A multicolumn B-tree index can be used with query conditions that involve any subset of the index's columns, but the index is most efficient when there are constraints on the leading (leftmost) columns. The exact rule is that equality constraints on leading columns, plus any inequality constraints on the first column that does not have an equality constraint, will be used to limit the portion of the index that is scanned. Constraints on columns to the right of these columns are checked in the index, so they save visits to the table proper, but they do not reduce the portion of the index that has to be scanned. For example, given an index on (a, b, c) and a query condition WHERE a = 5 AND b >= 42 AND c < 77, the index would have to be scanned from the first entry with a = 5 and b = 42 up through the last entry with a = 5. Index entries with c >= 77 would be skipped, but they'd still have to be scanned through. This index could in principle be used for queries that have constraints on b and/or c with no constraint on a — but the entire index would have to be scanned, so in most cases the planner would prefer a sequential table scan over using the index.

Давайте покажем на практике

Для начала определим потребность

Из нашей таблицы, мы хотим получить отправителей не за конкретную дату , а за временной промежуток и по типам платежей (Вполне продовская задача для сервиса отчётов банка).

Потребность найдена, теперь представим, что записей не 100 000, а куда больше (огромная продовская бд с историями по банку). Нам приходят и говорят, что запрос слишком медленный и обычный индекс по sender_id работает слишком медленно.

Добавим ещё данных

INSERT INTO bank_transactions (sender_id, receiver_id, amount, transaction_date, payment_type)
SELECT
    (random() * 1_000_000)::int,                  -- sender_id
    (random() * 1_000_000)::int,
    ROUND((random() * 10000)::numeric, 2),
    DATE '2020-01-01' + (random() * 2000)::int,
    (ARRAY['СБП', 'SWIFT', 'ВНУТРЕННИЙ', 'Межбанк'])[floor(random() * 4)::int + 1]
FROM generate_series(1, 10_000_000);

Также добавим 10 000 записей конкретно под каждому sender_id.
Сразу подчеркну — это сделано исключительно для демонстрации логики работы PostgreSQL под нагрузкой. Я сознательно не моделирую продовую таблицу — нет возможности воспроизвести её объём и ресурсы.
Да, при небольших объёмах данных PostgreSQL часто выбирает оптимальные планы даже при неоптимальной структуре индексов — оптимизатор успевает всё аккуратно подкрутить, найти хороший план и отработать даже при плохой структуре данных.
Но это не значит, что в проде всё будет так же. Там — жесткая борьба за ресурсы, кеши не безразмерные, и у планировщика не всегда будет шанс "спасти" косяки в структуре индексов или запросов. Что работает на тесте с 10 строками — вполне может обрушить прод с миллионами. Именно поэтому важно моделировать нагрузку.

INSERT INTO bank_transactions (sender_id, receiver_id, amount, transaction_date, payment_type)
SELECT
    sender_id,
    (random() * 1000000)::int,
    ROUND((random() * 10000)::numeric, 2),
    DATE '2020-01-01' + (random() * 1860)::int,
    (ARRAY['СБП', 'SWIFT', 'Межбанк', 'ВНУТРЕННИЙ'])[floor(random() * 4)::int + 1]
FROM generate_series(1, 10000) AS sender_id,
     generate_series(1, 1000);

-- Запрос
EXPLAIN (ANALYZE, BUFFERS)
SELECT * 
FROM bank_transactions
WHERE bank_transactions.sender_id = 444
	AND bank_transactions.transaction_date < '2025-05-18'
	AND bank_transactions.transaction_date > '2020-04-18'
	AND bank_transactions.payment_type = 'СБП'

-- План
Seq Scan on bank_transactions  (cost=0.00..871550.86 rows=3541467 width=35) (actual time=5416.344..6795.770 rows=222 loops=1)
  Filter: ((transaction_date < '2025-05-18'::date) AND (transaction_date > '2020-04-18'::date) AND (sender_id = 444) AND (payment_type = 'СБП'::text))
  Rows Removed by Filter: 20999762
  Buffers: shared hit=258 read=252001
Planning:
  Buffers: shared hit=3 read=2 dirtied=1
Planning Time: 1.006 ms
Execution Time: 6795.867 ms

При увеличении данных мы перестали использовать индекс по sender_id — стало слишком много строк (21 млн) и из них сложно что-то хорошее вычленить по sender_id, поэтому планировщик решил использовать обычный поиск по всем данным.

При выборе порядка колонок в индексе часто ориентируются на селективность - пойдём отталкиваясь от этого критерия.

sender_id — поле для компоновки данных, лучше чем смотреть кучу платежей за дату
transaction_date — когда мы нашли данные по пользователю, можем спокойно итерироваться по датам
payment_type — самое не селективное поле

-- Индекс
CREATE INDEX idx_sender_date_type
ON bank_transactions (sender_id, transaction_date, payment_type);

-- План
Index Scan using idx_sender_date_type on bank_transactions  (cost=0.56..254.61 rows=83 width=35) (actual time=0.034..0.325 rows=222 loops=1)
  Index Cond: ((sender_id = 444) AND (transaction_date < '2025-05-18'::date) AND (transaction_date > '2020-04-18'::date) AND (payment_type = 'СБП'::text))
  Buffers: shared hit=230
Planning Time: 0.133 ms
Execution Time: 0.354 ms

На первый взгляд — идеально. Но стоит задуматься: действительно ли всё работает так, как мы ожидаем?
Тут надо подумать, а показывают ли нам то, как это работает изнутри?
Попробуем составить индекс по ESR (внутри каждой категории — по селективности)

Добавляю индекс без удаления idx_sender_date_type, пусть PostgreSQL сам решит какой индекс брать

-- Индекс
CREATE INDEX idx_sender_type_date
ON bank_transactions (sender_id, payment_type, transaction_date);

-- План
Index Scan using idx_sender_type_date on bank_transactions  (cost=0.56..246.88 rows=83 width=35) (actual time=0.037..0.184 rows=222 loops=1)
  Index Cond: ((sender_id = 444) AND (payment_type = 'СБП'::text) AND (transaction_date < '2025-05-18'::date) AND (transaction_date > '2020-04-18'::date))
  Buffers: shared hit=226
Planning Time: 0.108 ms
Execution Time: 0.204 ms

Даже при полностью прогретом кешировании, PostgreSQL использует меньше узлов B-tree и выполняет индексный проход быстрее, если порядок колонок в индексе соответствует порядку ESR

Важно отметить почему так и почему это может выглядеть не очевидно.
Когда PostgreSQL проходится по индексу, он выбирает сразу нужные и тут нет такого, что он показывает Rows Removed by Filter, он просто сразу берёт нужные и отсекает ненужные.

Визуально это выглядит так:

Заключение

Выбор порядка колонок в составном B-tree индексе — это не вкусовщина, а инженерное и архитектурное решение, основанное на логике доступа к данным.
Правило ESR (Equality, Sort, Range) — это не волшебная формула, а рабочий принцип, подтверждённый планами, буферами, временем выполнения и выбором PostgreSQL планировщика (дай бог ему здоровья).
Продуманная структура составных индексов — важнейший фактор производительности в PostgreSQL. Правило ESR не заменяет анализа, но помогает выстроить эффективную стратегию создания индексов. При росте объёма данных — это разница между мгновенным ответом и минутным ожиданием.
Рассматривали правило на хороших нагрузках (допускаю, что модель может отличаться от реальных данных, тут всё происходило скриптом и псевдослучайным образом)
Ну и EXPLAIN (ANALYZE, BUFFERS) твой лучший друг, не стоит брать мои слова на веру

Скрытый текст

Это моя первая статья, буду рад корректировкам и дискуссиям

Комментарии (14)

Akina
22.05.2025 07:07
#28336944
Я не понял... в финальном запросе равенство вижу (на самом деле равенство по (sender_id, payment_type) = (444, 'СБП')), диапазон вижу (transaction_date < '2025-05-18' AND transaction_date > '2020-04-18')... а где обещанная сортировка?

dipweb Автор
22.05.2025 07:07
#28337238
Спасибо за замечание! Действительно, в финальном запросе используются равенства по (sender_id, payment_type) и диапазон по transaction_date, а явной сортировки (ORDER BY) в SQL-запросе нет.

Однако правило ESR (Equality → Sort → Range) применяется не к самому синтаксису запроса, а к логике построения составного B-tree индекса.

Под Sort здесь понимаются не только поля, указанные в ORDER BY, а вообще колонки, по которым может быть необходим упорядоченный обход — например, для работы с диапазонами или оптимизации последовательного доступа. Это особенно актуально, когда такие поля используются для отчетов или фильтров по времени.

В нашем случае порядок (sender_id, payment_type, transaction_date) соответствует схеме E → E → R (два равенства и один диапазон), что полностью соответствует ESR и позволяет PostgreSQL эффективно "обрезать" лишние страницы в глубине индекса при чтении.

Сортировку (ORDER BY) при желании можно добавить — и этот же индекс сработает корректно, потому что он уже построен в нужном порядке.

Я намеренно сосредоточился на структуре индекса, а не конкретной форме запроса, чтобы показать, в чём суть ESR и почему это работает.

Ну и финально: ESR — это общее практическое правило, применимое к широкому классу запросов, а не к одному конкретному синтаксису.
1. Akina
  22.05.2025 07:07
  #28337504
  Ну так вы по сути-то ничего и НЕ показали. Точнее, показали какой-то кусок, обрывок.
  
  Под Sort здесь понимаются не только поля, указанные в ORDER BY, а вообще колонки, по которым может быть необходим упорядоченный обход — например, для работы с диапазонами или оптимизации последовательного доступа.
  
  Это - вопрос "включать или не включать поле в индекс". А вот как оно работает на именно последовательности Equality → Sort → Range, а не на совокупности Equality + Sort + Range, вы не показали. И как по мне - на текущий момент цель не достигнуто, а фактическое содержание не соответствует заявленному.
  
  Уж если взялись - то показывайте, как работают ВСЕ компоненты правила. И главным образом - что сортировка перед фильтрацией по диапазону эффективнее, чем после. А желательно - ещё и с указанием, когда эта эмпирика не выполняется.
  1. dipweb Автор
    22.05.2025 07:07
    #28337958
    Вы, кажется, несколько переоцениваете формат статьи. Это практический материал — не технический стандарт и не академическая диссертация. ESR раскрыт в контексте задач, с которыми сталкиваются разработчики в реальных проектах, а не в рамках лабораторной работы на тему "распиши каждую букву".
    
    Заявленная цель — показать, как порядок колонок в индексе влияет на производительность. Это показано. Конкретные значения, планы, замеры — всё на месте. Если вы ожидали чего-то другого — возможно, у вас были другие ожидания, а не у статьи другие цели.
    
    И, честно говоря, разбирать "когда эмпирика не работает" — это уже задача читателя, если он претендует на уровень выше среднего. Материал и так даёт больше, чем большинство туторсов.
    
    Так что если вы не нашли здесь то, что хотели — вполне возможно, вам просто не сюда)
    
    Akina
    22.05.2025 07:07
    #28341534
    Это показано.
    
    Как по мне, то показано только то, что он - влияет. Как (эмпирика процесса), а уж тем более почему (физика процесса) - практически не затронуто.
    
    А если по вашему мнению ответ на вопрос "как" - это просто выбор одного из вариантов "ускоряет", "замедляет" и "не влияет", пусть и с экспериментальным подтверждением,- то мы с вами и правда по-разному мыслим.
    
    dipweb Автор
    22.05.2025 07:07
    #28341556
    Если вы ожидали формального анализа с доказательствами на уровне оптимизатора — это скорее вопрос не к статье, а к вашим ожиданиям от неё.
    
    https://github.com/postgres/postgres/tree/master/src/backend/access/nbtree - прошу)
    
    Akina
    22.05.2025 07:07
    #28343812
    Ну я как-то ожидал как минимум полного перебора всех вариантов наличия и порядка полей в индексе. Наличия в таблице полей, отвечающих каждому пункту ESR, и тайминга для всех возможных индексов и без индекса вообще - это как минимум. Причём строго на таблице с одним и тем же наполнением. Ну и планы посмотреть - а что собственно сервер с индексом делал, что именно применял. Даже анализ результатов на читателя можно спихнуть, и ограничиться финальным выводом - и то хорошо бы получилось...
    
    Оптимальным было бы, конечно, сначала создать наполненную данными таблицу со всеми вариациями индексов, а потом прогнать по ней запросы, указывая хинтами использование строго определённого индекса, но, емнип, в Постгрессе таких хинтов пока что не завезли.
    
    dipweb Автор
    22.05.2025 07:07
    #28343872
    Ваши ожидания — это ваши ожидания. ;)
    Это уже третий ответ - и, пожалуй, последний.)

Derfirm
22.05.2025 07:07
#28341368
Спасибо за статью, познавательно. Мне показалось что зря не покрыли ещё опцию Using при создании индекса. Пусть он и не участвует в описанных случаях, но тоже полезная инфа по работе с индексами.
1. dipweb Автор
  22.05.2025 07:07
  #28341446
  Спасибо за комментарий!
  Действительно, USING — важная часть при работе с другими типами индексов, вроде GIN или GiST. В этой статье решил сфокусироваться на B-tree и правиле ESR, но вы правы — хотя бы краткое упоминание USING было бы уместно. Возьму на заметку для следующего материала!

IvanVakhrushev
22.05.2025 07:07
#28343242
Спасибо. Больше деталей с визуализациями можно найти в https://habr.com/ru/companies/tensor/articles/488104/
1. dipweb Автор
  22.05.2025 07:07
  #28343292
  Спасибо за комментарий!
  Интересная статья, в дополнение можно посмотреть выступления спикеров на форумах, перед написанием статьи увидел для себя несколько интересных в данном направлении.
  
  Тема оптимизации сама по себе бесконечная)

vmalyutin
22.05.2025 07:07
#28347480
Во-первых, в листах лежат указатели на записи.

Во-вторых, bitmap index scan возвращает указатели на страницы, на которых будут данные.

В-третьих, если поле в индексе, то оно там отсортировано уже. Идёт оно в начале или в конце не важно.

В-четвертых, поля в индексе должны идти по силе селективности. Самое не уникальное поле самое первое, т.д.
1. dipweb Автор
  22.05.2025 07:07
  #28349428
  Во-первых, добрый день)
  
  На первые два пункта я не возражаю — да, но значения также лежат.
  
  На третий пункт прошу ещё раз прочитать мою статью: PostgreSQL не покажет и не напишет, какие поля он отсеял, а какие нет.
  
  Четвёртый пункт будет следствием из других. Я не отрицаю селективность, а лишь дополняю её, причём с примером.
  
  Добра вам!

Правильный порядок колонок в B-tree индексах PostgreSQL или правило ESR +16

Вводная часть - как работает поиск в B-tree индексе

Практическая часть - ESR как правило при составлении индекса

Что такое правило ESR?

Заключение

Комментарии (14)

Akina

dipweb Автор

Akina

dipweb Автор

Akina

dipweb Автор

Akina

dipweb Автор

Derfirm

dipweb Автор

IvanVakhrushev

dipweb Автор

vmalyutin

dipweb Автор