Гибкая ECS с кастомными layout-профилями: как я строил ECSS внутри своего игрового движка / forpes.ru

Главная
Гибкая ECS с кастомными layout-профилями: как я строил ECSS внутри своего игрового движка

Гибкая ECS с кастомными layout-профилями: как я строил ECSS внутри своего игрового движка +7

03.12.2025 07:15

wagnerks 7 5500 Источник

Всем привет, я делаю свой пет-проект - игровой движок, и какой пет-проект без собственноручно сваренного велосипеда, так я и пришел к идее реализации своей ECS.

В этой статье я хочу рассказать простыми словами - что такое ECS, и как он эволюционно появился у меня.

Что такое ECS - Entity Component System (Сущность Компонент Система) - архитектура хранения данных, где логика - системы, явно отделена от данных - компонентов, которые объединены одним общим id - сущностью.

В двух словах, идея ECS заключается в том, чтобы навести порядок в игровом коде, и игровом мире - выделить все данные игровых объектов(сущностей), и желательно сделать это data-oriented (почему желательно я расскажу ниже).

Предположим, у вас в игре есть объект КУБ - квадратный, все стороны равны, все углы равны, классический такой КУБ. У него есть положение в мире (Transform) у него есть его кубический меш (Mesh), он умеет быть отрендеренным (IsRenderable), и, ко всему прочему, он еще и обладает какой-то своей кубической физикой (Physic).

Классический способ заставить это существовать в игровом мире - создать сцену, на которой создать объект КУБ, который наследник класса RenderObject, который наследник класса Object, в RenderObject вероятно будет лежать Mesh, в Object будет Transform, со своими методами: updateTransform, isDirty, markDirty etc. Еще какой-нибудь ObjectId, в Mesh - будет AssetId ...
В общем получится что-то вроде:

struct Transform {
  vec3 pos;
  vec3 rotation;
  mat4 transformMat;
  bool isDirty = true;
  
  void UpdateTransform();
  void IsDirty();
  void MarkDirty();
  ...
};

struct Asset {
  std::string assetId;
};

struct Mesh : public Asset {
  std::vector<Vertex> vertices;
  std::vector<uint32_t> indices;
  // какие-нибудь меш методы
};

class Object {
  virtual ~Object() = default;
  Transform transform;
  std::string objectId;
};

class RenderObject : public Object {
  
};

class RenderObjectWithPhys : public RenderObject {...}; // или виртуальное наследование?

В общем, как видно из примера выше, даже на таком базовом минимуме (С) начинаются вопросы : как это всё правильно разложить? когда и как обновлять трансформ? где? как обновлять mesh? нужно ли создать отдельный легковесный mesh?
Расширяемость низкая, сделать это всё кэш-френдли сложно, плюс слой виртуализации...

Но нам на помощь приходит data oriented design - сначала думаем о том как правильно разложить данные по памяти, а потом уже думаем как эти данные использовать.

Смотрим на пример: Данные - это transform, mesh, physics, isRenderable, mesh. Нужно их вынести во что-то отдельное (в голове маячат странные аббревиатуры SoA, AoS. Но мы пока не понимаем что это такое, и откуда этот странный шум).

Рассуждаем логически - должны ли данные сами себя менять? Это удобно в ООП, машина сама себя "едет". Но данные из transform нужны не только самому transform для апдейта логики, но и, например, физике и, естественно, рендеру. Transform может прийти к физике, и она его будет как-то использовать, и рендер тоже, как минимум попросит матрицу, но изменять сам transform уже не будет. Естественным образом появляется логика:

struct Transform {
  vec3 pos;
  vec3 rotation;
  mat4 transformMat;
  bool isDirty = true;
  
  void UpdateTransform();
  void IsDirty();
  void MarkDirty();
  ...
};

Physic::Update(Transform& objT) {
//меняем трансформы под влиянием физики
  objT.pos.x += 1.f; // у нас очень простая физика - полёт вперед и только вперёд
  objT.MarkDirty();
}

Render::Draw(Transform& objT){
//рисуем объект там где он должен быть нарисован
  if (objT.IsDirty()){
    objT.UpdateTransform();
  }
  Draw(objt.transformMat);
}

Но почему трансформ обновляет себя в draw? Во первых, намного эффективнее было бы делать это в другом потоке. Во вторых, ответственность Render не должна распространяться на нерисование.

Выносим эту логику из рендера:

struct Transform

Physic::Update(Transform& objT) {
   //меняем трансформы под влиянием физики
   objT.pos.x += 1.f; // у нас очень простая физика - полёт вперед и только вперёд
   objT.MarkDirty();
}

TransformUpdater::Update(Transform& objT){
  if (objT.IsDirty()){
    objT.UpdateTransform();
  }
}

Render::Draw(Transform& objT){
   //рисуем объект там где он должен быть нарисован
   Draw(objt.transformMat);
}

И вот мы стоим на пороге великого открытия (C), если трансформ обновляется в отдельном объекте, у которого есть свой апдейт, его меняют другие объекты (Physic), и используют третьи(Render).

Зачем хранить логику апдейта внутри самого Transform? Это же банально не удобно и не логично, 2 из 3 просто меняют его, третий тоже так должен делать.
Рождается component system архитектура, когда данные уже лежат отдельно от логики, но пока что не отдельно от Object. Данные мы начинаем звать компонентами, так как они части одного целого Object.

Мы обновляем эти Object через системы, и подход может выглядеть так:

struct Transform {//only data};
struct PhysicsComp {};
struct IsRenderable {bool is = true; };
struct Mesh{};
  
struct Object {
  Transform t;
  PhysicsComp p;
  IsRenderable r;
  Mesh m;
};

Core::Update(float dt){
  std::vector<Object>& world = GetWorld();
  for (auto& obj : world) {
    // Updater объектов это система - 
    PhysicsSys::Update(obj);
    TransformSys::Update(obj);
  }

  // сделаем вид что это другой поток
  for (auto& obj : world) {
    RenderSys::Draw(obj);
  }
}

У нас массив Object, у каждого Object набор компонентов. Расширяемость уже сильно проще, структура тоже, можно добавлять новые компоненты, но это раздувает Object.

Давайте вспомним те странные аббревиатуры SoA и AoS - Structure Of Arrays и Array Of Structures. У нас получилось буквально - AoS (vector<object>). В чем минусы: физике не нужно знать о том renderable ли объект, а если мы добавим SoundComponent, то он тем более не нужен физике, равно как и не нужен PhysicsComponent системе звуков.

Тащим лишнее по памяти, получаем более медленную итерацию (на страницу памяти буквально помещается меньше компонентов, и процессор чаще её "перелистывает").
(Подробнее про различия и особенности SoA и AoS я могу написать в отдельной статье если появится такой запрос. Сейчас нам хватит такого общего понимания.)

Нам нужно разбить Object на набор массивов компонентов, по массиву на компонент. Но как тогда PhysicsSys получит transform? Ей нужен не какой-то там transform, а принадлежащий тому же объекту, которому принадлежит physics. Всё очень просто: по уникальному id - EntityID.
Круг замкнулся: entity component system - entity - это просто связь между компонентами, компоненты - данные, system - функция, которая эти данные меняет.

Добавили в игру новый компонент - просто создали еще один массив. Удалили компонент - yдалили массив.

Классическая SoA.

struct Transform {//only data};
struct PhysicsComp {};
struct IsRenderable {bool is = true; };
struct Mesh{};
  
uint32_t entityId;
std::vector<entityId> entities;

std::map<Transform> t;
std::map<PhysicsComp> p;
std::map<IsRenderable> r;
std::map<Mesh> m;

Core::Update(float dt){
  std::vector<entityId>& world = GetWorld();
  for (auto& entity : world) {
    // Updater объектов это система - 
    PhysicsSys::Update(t[entity]);
    TransformSys::Update(p[entity]);
  }

  // сделаем вид что это другой поток
  for (auto& entity : world) {
    RenderSys::Draw(r[entity], m[entity]);
  }
}

Выше описан минимальный пример ECS (некоторые ECS примерно так и выглядят).

Надеюсь к этому моменту у читателя появилось понимание, что такое ECS и как его готовить.

В целом можно у себя в движке сделать прямо так, как показано сверху - оно будет работать (возможно даже не слишком медленно). Но помимо удобства хранения данных и расширяемости хочется скорость! Мы говорили что-то про SoA, но map это не совсем A в данном уравнении.

Я писал выше, что желательно чтобы ECS был DoD (по моему мнению это обязательно, маст хэв, и прям очень нужно и просится!). Технически оно уже data oriented, но само хранение data сделано очень неэффективно: данные лежат в дереве, разбросаны по памяти, и итерация по ним будет невероятно медленной (а итерация - это основной use case данных в ECS). Поэтому данные должны быть плотно упакованы. Итерация должна быть не сильно дороже обычной итерации по Array, поиск по id сущности должен быть быстрым, но никаких деревьев! Только массивы, только хардкор и кэш-френдли структуры (а сущностей могут быть миллионы).

Плюс я предполагал, что SoA - это классно, но иногда нужно несколько компонентов объединить в один блок памяти (ради кэш-френдли), но не терять гибкости и возможности итерироваться по таким компонентам так, как будто они отдельные объекты.

Я хотел гибкость и скорость. И максимум контроля.

И у меня появилась идея - сделать layout в памяти, в котором будут храниться компоненты, я назвал его Sector.

А свою ECS - ECS with Sectors - ECSS.

Sector - фактически просто разметка памяти. У него есть информация о том, какие компоненты в нем живы, и id. Разметка сектора происходит снаружи, и компоненты кладутся в него через слой рефлексии (самописный маленький класс, максимально быстрый).

Таким образом Sector ничего не знает о том, что в нем лежит. ECS знает смещения до компонента внутри сектора, и при попытке достать из сектора компонент - проверяет бит "живости", если он равен 1 - берет память компонента и кастует его к нужному типу.

Память с секторами заранее аллоцируется чанками под N секторов, чтобы избежать проблем с невозможностью найти место под огромный массив, и рост массива был условно бесплатным (resize не перемещает уже размещенные данные).

Sector настраивается на старте приложения, информация о его разметке в большей мере - compile time, таким образом он практически не даёт оверхеда при итерации. Но если правильные компоненты упаковать в Sector (например Transform и DrawData), если структуры этих данных тривиальные (хотя бы trivially-copyable), и эти данные в горячем месте должны быть вместе, то это даёт отличный профит по скорости, из-за увеличения cache friendliness (данные хранятся вместе).

Ниже можно посмотреть бенчмарки, которые доказывают эффективность моего подхода
https://wagnerks.github.io/ecss_benchmarks/

В следующей статье я хочу подробно остановиться на структуре памяти моей ECS, опуститься поглубже в код и порассуждать о деталях реализации и боли оптимизации.

Код бенчмарков - https://github.com/wagnerks/ecss_benchmarks
Исходники открытые, кода немного, буду рад фидбеку) - https://github.com/wagnerks/ecss

Комментарии (7)

kipar
03.12.2025 08:29
#29197810
Было бы интересно посмотреть бенчмарки "плохого случая" - когда есть скажем 10к энтитей, у 5000 есть компонент А, у 5000 есть компонент B, но только у 100 есть и компонент и А и В. Насколько быстрой в этом случае будет итерация по сущностям содержащим и А и В. entt в этом случае предлагает связанные группы, другие неархетипные ecs на этом случае ломаются или вводят фильтры содержащие список сущностей.
1. wagnerks Автор
  03.12.2025 08:29
  #29198794
  Привет! Добавлю такой кейс и поисследую возможные оптимизации
  
  у меня итерация идёт по первому компоненту из списка в for, и в таком кейсе будет 5000 итераций
  
  Второй компонент может быть nullptr, это можно проверить простым ифом
  1. kipar
    03.12.2025 08:29
    #29199606
    у меня итерация идёт по первому компоненту из списка в for, и в таком кейсе будет 5000 итераций
    
    Стандартная оптимизация - итерироваться по тому из компонентов, которых меньше. Тогда если в мире будет 5000 компонентов А и 200 компонентов B, то придется делать всего 200 итераций.
    Но для "плохого случая" она не поможет, да.

domix32
03.12.2025 08:29
#29199174
std::map<Transform> t;

главное чтобы вы понимали, что в таком виде оно не очень ecs. std::map представляет собой бинарное дерево, то есть ноды дерева расположены где-то в случайном месте памяти. ECS же старается сделать так чтобы одинаковые компоненты лежали как можно ближе друг дргу для cache locality. В классическом SoA оно выглядело бы как-то так
```
Transform t[];
PhysicsComp p[];
IsRenderable r[];
Mesh m[];
```
То есть некоторые линейные массивы, последовательная обработка которых отлично предсказывалась процессорным branch predictor. В случае map такого не будет происходить, т.к. обход бинарного дерева не будет проходить по последовательной памяти, а по веткам дерева. std::unordered_map или std::flat_map могут исправить эту ситуацию.

Ну и отдельно стоит заметить, что любой std::*map обычно принимает два шаблонных параметра - тип ключа и тип собственно элемента, так что ваш пример не соберётся.

Ну и обновление в ECS обычно происходит на уровне систем, а не на уровне энтитей.
```
for (auto [_,tran]: t) tran.tick(); // update transform system
for (auto [_,phys]: p) phys.tick(); // update physics system
/*the rest of systems*/
```
1. wagnerks Автор
  03.12.2025 08:29
  #29200514
  Привет!
  
  Абсолютно верное уточнение что map это не array, сразу после блока с кодом я об этом пишу :)
  
  Этот пример был призван проиллюстрировать реальный способ поиска компонента по его id, но естественно это не оптимальный подход.
  
  Это cpp подобный псевдокод, он не должен собираться, он лишь показывает концепцию.
  
  В случае с ecs нам часто нужно несколько компонентов сразу в одной системе, системой может являться обычная функция, для наглядности псевдокод обновляет данные через системы передавая их в них напрямую.
  
  В следующий раз добавлю пометку "псевдокод", спасибо за фидбек!
  1. here-we-go-again
    03.12.2025 08:29
    #29204460
    А что есть почитать по теме, как делать правильно?
    
    wagnerks Автор
    03.12.2025 08:29
    #29205402
    Я бы не брался говорить что есть прям правильный и неправильный путь
    
    Есть оптимальные и нет.
    
    Главное, на мой взгляд, в ecs- это организовать быструю итерацию по компонентам и быстрый доступ к данным.
    
    Система это просто функция которая обновляет данные в компонентах. Сущность - просто хэндл, вокруг которого компоненты объединены.
    
    Дальше начинаются варианты реализации хранения: массивы, архетипы, соа/аос, свои контейнеры и т.п. А то как организованы системы у каждого может быть своё виденье в зависимости от решаемых задач.
    
    Можно почитать документацию по entt или flecs, например, что бы получить какое то представление. У моей ecss тоже есть документация, ее можно найти в гитхабе. Это даст представление.

Гибкая ECS с кастомными layout-профилями: как я строил ECSS внутри своего игрового движка +7

Комментарии (7)

kipar

wagnerks Автор

kipar

domix32

wagnerks Автор

here-we-go-again

wagnerks Автор