Всем привет, Хабрчане! Во время подготовки к очередному тех-собесу, я задался вопросом: а как в V8 работает Garbage Collector, что такое Heap и Stack, про которые я неоднократно слышал? После прочтения нескольких англоязычных и русскоязычных ресурсов понял, что одни копают очень глубоко, а другие дают лишь минимальную базу. Я решил сделать что-то среднее и агрегировать все эти знания в одну статью, плавно погружая читателя в тему.

Кстати, я начинающий Node.js разработчик и это моя первая статья, прошу не судить строго :)

Погружаемся!

Начнем с базы

Принцип сборки мусора довольно прост: если на сегмент в памяти никто не ссылается, например на объект, можно считать, что он (объект) не используется, и очистить его. Такой принцип ещё называют "принципом достижимости".

Основной алгоритм сборки мусора называется mark-and-sweep. Этот алгоритм может быть объединен также и с алгоритмом mark-compact. Вместе они работают следующим образом:

  1. Сборщик мусора отмечает все корневые объекты.

  2. Далее помечаются все объекты, на которые ссылаются эти корни.

  3. Процесс повторяется для всех достижимых объектов.

  4. После этого непомеченные объекты считаются недостижимыми и удаляются.

  5. Происходит перемещение (дефрагментация) оставшихся объектов. Это уменьшит фрагментацию и повысит производительность выделения памяти для новых объектов.

mark-and-sweep + mark-compact
mark-and-sweep + mark-compact

Существует ещё несколько алгоритмов сборки мусора. Некоторые из наиболее распространенных алгоритмов включают:

  1. Serial Garbage Collector

  2. Parallel Garbage Collector

  3. Concurrent Mark and Sweep (CMS)

  4. Garbage First (G1)

Копаем глубже

Как в памяти V8 распределяются переменные, функции и объекты? V8 использует схему, основанную на концепции Java Virtual Machine (JVM) и делит память на сегменты:

V8 memory schema

  • Code Segment: выполняемый на данный момент код.

  • Stack (статическое выделение памяти): содержит все примитивные типы данных (вроде int, bool, string) с указателями на функции, объекты, а также информация о вызовах методов.

  • Heap (динамическое выделение памяти): сегмент памяти, предназначенный для хранения ссылочных типов данных, вроде объектов, массивов и функций. Это самый большой блок области памяти и именно здесь происходит сборка мусора.

Подробнее про каждый сегмент

Stack:

Это область памяти, выделенная для каждого процесса в V8. Здесь, как говорилось ранее, хранятся статические данные, включая фреймы методов/функций, примитивные значения и указатели на объекты. Стек работает по принципу LIFO (Last In, First Out), то есть последний добавленный элемент будет первым извлеченным.

Heap – самый большой блок области памяти, под капотом он делиться на:

Heap schema

  • Young generation - место, где "живут" новые объекты, и большинство из них недолговечны. Это пространство небольшое и состоит из двух полу-пространств (from-space, to-space).

  • Old generation - место, куда перемещаются объекты, которые пережили два цикла сборки мусора в Young generation блоке. Это пространство управляется основным алгоритмом сборки мусора mark-and-sweepOld generation можно поделить ещё на два подпространства:

    • Old pointer space - cодержит объекты, которые пережили два цикла сборки мусора, и имеют указатели на другие объекты.

    • Old data space – содержит исключительно объекты, которые имеют данные (без ссылок) и строки, числа, массивы.

  • Large object space – тут хранятся объекты, размер которых превышает размер других пространств. Большие объекты никогда не удаляются сборщиком мусора.

  • Code-space - Здесь Just In Time (JIT) компилятор сохраняет скомпилированные блоки кода. Это единственное пространство с исполняемой памятью.

  • Cell space, property cell space, and map space – тут хранятся сервисные объекты, которые упрощают сборку мусора.

Заключение

Я надеюсь, что эта статья была полезной и интересной. Буду рад любым замечаниям и вопросам. Спасибо за внимание!

Вдохновлялся:

  1. A tour of V8: Garbage Collection

  2. Visualizing memory management in V8 Engine (JavaScript, NodeJS, Deno, WebAssembly)

  3. Устройство и работа JVM (Java Virtual Machine)

  4. Эффективная работа с памятью в Node.js

Мой репозиторий "Расширяем кругозор: Node.js и JavaScript", где я записываю интересные ответы на вопросы и познаю дзен V8.

Комментарии (3)


  1. AccountForHabr
    15.08.2024 12:17
    +3

    Чето статья закончилась не успев толком и начаться =(


  1. iliazeus
    15.08.2024 12:17

    Большие объекты никогда не удаляются сборщиком мусора.

    Это очевидная неправда, или, по крайней мере, сформулировано слишком уж криво. Проверить достаточно просто - запустите цикл, создающий большие массивы или Bufferы, но не сохраняющий на них ссылки, и посмотрите на потребление памяти этой программой.

    Правда в том, что они, разумеется, удаляются сборщиком - но лежат в отдельном месте памяти, и никогда за время жизни не перемещаются. Интуиция в том, что из-за того, что эти объекты большие, перемещать их дорого. Но из-за их размера, их обычно не так много - поэтому в этом их отдельном пространстве фрагментация будет меньшей проблемой.


    1. iliazeus
      15.08.2024 12:17
      +1

      V8 использует схему, основанную на концепции Java Virtual Machine (JVM)

      Упоминание JVM тоже выглядит довольно странно. Насколько я знаю, V8 и JVM - совсем не родственники, и я не уверен, насколько похоже у них устроены GC.