Планирование – это процесс распределения ресурсов системы для выполнения задач. В статье мы рассмотрим его вариант, в котором ресурсом является одно или несколько ядер процессора, а задачи представлены потоками или процессами, которые нужно выполнить.

Само планирование осуществляется планировщиком, который нацелен:

  • Максимизировать пропускную способность, то есть количество задач, выполняемых за единицу времени.
  • Минимизировать время ожидания, то есть время, прошедшее с момента готовности процесса до начала его выполнения.
  • Минимизировать время ответа, то есть время, прошедшее с момента готовности процесса до завершения его выполнения.
  • Максимизировать равнодоступность, то есть справедливое распределение ресурсов между задачами.

Если с этими метриками вы не знакомы, то предлагаю просмотреть несколько примеров в другой моей статье (англ.), посвященной алгоритмам планировщика.

Типы процессов в Linux


В Linux процессы делятся на два типа:

  • Процессы реального времени.
  • Условные процессы.

Процессы реального времени должны вписываться в границы времени ответа, независимо от загрузки системы. Иначе говоря, такие процессы являются срочными и ни при каких условиях не откладываются.

В качестве примера можно привести процесс переноса, отвечающий за распределение рабочей нагрузки между ядрами ЦПУ.

Условные же процессы не ограничиваются строгими рамками времени ответа и в случае занятости системы могут подвергаться задержкам.

В пример можно привести процесс браузера, который позволяет вам читать эту статью.

У каждого типа процессов есть свой алгоритм планирования. При этом пока есть готовые к выполнению процессы реального времени, выполняться будут они, оставляя условные процессы в ожидании.



Планирование в реальном времени


В случае с планированием в реальном времени используются две политики, SCHED_RR и SCHED_FIFO.

Политика определяет количество выделяемого процессу времени, а также принцип организации очереди на выполнение.

Немного поясню.

Суть в том, что готовые к выполнению процессы хранятся в очереди, откуда выбираются планировщиком на основе той или иной политики.

SCHED_FIFO


В данной политике планировщик выбирает процесс, ориентируясь на время его поступления (FIFO = первым вошел, первым вышел).

Процесс с политикой планирования SCHED_FIFO может «освободить» ЦПУ в нескольких случаях:

  • Процесс ожидает, к примеру, операции ввода/вывода, после чего по возвращению в состояние «готов» помещается в конец очереди.
  • Процесс уступил ЦПУ через системный вызов sched_yield, после чего он тут же возвращается в конец очереди.

SCHED_RR


SCHED_RR подразумевает циклическое планирование.

В этой политике каждый процесс в очереди получает интервал времени (квант) и выполняется в свою очередь (исходя из приоритета) по циклическому принципу.

Для лучшего понимания рассмотрим пример, где в очереди находятся три процесса, A B C, все из которых работают по политике SCHED_RR.

Как показано ниже, каждый процесс получает квант времени и выполняется в свою очередь. После однократного выполнения всех процессов они повторяются в той же последовательности.


Обобщение по планированию в реальном времени


Процесс реального времени может планироваться по двум разным политикам, SCHED_FIFO и SCHED_RR.

Политика влияет на принцип работы очереди и определяет, сколько времени нужно выделить тому или иному процессу.

Условное планирование


Здесь мы знакомимся с Completely Fair Scheduler (CFS, абсолютно справедливый планировщик), представляющим алгоритм планирования условных процессов, появившийся в версии Linux 2.6.23.

Помните метрики планирования, которые мы затронули в начале статьи? Так вот CFS фокусируется на одной из них – он стремится к максимальной равноправности процессов, то есть обеспечивает выделение всем процессам равных квантов времени ЦПУ.

Обратите внимание, что процессы с повышенным приоритетом все равно могут получать на обработку больше времени.

Для лучшего понимания принципа работы CFS нужно познакомиться с новым термином – виртуальное время выполнения (vruntime).

Виртуальное время выполнения


Виртуальное время выполнения процесса – это количество времени, потраченного именно на выполнение, без учета любых ожиданий.

Как было сказано, CFS стремится быть максимально справедливым, в связи с чем по очереди планирует готовый к выполнению процесс с минимальным виртуальным временем.

CFS задействует переменные, содержащие максимальное и минимальное виртуальное время выполнения, и чуть позже станет ясно зачем.

CFS —Абсолютно справедливый планировщик


Прежде чем перейти к принципу работы этого алгоритма, нужно понять, какие структуры данных он использует.

CFS задействует красно-черное дерево, представляющее бинарное дерево поиска – то есть добавление, удаление и поиск выполняются за O(logN), где N выражает количество процессов.

Ключом в этом дереве выступает виртуальное время выполнения процесса. Новые процессы или процесс, возвращающиеся из ожидания в состояние готовности, добавляются в дерево с ключом vruntime = min_vruntime. Это очень важный момент, который позволяет избежать дефицита внимания ЦПУ для старых процессов.

Вернемся к самому алгоритму. В первую очередь он устанавливает себе лимит времени – sched_latency.

В течение этого времени алгоритм стремится выполнить все готовые процессы – N. Это означает, что каждый процесс получит интервал времени равный временному лимиту, поделенному на количество процессов: Qi = sched_latency/N.

Когда процесс исчерпывает свой интервал (Qi), алгоритм выбирает в дереве следующий процесс с наименьшим виртуальным временем.

Рассмотрим ситуацию, которая может стать проблематичной для такой схемы работы алгоритма.

Предположим, что алгоритм выбрал лимит времени 48мс при наличии 6 процессов – в этом случае каждый процесс получит на выполнение по 8мс.

Но что произойдет, если система окажется перегружена процессами? Предположим, что лимит времени остается равен 48мс, но теперь у нас 32 процесса. В результате каждый получит уже всего по 1.5мс на выполнение, что приведет к замедлению работы всей системы.

Почему?


Все дело в переключении контекста, которое подразумевает сохранение состояния процесса или потока с последующим его восстановлением и продолжением выполнения.

Каждый раз, когда процесс исчерпывает свое время на выполнение, и планируется очередной процесс, активируется переключение контекста, которое также занимает некоторое время.

Предположим, что на него уходит 1мс. В первом примере, где каждому процессу у нас отводилось по 8мс, это вполне допустимо. Так мы тратим 1мс на переключение контекста и 7мс на фактическое выполнение процесса.

А вот во втором примере на выполнение каждого процесса останется уже всего по 0.5мс – то есть большая часть времени уходит на переключение контекста, отсюда и проблема с выполнением.

Для того, чтобы исправить ситуацию, мы вводим новую переменную, которая определит минимальную протяженность кванта времени выполнения – min_granularity.

Представим, что min_granularity = 6мс, и вернемся к нашему примеру, где лимит времени равен 48мс при наличии 32 процессов.

С помощью той же формулы, что и прежде, мы получаем по 1.5мс на каждый процесс, но теперь такой вариант не допускается, так как min_granularity задает минимальный квант времени, который должен получить каждый процесс.

В данном случае, где Qi < min_granularity, мы берем Qi равным min_granularity, то есть 6мс, и соответствующим образом изменяем временной лимит. В результате он составит Qi x N = 6мс x 32 = 192мс.

На данный момент отличия между CFS и RR могут оказаться недостаточно наглядны, поскольку они оба определяют временные интервалы и организуют порядок выполнения процессов. Для лучшего обобщения и понимания различий между этими алгоритмами я приведу краткую таблицу:

RR – циклический список CFS – абсолютно справедливый планировщик
  • Квант времени статичен и не зависит от количества процессов в системе.
  • Квант времени динамичен и может изменяться в соответствии с количеством процессов в системе.
  • По исчерпанию процессом его кванта времени, RR выбирает очередной процесс с наименьшим виртуальным временем из циклического списка.
  • По исчерпанию процессом его кванта времени, CFS выбирает очередной процесс с наименьшим виртуальным временем из красно-черного дерева.

Надеюсь, что статься помогла вам лучше понять реализацию планирования задач в ядре Linux.

Прошу обратить внимание, что автор оригинальной статьи Eliran поблагодарил читателей за интерес и отдельно пригласил желающих со знанием английского языка в свой блог Coding Kaiser для ознакомления с множеством материалов по смежным и другим интересным темам, а также обмена идеями.

Комментарии (15)


  1. rvazh
    28.09.2021 23:28
    +3

    Спасибо, за статью. В статье есть небольшая ошибка в 'CFS задействует красно-черное дерево, которое балансируется двоичным деревом поиска – то есть добавление, удаление и поиск выполняются за O(logN), где N представляет количество процессов.'

    Вместо 'балансируется двоичным деревом поиска', стоило бы написать, что красно-черное дерево есть сбалансированное бинарное дерево поиска.


    1. rafuck
      29.09.2021 02:41
      +1

      Не просто «стоило бы». Мне на этой фразе стало настолько плохо, что расхотелось читать дальше.


    1. Bright_Translate Автор
      29.09.2021 05:33
      +1

      Благодарю, поправим.


  1. yatanai
    29.09.2021 00:43

    Это всё прекрасно, но почему когда я запускаю доту, в бубунту, у меня перестаёт работать ОС? (переключаюсь на браузер с дикими лагами)


    1. rafuck
      29.09.2021 02:43
      +4

      Если таки переключаетесь, и дота работает, то ОС работает и подавно


      1. yatanai
        01.10.2021 00:44

        Работать то работает, но пока она не загрузится я будто в слоумоушен с ОС взаимодействую. Когда в меню игры попадаешь то уже ничего не лагает. Такое себе удовольствие, скажу я вам


        1. Sly_tom_cat
          01.10.2021 22:31
          +1

          Памяти докупи что бы в своп пол системы дота не вытесняла.


    1. celebrate
      29.09.2021 10:56
      +1

      Это вам надо почитать про управление виртуальной памятью.


  1. ildar_vildanovich
    29.09.2021 05:35
    +2

    Спасибо за статью. Не могли бы вы подсказать (ткнуть на) статью, где схематично объяснялось бы как устроен линукс изнутри? Больше всего интересуют дерево каталогов, расширения файлов и файловые системы


    1. nick1612
      29.09.2021 08:20

      На счет статей не знаю, но могу посоветовать книгу Роберта Лава "Ядро Linux. Описание процесса разработки". В 13-й главе есть описание работы файловой системы с примерами кода.


    1. 13werwolf13
      29.09.2021 09:20
      +1

      д
      ерево каталогов можешь нагуглить по запросу "filesystem hierarchy standard"

      можно в формате pdf взять https://refspecs.linuxfoundation.org/FHS_3.0/fhs-3.0.pdf

      расширения файлов вешь такая, роли сильно не играет, линукс в отличии от винды узнаёт тип файла по загаловку а не по буковкам в имени

      а вот по поводу фс лучше гуглить много разных источников и читать их все, там много неявных моментов


    1. Pendel
      29.09.2021 17:00
      +1

      Поищите на youtube видеолекции от Computer Science Center. В открытом доступе есть видео по основам как операционных, так и файловых систем. Мне, как асболютному новичку, очень понравились.


    1. ildar_vildanovich
      29.09.2021 22:27

      Всем спасибо за советы


  1. FD4A
    29.09.2021 10:11
    +1

    Всегда полагал что единица планирования это поток, почему речь идёт о процессах?


    1. dlinyj
      29.09.2021 12:37
      +2

      Потому что поток — это частный случай процесса в linux.