Когда у тебя в запасе много популярных инструментов вроде JAVA, Python, Ruby, PHP, C#, C++ и других, чувствуешь себя почти всемогущим. Стандартный подход в разработке рулит. Но только до тех пор, пока не столкнешься с определенным типом задач.

Подумайте, как правильно написать программу, которая оптимально…

• решит головоломку типа судоку или задачу о восьми ферзях;
• распределит задачи между определенным набором ресурсов;
• рассчитает расписание занятий;
• определит эффективный маршрут движения транспорта;
• составит график дежурств и т.п.
 
Если программирование в ограничениях и решение сложных комбинаторных задач планирования не самая сильная ваша сторона, то эта статья как раз для вас.

image

Возьмем в качестве примера одну из задач календарного планирования – расчет графика дежурств. Какие сложности могут возникнуть у программиста при выборе алгоритма расчета графика? На первый взгляд, все очень просто. Можно использовать простой алгоритм. Случайным образом или лучше последовательно равномерно распределять дежурства между сотрудниками.

image

Это идеальный вариант. Однако в реальной жизни все гораздо сложнее. Обычно существует множество дополнительных условий, которые обязательно надо учитывать. Сотрудники уходят в отпуска или переносят дни и, как следствие, появляются сдвиги. Становится еще сложнее, если требуется учитывать пожелания сотрудников, дежурства разбиты на несколько смен или выбор человека зависит от уровня его квалификации и так далее. В какой-то момент простой алгоритм перестает работать. Можно попытаться пойти другим путем – искать оптимальное решение среди множества всех возможных комбинаций. Однако здесь возникает другая проблема.

Сама по себе проблема оптимального распределения дежурных с соблюдением всех ограничений не нова. Существует уже более 40 лет и известна, как Nurse scheduling problem (NSP).

В чем сложность? Задачи планирования относятся к разделу математики комбинаторика. Обычно у такого рода задач бывает не одно, а множество вариантов решений и иногда очень большое. Простой пример. Сколькими способами можно составить график дежурств на период в 30 дней, когда каждый день дежурит один сотрудник из 10? Получается 10 в 30 степени (нониллион) способов. Если условия аналогичные, но сутки разбиты на три смены (один сотрудник в смене), получаем $A^{3}_{10}=8*9*10=720$ в 30 степени вариантов. Отыскать оптимальный вариант среди такого большого количества комбинаций методом полного перебора не под силу даже саму мощному компьютеру.
 
Еще одна сложность: большинство задач планирования входят в класс сложных комбинаторных задач NP-hard. Плохая новость в том, что для NP-hard задач нет эффективного универсального алгоритма (полиномиального), позволяющего найти доказуемо оптимальное решение за разумное время.

Хотя теоретически такой алгоритм может существовать, но вопрос до сих пор остается открытым (см. Равенство классов P и NP). Цена вопроса – 1 000 000$ (см. Задачи тысячелетия).

Хорошая новость: несмотря на отсутствие волшебной таблетки или серебряной пули, выход все-таки есть. Существуют различные подходы, позволяющие найти близкое к оптимальному решение для такого вида задач за приемлемое время.

Комбинаторная задача как задача удовлетворения ограничений


Для удобства решения комбинаторной задачи, ее можно представить в виде задачи удовлетворения ограничений (Constraint satisfaction problem, CSP). CSP состоит из простой описательной схемы: список переменных (variables), для каждой из которых задан набор возможных значений (domains), и список ограничений (constraints), которым переменные должны удовлетворять. Решением в CSP является нахождение всех возможных значений, которые переменные могут принимать в соответствии с условиями заданных ограничений.

Простой пример CSP

  • Переменные:
    $X\in\left\{1,2,3\right\}$
    $Y\in\left\{1,2\right\}$
    $Z\in\left\{1,2,3\right\}$
  • Ограничения:
    $X\neq Y$
    $X=Z$
    $Y<Z$
  • Решение:
    $X=2, Y=1, Z=2$
    $X=3, Y=1, Z=3$
    $X=3, Y=2, Z=3$

CSP не определяет конкретные алгоритмы решения. Существует много разных подходов. Некоторые из них можно представить так… 


Часто используются специализированные методы решения CSP, например, дерево поиска совместно с алгоритмом поиска с возвратом.

CSP и программирование в ограничениях


В области планирования и календарного планирования подходит и часто используется технология программирования в ограничениях (Constraint programming, CP). Компьютерная реализация алгоритмов для эффективного решения больших комбинаторных задач. В отличие от привычной формы императивного программирования, в CP используется декларативное. Это упрощает работу: достаточно только описать проблему, все вычисления и поиск значений выполняет решатель (Solver), содержащий эффективные алгоритмы вычислений.
 
Программирование в ограничениях неразрывно связано с задачей удовлетворения ограничений. Поэтому описанную ранее в качестве примера CSP, очень легко представить в виде программы.

Например, на языке MiniZinc она будет выглядеть следующим образом:

% VARIABLES
var {1,2,3}: X;
var {1,2}:   Y;
var {1,2,3}: Z;
 
% CONSTRAINTS
constraint X != Y; 
constraint X = Z;
constraint Y < Z;
 
% SOLVER
solve satisfy;
 
% OUTPUT
output ["X=", show(X), " Y=", show(Y), " Z=", show(Z)];

После завершения работы программа выведет все допустимые значения переменных в соответствии с заданными ограничениями: 
?
X=2 Y=1 Z=2
----------
X=3 Y=1 Z=3
----------
X=3 Y=2 Z=3
----------
 
Для программирования в ограничениях используются как отдельные среды программирования с поддержкой CP, так и подключаемые библиотеки в обычных языках программирования.

Подключаемые библиотеки:


Отдельные среды программирования:


График дежурств в формате CSP


Возьмем в качестве примера проблему расчета графика дежурств. Представим его в виде модели CSP. Условия задачи будут заведомо упрощенными и нести исключительно ознакомительный характер.

Легенда
  • Необходимо рассчитать график дежурств для 10 человек на период в 30 дней.
  • Каждый день в дежурстве участвуют два сотрудника, один заступает основным дежурным и второй резервным.
  • У каждого сотрудника за весь временной период общее количество основных дежурств должно быть больше или ровно трем.
  • На следующий день после основного дежурства сотрудник заступает резервным дежурным, далее следует один или более дней отдыха.

1. Исходные данные
  • n – количество дней в расчетном периоде (n=30)
  • m – количество дежурных (m=10)
  • d – индекс дня (d = 1,…,n)
  • e – индекс сотрудника (e = 1,…,m)

2. Переменные (VARIABLES)
Определим набор переменных Х в виде двухмерной матрицы. Порядок переменных в каждой строке соответствуют дням дежурств для определенного сотрудника.

$\underset{(m\times n)}X= \begin{bmatrix} x_{1,1}\ \ x_{1,2} \ \ ... \ \ x_{1,n} \\ x_{2,1}\ \ x_{2,2} \ \ ... \ \ x_{2,n} \\ ...\\ x_{m,1}\ \ x_{m,2} \ \ ... \ \ x_{m,n} \end{bmatrix}$


Домен допустимых значений для переменных:

$x_{e,d}\begin{cases} 1,& если\ сотрудник\ e\ основной\ дежурный\ в\ день\ d \\2, & если\ сотрудник\ e\ резервный\ в\ день\ d \\3,& свободный\ от\ дежурства\ день\ d\ для\ сотрудника\ e\end{cases}$


3. Ограничения (CONSTRAINTS)
В каждый день только один сотрудник может быть основным дежурным.

$\sum_{e=1}^m[x_{e,d}=1] \ =1\ \ \ \ \ (d=1, 2,...,n)$


Квадратные скобки – обозначение в нотации Айверсона

$[P]=\begin{cases}1,&если\ P\ true\\0,&если\ P\ false\end{cases}$


В каждый день только один сотрудник может быть резервным дежурным.

$\sum_{e=1}^m[x_{e,d}=2] \ =1\ \ \ \ \ (d=1, 2,...,n)$


Количество основных дежурств по каждому сотруднику за весь временной период должно быть больше или равно трем.

$\sum_{d=1}^n[x_{e,d}=1] \ \geq 3\ \ \ \ \ (e=1, 2,...,m)$


Определим детерминированный конечный автомат. Опишем порядок распределения дежурств. После основного дежурства сотрудник заступает резервным дежурным, далее следует один или более дней отдыха. Переходы между состояниями обозначены: main=1 – основное дежурство, reserve=2 – резервное дежурство, off=3 – день отдыха.

image

Описание состояний автомата в виде таблицы переходов:
image
Сформулировать задачу можно было разными способами. Например, представить набор значений X в виде трёхмерной матрицы с доменом значений один и ноль (третье измерение для трех типов дежурств). Или для каждого типа дежурств определить отдельную переменную.

Практическая реализация графика дежурств на MiniZinc


А теперь быть может самое интересное. Напишем реальную программу рассчитывающую график дежурств согласно заданным условиям CSP. В качестве среды программирования в ограничениях будем использовать MiniZinc.
MiniZinc – это высокоуровневый язык моделирования ограничений с открытым кодом. В отличии от других CP сред программирования он полностью независим от решателей (solver-independent). На MiniZinc легко строить модели разной сложности и экспериментировать с ними на решателях сторонних производителей. В арсенале языка содержится библиотека с большим количеством глобальных ограничений (Global constraints MiniZinc), а также есть возможность создавать пользовательские ограничения (предикаты). Это сильно упрощает моделирование прикладных проблем.

Независимость от решателей достигается за счет трансляции программ MiniZinc в более низкоуровневый код FlatZinc. FlatZinc через интерфейсы поддерживается большим количеством решателей.

MiniZinc доступен для использования на большинстве платформ (Windows, Mac OS, Linux), а так же имеет отдельное IDE.

Для более подробного знакомства с языком MiniZinc настоятельно рекомендуется прочитать руководство MiniZinc Tutorial, где в очень понятной форме описаны все особенности языка и есть много примеров.

Перепишем модель графика дежурств CSP в код программы MiniZinc, выполним программу и решим задачу.

include "regular.mzn";
 
%--------------------------------------------------
% 1. INITIAL DATA. Исходные данные
%--------------------------------------------------
 
int: n = 30;   
int: m = 10;
 
set of int: D = 1..n;
set of int: E = 1..m;
  
% функция переходов конечного автомата
array[1..4, 1..3] of int: dfa_states = [|2, 4, 3     
                                        |0, 4, 0     
                                        |2, 0, 3     
                                        |0, 0, 3     
                                        |];
                                        
%-------------------------------------------------
% 2.  VARIABLES. Переменные
%-------------------------------------------------
 
array[E, D] of var 1..3: X; 
 
%-------------------------------------------------
% 3. CONSTRAINTS. Правила
%-------------------------------------------------
 
% 3.1 В каждый день только один из сотрудников может быть основным дежурным
% 3.2 В каждый день только один из сотрудников может быть резервным дежурным
 
% Объединяем оба условия в одно через конъюнкцию /constraint 
    forall(d in D)(
          sum(e in E)( bool2int( X[e, d] = 1 )) = 1 
          /\ 
          sum(e in E)( bool2int( X[e, d] = 2 )) = 1  
    );
 
% 3.3 Количество основных дежурств по каждому из сотрудников, за весь временной период должно быть больше или равно трем
constraint 
  forall(e in E)(
         sum(d in D)( bool2int( X[e, d] = 1 )) >= 3
          /\ 
         regular( [X[e, d] | d in D], 4, 3, dfa_states, 1, 1..4 ) 
         % regular - глобальное ограничение, определяет значения набора переменных согласно правилам из функции переходов (dfa_states)
  );
          
%-------------------------------------------------
% SOLVE
%-------------------------------------------------
  
solve satisfy;   
    
%-------------------------------------------------
% OUTPUT
%-------------------------------------------------
 
array[1..3] of string: rest_view = ["M", "R", "-"];
 
output 
[ 
   rest_view[fix(X[e, d])] ++ " " ++
   if d = n then "\n" else "" endif
   | e in E, d in D
];


После завершения выполнения программы получаем один из возможных вариантов графика дежурств. Последовательность распределения дежурств для каждого сотрудника (горизонтальные строки), где M (Main) – основное дежурство, R (Reserve) – резервное дежурство, "-" – сотрудник не дежурит.

M R - - - - - - M R - - - - M R - - - - - - - - - - - - - -
R - - - - M R - - - M R - - - - - - - - - M R - - - - - - -
- - - - - - - M R - - - - - - M R - - - - - - - M R - - - -
- - - - - - M R - - - - - - - - M R - - - - - - - - M R - -
- M R - - - - - - - - - - - - - - - - - M R - M R - - - - -
- - M R - - - - - M R - - - - - - - - - - - M R - - - - - -
- - - - - - - - - - - - M R - - - - - M R - - - - - - M R -
- - - - M R - - - - - M R - - - - - - - - - - - - - - - M R
- - - - - - - - - - - - - M R - - - M R - - - - - - - - - M
- - - M R - - - - - - - - - - - - M R - - - - - - M R - - -


Или если это представить в более понятном виде, то так:
image

Если заранее известны даты отпусков, когда сотрудник не должен дежурить или, наоборот, нужно зафиксировать дежурство определенного сотрудника на конкретную дату, то это можно сделать через дополнительные ограничения. Например, чтобы пятый сотрудник был основным дежурным первого числа, а второй сотрудник не дежурил шестого, задаем ограничение:

constraint X[5,1]=1 /\ X[2,6]=3;

Чуть более сложный вариант программы (Hakan Kjellerstrand), можно найти здесь

Заключение


У счастливого обладателя молотка может возникнуть иллюзия, что инструмент подходит для решения любых проблем. Но молоток не универсален, а в некоторых случаях его преимущества совсем неочевидны. И таких случаев бывает много. Так и в программировании, некоторые задачи решаются неправильно или неоптимально, если не используются специализированные подходы. Программирование в ограничениях — это мощный инструмент, другая парадигма, помогающая эффективно решать большое количество практических комбинаторных задач.

Много полезной информации о программировании в ограничениях можно найти в блоге Hakan Kjellerstrand, также большое количество примеров задач MiniZinc здесь или здесь.

Ссылки по теме:
Nurse scheduling problem
Удовлетворение ограничений
Программирование в ограничениях
MiniZinc Home Page
MiniZinc Tutorial
The MiniZinc Challenge

Комментарии (5)


  1. UA3MQJ
    22.11.2017 10:09

    Спасибо! Я когда-то сам такое придумал на Erlang, но оказалось, что это и есть программирование в ограничениях. Ну или почти.


    1. trusted Автор
      22.11.2017 12:47

      Спасибо, интересная статья.
      Попробовал на MiniZinc решить вашу задачку с счастливым билетом. Рассчитывает все возможные комбинации номеров за несколько секунд.

      var 0..9: A;
      var 0..9: B;
      var 0..9: C;
      var 0..9: D;
      var 0..9: E;
      var 0..9: F;
      
      constraint (A + B + C) = (D + E + F);
      
      solve satisfy;   
      
      output [show(A), show(B), show(C), show(D), show(E), show(F)];
      


  1. vin2809
    22.11.2017 14:07

    Когда-то тоже пытался составлять расписание уроков, но без привлечения специфических знаний по математике… Жуть.
    Спасибо за статью, дали пищу для размышлений.


  1. i_osipov
    22.11.2017 21:02

    Спасибо за статью. Интересная тема, а ниже вопросы.
    Как вы интегрируете MiniZinc и вашу систему? Есть специальные Runner'ы, которым скармливаются исходные переменные и конфигурация ограничений или как-то иначе?
    Это упрощенный пример из реального применения? Если да, то как много времени обычно занимает построение расписания?
    При изменении исходных данных вы перестраиваете расписание целиком? Как в этом случае учитывается та часть расписания, которую уже нельзя изменить? Ограничения?


    1. trusted Автор
      23.11.2017 08:59

      1. С идеологической точки зрения, наверное, не совсем правильно интегрировать систему с MiniZinc. MiniZinc в большей мере предназначен для разработки моделей и их проверки на наборе различных солверов. Далее в своей программе, на конкретном языке программирования можно уже использовать нужный солвер, подключая его как библиотеку. При этом не обязательно переписывать модель, созданную в MiniZinc на конкретный солвер, можно ей подкладывать промежуточный код FlatZinc. Хотя, ничто не мешает из своей программы вызывать консольные утилиты MiniZinc и формировать ответ в формате XML, а потом проводить обработку в программе.
       
      2. Пример не совсем реальный, скорее это некая его основа, затравка. Настоящая модель гораздо больше и сложнее. Если у вас есть наработки для различных требований, то время разработки занимает не очень много времени.
       
      3. Целиком расписание перестраивать не требуется. Если часть данных известно или уже была рассчитана ранее, то они указываются как ограничения и значения вычисляются для оставшейся половины.