Алгоритмы являются фундаментальными строительными блоками в программировании и играют важнейшую роль в современном мире, основанном на технологиях. Они представляют собой набор инструкций для эффективного выполнения задач, таких как сортировка данных, поиск в базах данных и составление прогнозов. Автоматизируя эти процессы, алгоритмы помогают экономить время, сокращать количество ошибок и принимать обоснованные решения. Они лежат в основе многих технологий, которые мы используем в повседневной жизни, от социальных сетей до электронной коммерции, и оказывают значительное влияние на различные отрасли, от финансов до здравоохранения.
Например, практически каждый современный графический редактор предоставляет своим пользователям множество полезных и удобных инструментов. Один из таких инструментов — функция заливки однородной области указанным цветом.
Работает она очень просто: необходимо выбрать желаемый цвет заливки и кликнуть указателем мыши на нужную область изображения. В результате выбранный регион изменит цвет на указанный. Этот механизм реализуется специальным алгоритмом, который носит название «метод „наводнение“», или, по-английски, flood fill.
В этой статье мы возьмём интересную задачу с собеседования, которую можно решить при помощи алгоритма flood fill, разберём её и познакомимся с несколькими вариантами решения. В этом поможет Евгений Бартенев, техлид и автор курса «Python-разработчик» в Яндекс Практикуме.
Постановка задачи
Графические редакторы — это не единственное место применения данного алгоритма. Схожие механизмы можно встретить и в других сферах, например:
Разработка игр. Заливка часто используется в разработке игр для реализации таких функций, как рисование, генерация рельефа и создание лабиринтов.
Компьютерная графика. Алгоритм заливки используется в компьютерной графике для таких задач, как заливка фигур цветом, обнаружение связанных областей и генерация текстур.
Компьютерное зрение. Заливка используется в компьютерном зрении для решения таких задач, как распознавание объектов, сегментация изображений и определение границ областей.
Генерация карт. Заливка может использоваться для создания карт путём заполнения регионов различными типами рельефа.
В целом алгоритм заливки является универсальным и широко используемым методом, который полезен во многих задачах.
Более того, задачи, которые можно решить, используя этот алгоритм, довольно часто встречаются на собеседованиях в различные ИТ-компании. Его возможные реализации базируются на фундаментальных знаниях, которыми должен обладать каждый современный разработчик.
Задача
В примере работы с графическим редактором речь шла о заливке выбранной однородной области изображения заранее указанным цветом. Но что такое изображение глазами разработчика? И что такое однородная область?
Изображение — это просто матрица, двумерный массив пикселей, каждый из которых содержит в себе информацию о цвете, а если точнее — о коде цвета.
Значит, можно сказать, что однородная область — это совокупность соседствующих ячеек матрицы, содержащих одинаковые значения.
Когда пользователь нажимает на какую-либо область изображения для её заливки, то фактически он указывает на одну из ячеек матрицы. Таким образом, задачу можно сформулировать следующим образом:
Дана матрица размером x строк и y столбцов. Каждая ячейка содержит целочисленное значение. Положим, что возможные значения для каждой ячейки лежат в диапазоне от 0 и до 1000 включительно.
Ваша задача — написать функцию FloodFill
, которая принимает четыре параметра:
matrix
— исходная матрица,x
иy
— координаты стартовой ячейки,newValue
— новое значение.
Задача функции — изменить значения для всей совокупности соседствующих ячеек на новые, если их значение идентично значению указанной ячейки.
Например, в результате вызова функции FloodFill
с параметрами (matrix, 3, 3, 66) матрица примет следующий вид:
Ячейка с координатами (3, 3) с изначальным значением 99, как и все её соседи с таким же значением, получила новое значение — 66.
Задача сформулирована, но как её решить?
Поиск решения
Быстрое решение, которое может первым прийти в голову, заключается в том, чтобы пробежаться по всем элементам матрицы и поменять значение у тех ячеек, в которых значение будет равно значению ячейки, указанной при вызове функции.
Такой простой подход позволит быстро выполнить задачу и закрасить выбранную однородную область. Однако если в матрице найдутся и другие однородные области с таким же изначальным значением, то будут закрашены и они. А этого нас никто делать не просил.
Такое быстрое решение тут не подойдёт.
Лабиринт
На используемую в задаче матрицу можно посмотреть и по-другому — например, как на лабиринт.
Оказавшись в определённой стартовой точке или ячейке этого лабиринта, можно принять следующие правила:
ячейки с таким же значением — проходимые;
ячейки с любыми другими значениями — непроходимые, или просто стены.
Тогда задача сводится к тому, чтобы исследовать этот загадочный лабиринт относительно стартовой ячейки, посетив все проходимые ячейки в пределах стен и поменяв их значения на новые.
Всего возможно четыре направления движения по лабиринту: влево, вправо, вверх и вниз. Тогда в общем виде алгоритм выполнения поставленной задачи будет выглядеть следующим образом:
Перейти в какую-либо проходимую соседнюю ячейку и обновить её значение.
Обойти все проходимые соседние ячейки из этой ячейки, обновляя их значения.
Вернуться в начальную ячейку.
Повторить алгоритм для всех остальных проходимых ячеек, смежных с изначальной.
Уже сейчас понятно, что алгоритм рекурсивный: для обхода всей доступной области нужно перемещаться в доступные проходимые ячейки и повторять одни и те же действия.
Тут возникает проблема зацикливания: если из ячейки А можно перейти в ячейку Б, то из ячейки Б можно перейти в ячейку А — и рекурсия будет бесконечной. Решить эту проблему можно, применив очень простую идею: нам не нужно идти в ту ячейку, в которой мы уже были ранее.
Тогда уточнённый порядок действий будет таким:
Выбрать направление движения из стартовой ячейки и выполнять движение в этом направлении до попадания в тупик.
После попадания в тупик нужно вернуться назад вдоль пройденного пути, пока не будет обнаружена смежная проходимая ячейка, в которой мы ещё не были, и двигаться в этом направлении.
Исследование лабиринта будет завершено при возвращении в стартовую ячейку.
matrix = [
[5, 777, 5, 777, 5, 99],
[5, 777, 777, 777, 5, 99],
[5, 5, 5, 5, 5, 99],
[67, 0, 99, 99, 99, 99],
[67, 0, 99, 99, 11, 11],
[99, 0, 99, 99, 11, 6]
]
def flood_fill(matrix, x, y, new_value):
x_len, y_len = len(matrix), len(matrix[0])
color = matrix[x][y]
if color == new_value:
return matrix
def fill(r, c):
if matrix[r][c] == color:
matrix[r][c] = new_value
if r >= 1: fill(r - 1, c)
if r + 1 < x_len: fill(r + 1, c)
if c >= 1: fill(r, c-1)
if c + 1 < y_len: fill(r, c + 1)
fill(x, y)
return matrix
print('Изначальная матрица:')
print('\n'.join('\t'.join(map(str, row)) for row in matrix))
flood_fill(matrix, 3, 3, 66)
print('Обновлённая матрица:')
print('\n'.join('\t'.join(map(str, row)) for row in matrix))
Запустите код и проверьте результат — в однородной области вокруг указанной ячейки должны поменяться значения.
С точки зрения оценки временной сложности производительность алгоритма зависит от количества пикселей в изображении и размера заполняемой области. Алгоритм выполняет один рекурсивный вызов для каждого пикселя в регионе, и в худшем случае все пиксели в регионе будут посещены. Поэтому временная сложность алгоритма заливки на основе рекурсии может быть выражена как O(m * n), где m и n — количество строк и столбцов в изображении.
Что касается пространственной сложности, то каждый рекурсивный вызов требует дополнительной памяти для хранения состояния функции, которое включает текущую позицию и цвет пикселя.
Неожиданное откровение
Решение получилось достаточно лаконичным, однако оно не всегда будет эффективным, особенно когда речь идёт о рекурсии.
Рекурсия — это способ организации обработки данных, при котором функция вызывает саму себя. Каждый вызов функции требует выделения памяти в стеке, например для аргументов и локальных переменных.
При большом количестве таких вызовов можно израсходовать всю память, выделенную под стек вызовов, или, иными словами, переполнить его, что обычно приводит к аварийному завершению работы. А иногда глубина рекурсии и вовсе может быть жёстко ограничена, и её может не хватить для решения задачи, например, при огромном количестве ячеек.
У изображения может быть большое разрешение, а это значит, что и сама матрица будет очень большой, то есть мы можем столкнуться с ограничениями рекурсии.
Рекурсивный процесс в общем, упрощённом виде можно представить как работника, который все дела откладывает на пятницу. В течение недели у него мало работы, а в пятницу завал. Но пятницы может и не хватить, чтобы всё доделать.
Возможно, этому работнику стоит делать все дела при первой возможности. Тогда его работа будет равномерно распределена по неделе, а пятница будет просто обычным рабочим днём. Именно так работает итеративный подход. Любой алгоритм, реализованный в рекурсивной форме, может быть переписан в итерационном виде, и наоборот. Для итеративного решения задачи можно воспользоваться такими структурами данных, как очередь или стек.
Попробуем решить эту же задачу по-другому — итеративно.
Уберём рекурсию из решения и заменим её на использование стека. В этом случае, как только ячейка просмотрена, она помещается в стек. При этом она будет считаться использованной, когда рядом с ней больше нет проходимых ячеек. Опишем это в коде.
matrix = [
[5, 777, 5, 777, 5, 99],
[5, 777, 777, 777, 5, 99],
[5, 5, 5, 5, 5, 99],
[67, 0, 99, 99, 99, 99],
[67, 0, 99, 99, 11, 11],
[99, 0, 99, 99, 11, 6]
]
def flood_fill(matrix, x, y, new_value):
x_len, y_len = len(matrix), len(matrix[0])
color = matrix[x][y]
if color == new_value:
return matrix
stack = [(x, y)]
while stack:
r, c = stack.pop()
if matrix[r][c] == color:
matrix[r][c] = new_value
if r + 1 < x_len:
stack.append((r + 1, c))
if r - 1 >= 0:
stack.append((r - 1, c))
if c + 1 < y_len:
stack.append((r, c + 1))
if c - 1 >= 0:
stack.append((r, c - 1))
return matrix
print('Изначальная матрица:')
print('\n'.join('\t'.join(map(str, row)) for row in matrix))
flood_fill(matrix, 3, 3, 66)
print('Обновлённая матрица:')
print('\n'.join('\t'.join(map(str, row)) for row in matrix))
Запустите программу на выполнение и удостоверьтесь, что код выполняет поставленную задачу.
Одним из отличий решения является то, что теперь мы используем собственный механизм работы со стеком, а не тот, что используется для рекурсивных функций. Это означает, что при необходимости мы можем контролировать размер стека и правильно останавливать алгоритм вместо того, чтобы просто позволить программе аварийно завершить работу.
Что касается временной сложности, то и рекурсивная, и итеративная реализации имеют одинаковую сложность O(m * n), где m и n — количество строк и столбцов в изображении соответственно. Это объясняется тем, что оба алгоритма посещают каждую ячейку в области не более одного раза.
Метод правой руки
Существует известный способ нахождения выхода из лабиринта, который носит название «метод правой руки». Суть его очень проста — вы кладёте правую руку на стену лабиринта и поддерживаете постоянный контакт, пока идёте по нему (конечно, вы можете использовать и левую руку вместо правой). Если все стены смежные, то метод правой руки гарантирует, что вы либо достигнете выхода, либо вернётесь к входу.
Но этот принцип можно использовать не только для поиска выхода из лабиринта, но и для решения нашей задачи. Причём решение, в основе которого лежит правило правой руки, позволяет достичь результата в условиях небольшого, ограниченного объёма памяти. А этого не позволяют сделать уже рассмотренные варианты решения.
Попробуйте самостоятельно придумать и реализовать алгоритм решения задачи методом правой руки. А если хотите написать решение, но пока не знаете как, то научиться решать подобные задачи вам поможет курс Яндекс Практикума «Алгоритмы и структуры данных».
Комментарии (14)
mobi
00.00.0000 00:00+4А я вот со времен ZX Spectrum помню, что "построчный" алгоритм куда более быстрый и экономный по памяти. Возможно, с тех давних пор какие-то еще алгоритмы появились. Рекурсивный же алгоритм может быть и хорош в образовательных целях, но статье все-равно явно не хватает ссылок на текущие "state-of-the-art" алгоритмы.
bartenev_ev
00.00.0000 00:00А у меня не было ZX Spectrum, но был его отечественный аналог "Дуэт" :) Это было прекрасное время.
Ну и конечно существуют разные алгоритмы заливки, кроме упомянутой рекурсивной заливки есть еще breadth-First Flood Fill, заливка по глубине, итеративная заливка, seed Fill и другие. Многие похожи друг на друга, отличаются некоторыми оптимизациями. На собеседованиях об этом достаточно часто спрашивают, поэтому даже как минимум учебную рекурсию стоит разобрать тем, кто планирует алгоритмическое собеседование.
yeputons
00.00.0000 00:00+1Что касается пространственной сложности, то каждый рекурсивный вызов требует дополнительной памяти для хранения состояния функции, которое включает текущую позицию и цвет пикселя. В наихудшем случае, когда заполняемая область охватывает всё изображение, максимальная глубина рекурсии будет равна количеству строк в изображении. Поэтому пространственная сложность алгоритма заливки на основе рекурсии может быть выражена как O(m).
Это категорически неверно по двум пунктам сразу.
Во-первых, почему именно строк, а не столбцов? Столбцов может быть на порядок больше. Никаких принципиальных отличий между строками и столбцами в алгоритме обхода в глубину (depth-first search, так называется ваш первый алгоритм) нет. Так что как минимум O(max(n, m)), оно же O(n+m).
Во-вторых, а с какого перепуга это наихудший случай? Вы ещё скажите, что наихудший случай для алгоритма сортировки — это когда массив отсортирован в обратном порядке. Не бывает просто "наихудших" случаев. Это вредное заблуждение. Бывают только случаи, максимизирующие или минимизирующие какую-то метрику. Тогда мало предъявить случай, надо доказать.
Например, довольно легко придумать пример, где глубина стека (по сути максимальная длина пути, которую пройдёт алгоритм, пока не упрётся в тупик) будет уже порядка n*m/2.
Лучше придумайте сами
.................... ###################. .................... .################### .................... ###################. .................... .################### .................... ###################. .................... .################### ....................
Здесь надо "залить" точки и не ходить по решёткам.
Если вам кажется, что ну уж это-то очевидно наихудший случай, то вы снова попались в ловушку. Не было ни слова доказательства про наихудшесть случая. Этот случай плохой, но не наихудший. Можно ещё хуже сделать. Я вот знаю пример с n*m*2/3, но тоже без доказательства, что это наихудший случай.
Хотя асимптотически уже неважно, оба случая будут O(n*m). И вот это уже доказывается без "наихудших случаев": в стеке вызовов (за исключением текущего фрейма) каждая ячейка может встретиться не больше одного раза. Доказательство закончено.
А ещё посылаю лучи ненависти новому редактору Хабра. Он уже один раз съел комментарий и не давал набирать текст в некоторых местах, уффф.
bartenev_ev
00.00.0000 00:00+2Приятно читать и отвечать на аргументированные комментарии внимательных читателей. Вдвойне приятно когда такое общение приносит продуктивный результат. Действительно сложность алгоритма заливки на основе рекурсии зависит от размера изображения или сетки, которую необходимо заполнить.
Когда необходимо заполнить всю сетку, сложность можно оценить как O(n * m). Это объясняется тем, что в этом случае каждая ячейка сетки должна быть обработана, и каждая ячейка занимает постоянное место в стеке вызовов.
Цель статьи не столько в том, чтобы научить читателя делать оценки сложности или показать чем отличаются понятия "наихудший и наилучший случаи" и "случаи, максимизирующие или минимизирующие какую-то метрику" - эти вопросы разбираются на соответствующем курсе по алгоритмам, а больше в том, чтобы показать пример реальной задачи из алгоритмической части интервью, показать возможные варианты её решения, а также предложить обсуждение темы. Тем не менее спасибо, что обратили внимание этот действительно важный момент!
gybson_63
00.00.0000 00:00graph = {(y, x): [] for y in range(height) for x in range(width) if f[y,x]!=COLOR}
далее очевидноyeputons
00.00.0000 00:00Это закрасит все точки такого цвета, а не только связные с той, куда вы ткнули. Например, если вы нарисовали двумерный домик на белом холсте и попытались закрасить пока что белые стены, закрасится весь лист, кроме очертаний домика.
gybson_63
00.00.0000 00:00Это само ничего не закрасит, это создаст для каждой точки список соседей такого же цвета. Далее вы начинаете из любой точки внутри области и обходите по этому графу все точки внутри этой области.
vnezvpn0
00.00.0000 00:00люблю хабр за это: ничего непонятно, но очень интересно, спасибо!
bartenev_ev
00.00.0000 00:00Ну это же прекрасно, когда одновременно и интересно и непонятно. Это значит, что впереди вас может ждать много интересных открытий и, надеюсь, приятных моментов на пути освоения новой области знаний, если конечно есть время и желание разобраться в этом вопросе :)
sci_nov
00.00.0000 00:00+1Приятно читать такие публикации :). Вопрос: как понять "Если все стены смежные?" Могут быть и не смежные? Авось пригодится где-нибудь, если попаду в лабиринт :).
Alexandroppolus
00.00.0000 00:00В своё время тоже пилил "наводнение". Было интересно придумать самому. В итоге, как потом выяснилось, сделал "построчный" вариант, правда с рекурсией. То что реализовано в статье - это называется DFS. У меня такой вариант не зашёл, почему-то работало медленно, видно где то накосячил..
rassant
00.00.0000 00:00Я бы реализовал бы его через метод пузырька. То есть от середины идет к краю... как волны от камня на воде.
echo10
есть книга Майкла Абраша, называется, по-видимому Zen of graphics programming
В русской редакции она выходила под названием "Таинства программирования графики". Там с вниманием к производительности рассматриваются задачи быстрого заполнения выпуклых (convex polygon) и невыпуклых многоугольников.
bartenev_ev
Хорошая книга и автор, особенно мне нравится его стиль изложения и подходы в решении задач, тоже рекомендую её всегда.