Сложность алгоритмов, или почему O(n) лучше O(2^n) / forpes.ru

Главная
Сложность алгоритмов, или почему O(n) лучше O(2^n)

Сложность алгоритмов, или почему O(n) лучше O(2^n) +2

18.08.2025 05:46

Analitiq 7 3500 Источник

Предлагаю разобраться, как правильно оценить код с точки зрения его скорости выполнения.

Прежде всего надо выяснить, что мы понимаем под эффективным алгоритмом. Попробую дать авторское определение: эффективный алгоритм - код, который выполняется с минимальным использованием вычислительных ресурсов процессора. Соответственно, неэффективный алгоритм, наоборот, требует больше ресурсов и, соответственно, больше времени для выполнения.

Давайте рассмотрим, что же такое «хороший» и «плохой» алгоритм, на примере простой задачи с leetcode.

Условие: на вход поступает массив целых чисел. На выходе необходимо вывести массив, в котором все нули расположены в конце, а остальные числа сохраняют свой порядок.

Пример

Вход: 7 0 1 15 0 0 3 9 0 25
Выход: 7 1 15 3 9 25 0 0 0 0

«Плохое» решение:

def solution1(nums):
    i = 0
    n = len(nums)
    while i < n:
        if nums[i] == 0:
            ind = i
            for j in range(ind + 1, len(nums)):
                nums[ind], nums[j] = nums[j], nums[ind]
                ind += 1
            n -= 1
        else:
            i += 1
    return nums

Идея первого решения заключается в том, чтобы последовательно сдвигать каждый ноль по отдельности вправо, пока все нули не окажутся в конце массива.

«Хорошее» решение:

def solution2(nums):
    i = 0
    for j in range(len(nums)):
        if nums[j] != 0:
            nums[i], nums[j] = nums[j], nums[i]
            i += 1
    return nums

В основе второго решения лежит метод двух указателей, в котором nums[i] указывает на ноль. Если nums[j] не указывает на ноль, то значения указателей меняются местами, и нули перемещаются в конец массива.

Измерим время выполнения каждого алгоритма на одинаковых входных данных с помощью встроенной библиотеки timeit. Важно уточнить, что считается среднее время 1 000 000 итераций кода.

Время выполнения первого решения: 0.00000422994859999744 сек.

Время выполнения второго решения: 0.00000132772239999031 сек.

Несмотря на то, что второе решение выполнилось быстрее первого, оба алгоритма работают весьма за оптимальное время. Но что будет, если размер входных данных увеличится в 10^4 раза? Давайте проверим. На этот раз возьмем среднее арифметическое 10 итераций.

Время выполнения первого алгоритма: 84.48735556000028168455 сек.

Время выполнения второго алгоритма: 0.01210930999950505724 сек.

Легко заметить, что при масштабировании входных данных первый алгоритм резко деградировал, а второй всё также сохранил свою эффективность.

Проверять каждый раз эффективность алгоритма, замеряя время выполнения программы, неудобно и не совсем точно. Чтобы избежать лишних сложностей, обратимся к О-большому (Big O Notation). Это математическая нотация, которая помогает определить сложность алгоритма от размера входных данных без необходимости замерять время. О-большим принято оценивать сложность алгоритма в худшем случае. Рассмотрим на примере.

Допустим у нас есть три массива с одинаковым размером. Нужно написать алгоритм, который находит число 256 и выводит YES, если число есть, иначе NO

Входные данные

nums1 = [1, 3, 5, 17, 29, 10, 256]
nums2 = [1, 3, 5, 555, 17, 29, 10]
nums3 = [256, 1, 3, 5, 17, 29, 10]

def solution(nums):
    for x in nums:
        if x == 256:
            return 'YES'
    return 'NO'

Анализ трех массивов показывает, что программа с nums1 и nums2 займет больше всего времени и, соответственно, выполнит больше действий, так как искомое число в первом случае находится в конце, а во втором отсутствует. Быстрее всего выполнится код с nums3, так как 256 находится в начале массива.

Вывод: несмотря на то, что скорость выполнения при nums3 быстрее, чем при nums1 или nums2, в общем случае алгоритм описывается по наихудшему сценарию, то есть O(n) - линейная сложность.

Еще один пример квадратичной сложности

nums = [8, 1, 5, 2, 7, 4, 9, 0, 3, 6]
for x in range(len(nums)):
    nums.remove(x)

O(1) — Доступ к элементу массива
O(log n) — Бинарный поиск
O(n) — Линейный проход по массиву
O(n log n) — Быстрая сортировка
O(n²) — Два вложенных цикла
O(2^n) — Перебор всех подмножеств множества

Нужно ли оценивать сложность алгоритма на постоянной основе? Это важно, но не всегда необходимо. Нужно понимать, что оценивать сложность алгоритма и оптимизировать надо с умом. Например, если вы пишете код для работы с небольшим количеством данных, можно этим пренебречь. Но если вы разрабатываете высоконагруженный сервис, то без оценки сложности далеко не уедешь.

Комментарии (7)

Yonker
18.08.2025 06:13
#28721226
Было бы полезным указать случаи, при которых O(n) может быть хуже, чем O(n^2), так как значение n в зависимости от алгоритма бывает разным
1. Dair_Targ
  18.08.2025 06:13
  #28721264
  Так принадлежность f(x) классу функций O(g(x)) вообще не гарантирует поведение хоть где-то, кроме x -> inf по определению.
1. Zenitchik
  18.08.2025 06:13
  #28721756
  n зависит не от алгоритма, а от поступивших в него данных. От алгоритма может зависеть константа.

Zenitchik
18.08.2025 06:13
#28721752
Картинка неправильная. O(1) - это телепортация.

Nemoumbra
18.08.2025 06:13
#28722242
Ни о чём статья. Таких я видел уже дофига, но вот почему-то до сути не доходит никто. У меня есть знакомый, дал я как-то ему задачу на префиксные суммы - научиться быстро вычислять суммы на подотрезках массива, если к массиву не делаются запросы на модификацию. Он написал на каждый запрос лобовое суммирование за линию. Я говорю ему, что надо бы побыстрее, так он стал в цикле в сумму докидывать сразу i'ый и N-i'ый элементы, мол, O(n/2). К чему я это - тема алгоритмической сложности довольно неочевидна, тут ботать надо плотно. Ни разу в научпопе не видел, чтобы объясняли, почему мы не пишем константы.

Кстати, о константах. Автор, вы бы как предпочли проверять на простоту: "до корня", т.е. за экспоненту, или за O(N^6)? Алгоритм АКС как раз за полином работает, берём его?

apevzner
18.08.2025 06:13
#28722494
Надо не забывать еще, что в реальной жизни кроме асимптотического приближения есть еще и коэффициент. И алгоритмы с хорошей асимптотой имеют тенденцию обладать большим коэффициентом. И поэтому могут проигрывать простым алгоритмам, когда данных мало.

Aleks_buuuu
18.08.2025 06:13
#28725566
Очень хорошее объяснение! Понравилось, что сначала показан реальный пример с измерением времени, а потом плавно подвёл к О-большому. Это помогает понять, зачем вообще нужна асимптотическая оценка. Единственное, что можно добавить — что Big O описывает лишь порядок роста, но константы тоже играют роль. Иногда алгоритм с худшей асимптотикой может оказаться быстрее на малых входных данных, и это тоже важно учитывать в реальной разработке.

Сложность алгоритмов, или почему O(n) лучше O(2^n) +2

Комментарии (7)

Yonker

Dair_Targ

Zenitchik

Zenitchik

Nemoumbra

apevzner

Aleks_buuuu