Бинарный поиск в микроконтроллере / forpes.ru

Главная
Бинарный поиск в микроконтроллере

Бинарный поиск в микроконтроллере +4

10.02.2021 05:00

FDA847 18 3000 Источник

Алгоритм бинарного поиска или поиска делением пополам известен давно. В данной статье будет рассмотрен пример его «железячной» реализации на 8-битном микроконтроллере и особенностях, которые возникают при этом.

Одно время мы выпускали несложный контроллер облачной СКУД на 100 пользователей. В его основе лежал микроконтроллер PIC18F46K22. В качестве памяти для хранения кодов ключей пользователей использовалась FLASH-память с интерфейсом I^₂C ёмкостью 64 кБ. Сама «флешка» довольно быстрая, но на шине I²C находилась ещё микросхема часов DS1307, которая работает на скорости не выше 100 кбит/сек. Высокой скорости работы нам не требовалось, поэтому в итоге вся шина была запущена на частоте 100 кГц.

Однако со временем мы начали разрабатывать новую версию контроллера, поддерживающего уже 3000 пользователей. Не хотелось сильно менять архитектуру, поэтому основные узлы были сохранены, но при этом был увеличен объём FLASH-памяти до 256 кБ.

И вот тут возник один интересный момент. В первой версии поиск ключа в памяти осуществлялся простым перебором всех 100 ключей. Этот процесс занимал долю секунды и поэтому каких-либо оптимизаций кода не производилось. Но при количестве в 3000 записей это время увеличилось в 30 раз, что оказалось недопустимым, так как у пользователя появлялась неприятная задержка между считыванием карты и открытием замка.

Решить данную проблему можно двумя способами. Первый – аппаратный вариант, предполагающий использование более быстрого интерфейса с «флешкой», например, SPI. Скорости чтения здесь на два порядка выше, чем при использовании I²C. Это, так сказать, решение «в лоб». Неудобство лишь состоит в том, что приходится закладывать в устройство новый компонент, переделывать код и печатную плату. Плюс потребуются дополнительные линии микроконтроллера для подключения такой микросхемы памяти.

Но есть и другой способ – программный. Заключается он в переделке самой процедуры поиска. Изначально она выглядела так:

typedef struct
{
    uint32_t COD;				
    uint8_t nSchedule;
} TSKUD_User;

bool skudFindUserByCode(uint32_t pCOD)
{
  TSKUD_User user;

  for (uint8_t i = 0; i < SKUD_USERS_COUNT; i++)
  {
    skudReadUser(i, &user);

    if (user.COD == pCOD)
      return 1;
  }

  return 0;
}

Функция skudReadUser считывала блок данных из I²C памяти, далее осуществлялась проверка на совпадение кода.

При ста пользователях в худшей случае (когда код находился в самом конце массива данных) время поиска занимало порядка 0,1 сек. При переходе же к 3000 пользователей время выросло 3 сек!

Поэтому для ускорения функция была переписана следующим образом:

bool skudFindUserByCode(uint32_t pCOD)
{
  TSKUD_User user;
  int16_t m, beg, end;

  beg = 0;
  end = SKUD_USERS_COUNT - 1;

  while (beg <= end)
  {
    m = (beg + end) / 2;

    skudReadUser(m, &user);

    if (pCOD == user.COD)
      return true;

    if ((pCOD < user.COD) || (user.COD == 0))
      end = m - 1;
    else
      beg = m + 1;
  }

  return false;
}

Это классический вариант реализации алгоритма, работающий на отсортированном по возрастанию массиве данных. В нашем случае это не составляет проблемы, так как данные грузятся с сервера, который и осуществляет их сортировку перед отправкой в контроллер.

О различных частных случаях при реализации бинарного поиска можно почитать в статье: «Я не могу написать бинарный поиск».

Итак, рассмотрим работу алгоритма. Переменные beg и end задают начальный и конечный индекс массива данных. На каждой итерации мы вычисляем индекс m, который находится посередине между beg и end, и сравниваем требуемое значения ключа с тем, что находится по этому индексу. В этом случае возможны три варианта:

Если значения совпадают, то мы нашли нужный ключ и можно открывать замок.
Если номер искомой карты меньше, то следует его искать в левой части массива. Тут мы отбрасываем сразу половину заведомо не подходящих вариантов. Индекс end теперь будет равен m – 1.
Если номер искомой карты меньше, то следует его искать в правой части массива. Так же отбрасываем сразу половину заведомо не подходящих вариантов, но меняем индекс beg (он будет равен m + 1).

Если в массиве данных вообще нет искомого значения ключа, то нам нужно выйти из цикла. Условием выхода является beg > end.

Очень важным является дополнительное условие user.COD == 0 в строке:

    if ((pCOD < user.COD) || (user.COD == 0))

Дело в том, что неиспользуемые элементы массива данных мы просто заполняем нулями. Реально это происходит так. Из базы данных получается отсортированная по значению кода карты выборка пользователей. Эта информация записывается в массив данных, начиная с нулевого индекса. Остальные значения дописываются нулями:

Индекс	Значение
0	1307131
1	1308780
2	1318001
3	2174082
4	2290467
5	2291521
...	0
2996	0
2997	0
2998	0
2999	0

Можно было бы записывать туда значения 0xFFFFFFFF, но его мы используем в качестве сервисного для служебных нужд системы. Поэтому дополнительное условие user.COD == 0 всегда «заставляет» алгоритм искать код в левой половине массива данных.

Кто-то может справедливо заметить, что нет смысла тогда вообще обрабатывать эти нулевые значения. Но дело в том, что мы не передаём в контроллер реальное количество карт доступа. Изначально для 100 карт это не имело смысла (поиск и так работал очень быстро), а потом мы просто не стали менять структуру данных. Но, по большому счёту, это и не нужно, так как бинарный поиск очень сильно ускоряет работу.

Рассмотрим следующий пример. Пусть у нас имеется полный массив из 3000 записей. Пользователь подносит ключ и мы должны проверить, есть такая карта или нет. При линейном поиске нам понадобится в худшем случае просмотреть все записи. Итого нужно будет сделать 3000 сравнений.

А вот при бинарном поиске количество сравнений будет составлять log₂3000 ? 11 шт!

Интересно, что если записей будет аж 4 миллиарда, то количество сравнений при использовании бинарного поиска увеличится всего лишь до 32!

Попробуем пошагово проверить алгоритм бинарного поиска на вышеприведённой табличке. Допустим, нам требуется найти значение ключа 2174082.

Итерация	beg	end	m	Код искомой карты	Код карты в массиве по индексу m
1	0	2999	1499	2174082	0
2	0	1498	749	2174082	0
3	0	748	374	2174082	0
4	0	373	186	2174082	0
5	0	185	92	2174082	0
6	0	91	45	2174082	0
7	0	44	22	2174082	0
8	0	21	10	2174082	0
9	0	9	4	2174082	2290467
10	0	3	2	2174082	1318001
11	3	3	3	2174082	2174082

В итоге мы за 11 итераций нашли искомое значение. Важно понимать, что 11 итераций это максимальное время поиска. В вышеприведённом примере в случае, если бы мы искали значение 2290467, то количество итераций было бы равно 9.

Так в чём преимущество такого решения? В начале статьи я указывал, что алгоритм реализовывался на микроконтроллере. Использование крайне дешёвой памяти с интерфейсом I^₂C снижает общую себестоимость изделия, а новый алгоритм поиска сильно уменьшает время реакции контроллера.

Всегда интересно посмотреть как реализации алгоритмов работают «вживую». Для этого я снял два небольших видео, где показана работа контроллера в двух вариантах: с линейным поиском и бинарным. Нужное значение карты памяти я специально внёс в самый конец списка (индекс 2999), чтобы можно было оценить работы обоих алгоритмов в худшем случае.

Вот работа линейного поиска:

А вот бинарного:

Результат, как говориться, на лицо!

Комментарии (18)

alexxisr
10.02.2021 08:13
#22662586
А если для неиспользуемых использовать 0xFFFFFFFЕ? ТОгда можно убрать проверку на ноль в цикле. Правда служебные тогда будут располагаться после неиспользуемых — чуть усложнится алгоритм подготовки загрузки.
Хотя, можно же просто неиспользуемые нули в начале массива расположить. Тогда логика работы контроллера вобще не поменяется.
Еще вариант — сортировать по убыванию — тогда нули останутся в конце (возможно это упростит загрузку), а в поиске просто поменять сравнения на противоположные.

FDA847 Автор
10.02.2021 08:18
#22662598
Можно и так. Вероятность того, что попадётся карта с таким номером пренебрежимо мала. С другой стороны, доп. сравнение с нулём в цикле практически ни на что не влияет. Там ведь сравнений не более 11. Изначально мы себе просто задачу упростили на стороне сервера, когда готовили список карт. Делаем выборку из базу, заполняем массив, остальное дописываем нулями. А впоследствии при расширении функционала системы решили по максимуму вписаться в существующую структуру.

SGordon123
10.02.2021 08:56
#22662676
А есть разница в скорости читать 1 байт из флэша или блок? Небось как раз накладных задержек бы хватило, и не нужен гемор с перезаписью сортированных кодов??
1. FDA847 Автор
  10.02.2021 09:27
  #22662760
  Не понял, при чём тут гемор с перезаписью кодов? При добавлении нового пользователя в любом случае перезаписывается весь массив в контроллере. Но этот процесс нечастый (пользователей не добавляют каждый день), поэтому проблемы нет. А серверу без разницы в каком виде отдавать список. Он уже из базы получается отсортированный по номеру ключа.
  1. SGordon123
    10.02.2021 09:39
    #22662810
    Ну можно поберечь ресурс флэшки и в конец приписать… Скорость больше интересует как меняется, можете написать сколько секунд читаете 3 000 записей за раз?
    
    FDA847 Автор
    10.02.2021 10:02
    #22662914
    Промахнулся в ветке. Ответил ниже

DjPhoeniX
10.02.2021 09:54
#22662876
Решение «считать количество элементов при записи во флеш» прямо на МК приходит прямо само. Записи всё равно проходят сквозь RAM, добавить один цикл с простым счётчиком, и в итоге рядом с массивом же его и записать.
1. FDA847 Автор
  10.02.2021 10:00
  #22662900
  Так-то так, но что в итоге выиграем? Вместо 11 сравнений будет, например, 10, в случае заполненности массива карт наполовину. Ну а если будет 5 сотрудников в базе, то количество сравнений может быть, конечно, всего 3. Но опять же, это какие-то единицы миллисекунд экономии. Поэтому мы и пошли более простым путём.

FDA847 Автор
10.02.2021 09:56
#22662886
У нас во флешке хранится две структуры данных:
1. База пользователей. Она меняется крайне редко. Ресурс в 4 млн. перезаписей исчерпан никогда не будет.
2. Журнал событий. В него пишется постоянно при проходе сотрудников. Там организован кольцевой буфер как раз для равномерного использования всех блоков флеш-памяти.
Само чтение 3000 записей занимает порядка 3 сек. Но там есть ещё накладные расходы из-за того, что мы читаем не последовательно всю память, а каждую запись отдельно. Если считывать весь массив линейно, то это время будет порядка 1,5 сек, что для данной задачи тоже много.

Buhram
10.02.2021 11:24
#22663458
Предполагается, что база номеров ключей всегда будет отсортированной? Или номера ключей просто выбираются подряд? А если нужно будет несколько их них отключить и, вместо них, создать новые?
1. FDA847 Автор
  10.02.2021 11:33
  #22663524
  Список всегда отсортированный. Он берётся с сервера. Соответственно, при любом изменении он заново загружается в контроллер. Поэтому все операции выполняются пользователем системы как раз на сервере. Там же помимо самих ключей ещё настраивается время доступа.

Sdima1357
10.02.2021 12:06
#22663768
В Вашем случае эффективнее использовать Hash Table. Поиск будет о(1).
1. FDA847 Автор
  10.02.2021 12:10
  #22663810
  Да, тоже интересный вариант. Но в данном случае уже особо ускорять нечего. А вот при работе Web-интерфейса мы как раз хеш-таблицу и используем. При формировании динамического содержимого мы вместо текстовых меток подставляем нужные значения. И чтобы не делать громадную кучу сравнений строк просто вычисляем хеш и по нему мгновенно находим требуемое значение.
1. ionicman
  10.02.2021 14:19
  #22664728
  С хэш тадблицей можно оптимизировать, но для поиска, емнип, там тоже деление пополам и будет применяться. Но зато добавятся коллизии.
  1. Sdima1357
    10.02.2021 16:25
    #22665546
    Только коллизии. И поиск О(1). Вдобавок изменения могут быть инкрементальные. Не надо переписывать всю базу, а только изменения.

alexryzhov
10.02.2021 12:18
#22663876
Решал такую же задачу как вы — тоже СКУД, тоже PIC18, тоже медленная flash, карт до 96 тыс.
Сначала тоже использовал бинарный поиск «в лоб».
Но с ним были проблемы:
— необходимость перезаписи всего списка карт при малейших изменениях (долго, если контроллеры на rs485)
— временное нарушение консистентности базы на контроллере во время ее перезаписи
— износ flash

В полях были уже десятки тысяч таких контроллеров, надо было как-то решать эти пробемы в т.ч. на них — без возможности апгрейда железа.

В итоге переделал на красно-черное самобалансирующееся бинарное дерево, размещенное в виртуальном адресом пр-ве, которое замаплено в физические сектора flash картой, которая тоже размещена во flash. Это если кратко.
Несмотря на всю мудренность этого решения получилось сделать так, что PIC сам особо про сложности не знает, т.к. знает только как читать. И чтение работает только за логарифмическое время.
Сервер системы же присылает контроллерам апдейты в виде потоков записей в память, финальным из которых подменяется таблица маппинга и так транзакционно все переключается на новый список. Ну там даже не просто список карт, там еще всякие автономноые логики, графики доступа и прочее.
Думаю это самое сложное, что я делал в СКУД. Доволен собой ;)

spam-receiver
13.02.2021 18:42
#22678302
-1
Существует элементарное решение, которое не требует никакого быстродействия вообще, где количество пользователей ограничено лишь объёмом используемой энергонезависимой памяти. Просто нужно уметь по-другому смотреть на проблему. Советую почитать книгу Джеральда Надлера и Шозо Хибино «Мышление прорыва».

spam-receiver
13.02.2021 19:58
#22678602
-1
Хочется заинтриговать человека, чтобы поднапряг мозги, нарастил немножко нейросеть. Пригодится же для будущих решений. Даже в школе нужно уметь задачки решать, а не получать от учителей готовые ответы на все вопросы.

Бинарный поиск в микроконтроллере +4

Комментарии (18)

FDA847 Автор

FDA847 Автор

FDA847 Автор

FDA847 Автор

FDA847 Автор

FDA847 Автор

FDA847 Автор