И еще немного о QR кодах / forpes.ru

Главная
И еще немного о QR кодах

И еще немного о QR кодах +8

30.12.2025 14:23

malkovsky 5 11000 Источник

Изначально я хотел написать статью про коды Рида-Соломона с иллюстрацией на примере работы QR кодов, в процессе подготовки сделал инструмент для визуализации промежуточных этапов построения QR кодов и обнаружил что у меня уже есть достаточно отсутствующего на хабре материала, в связи с чем немного поменял план. Кому не интересно читать, QR с КДПВ сгенерированы с помощью qr-verbose

pip install qr-verbose

Документация (англ.)

Про QR коды на хабре писали много, например одна из самых популярных статей за всё время "Читаем QR код" и куча переводных статей. К сожалению у этих статей есть кое-что общее: если вы попытаетесь прочитать код версии 4 и больше а также некоторые коды версии 3 следуя описанию из статей, то потерпите фиаско. Не верите? Попробуйте прочитать нижний код с КДПВ.

В статье напомню как устроен QR код и какие проблемы начинаются с версии 3, а также надеюсь, что qr-verbose поможет разобраться тем, кто еще не разобрался.

Как читать QR код, опять

Итак, берём QR код

qr-verbose -m 0 -v 3 \
    -t regular \
    -e M \
    -o a_zachem_regular.png \
    t.me/a_zachem_eto_nuzhno

Сначала определяем метаданные

qr-verbose -m 0 -v 3 \
    -t color \
    -e M \
    -o a_zachem_colors.png \
    t.me/a_zachem_eto_nuzhno

Итак, на что здесь стоит смотреть:
Коллеги! Почему-то не отображаются цвета при использовании <span style="color: ... "></span>, напишите если как-то можно задать произвольный цвет для текста, чтобы описание было более наглядное

3 больших красных квадрата - шаблон поиска, эти квадраты всегда обрамлены белой границей из битов
Черно-белые полоски c фиолетовой границей - информация о уровне коррекции ошибок и маске данных. Уровней коррекции ошибок всегда 4: L (~7%), M (~15%), Q (~25%), H (~30%), в скобках указано доля ошибок, которое можно восстановить. Доля символов коррекции в два раза больше указанной. Маска - один из 8 шаблонов, с которым нужно будет потом поXORить данные, маска предназначена для исключения из итогового QR кода шаблонов, запутывающих сканеры. Первые 2 бита отвечают за уровень коррекции 01-L, 00-M, 11-Q, 10-H. В нашем случае это M. Биты 2-4 задают маску, оставшиеся 10 бит -- биты коррекции систематического кода BCH(15, 5), наконец нужно эти 15 бит поXORить с определённой в стандарте константой 10101 00000 10010и получившиеся биты записать, все эти 15 бит дублируются, номера отмечают индекс бита.
Горизонтальная и вертикальная полоски с чередующимися битами красно-лилового цвета, соединяющие большие квадраты - это тайм шаблон, предназначенный для удобного получения информации о размере кода, в этих полоскам номера бит отсутствуют.
Зеленый квадрат - шаблон выравнивания, также служит для помощи при сканировании.
Оранжевый квадрат из 4 бит в правом нижнем углу - начало данных, к нему применяется маска и он участвует в формировании блоков коррекции ошибок, как и все последующие данные. В этих 4 битах хранится информация о методе представления данных. В нашем случае это режим по умолчанию - байтовый ввод.
Следующий за ним фиолетовый блок из 8 бит содержит информацию о длине закодированного сообщения, так же как и информация о режиме кодирования подвержена маскированию и участвует в формировании блоков коррекции ошибок.
Оставшиеся участки QR кода разбиты на блоки по 8 бит (за исключением одного блока из 4 бит), из которых образуются байты. Синие байты -- исходные данные, желтые - байты коррекции ошибок. Блоки данных с красной границей -- реальные исходные данные, с зеленой -- паддинг.

Внутри каждого байта подпись в формате <индекс_байта>:<индекс_бита>. Байты нумеруются в порядке змейки

биты в порядке движения сначала обрабатывая правый бит

Едем дальше, давайте уберём маску

qr-verbose -m -1 -v 3 \
    -t color \
    -e M \
    -o a_zachem_colors.png \
    t.me/a_zachem_eto_nuzhno

Обратите внимание, что теперь оставшиеся 7 бит слева над нижним красным квадратом стали нулевыми, режим кодирования 0100 соответствует байтовому кодированию, в длине записано число 24 (отмечу, что 0 соответсвует старшему биту, но конкретно для числа 24 это не имеет значение), а в 24-ый блок содержит 4 нулевых бита, это стандартный нулевой терминатор, после него идут паддинговые байты одного из двух значений 17, 236. А вот и более наглядно с переводом в ASCII, попутно добавляю лого, чтобы было видно какие байты оно закрывает (да, лого именно закрывает байты, QR код всё еще можно просканировать за счет кодов дополнительных байтов избыточности кода Рида-Соломона, хоть предназначались они не для этого)

Что происходит начиная с версии 3

Давайте посмотрим на код из КДПВ и проделаем для неё все тоже самое, что делали выше

qr-verbose -m -1 -v 3 \
    -t ascii \
    -e Q \
    -o misterious_ascii.png \
    "Happy new year, Habr!"

Как же так? Раньше там была вполне содержательная информация: жалкая попытка незаметно впихнуть рекламу личного блога, а теперь просто какая-то биллиберда. Проблема возникает на этапе построения кодов Рида-Соломона, если быть точнее, то на этапе разбиения и укладки данных. Дело в том, что как и с BCH(15, 5) кодом, так и с кодом Рида-Соломона QR используется систематическое кодирование - это когда исходное сообщение является частью закодированного сообщения, это и позволяет прочитать сообщения в предыдущем случае просто игнорируя то, что записано в дополнительных байтах. У кодов Рида-Соломона есть ограничение на размер блока данных: если код построен над полем $\mathbb{F}_q$ , то блок не может быть размером больше . В QR кодах Рид-Соломон работает над полем $\mathbb{F}_{256}$ - самым удобным с практической точки зрения, это накладывает на ограничение размера блока в 256 элементов. Решение этой проблемы оказалось простым: данные образуют не один блок коррекции, а несколько, и как раз первый раз два блока появляются в QR коде версии 3 с уровнем кодирования Q. На этом этапе уже важно понимать как именно происходит кодирование, по крайней мере часть про разбиение данных.

Во-первых, кодирование происходит не на байтах, из которых составлены символы, вместо этого они заново нарезаются по байтам начиная с данных режима кодирования и заканчивая нулевым терминатором, следующая картинка показывает как это происходит

По сути большинство байтов, из которых сформировано избыточное кодирование, состоят из двух половинок байтов кодирования реальных данных. Последний штрих - это еще один вспомогательный механизм защиты от ошибок - interleaving. Это стандартная техника для защиты от нескольких подряд идущих ошибок, данные из разных блоков перемешиваются, что уменьшает вероятность того, что все потери будут приходится на один блок. В случае QR кодов interleaving блоков довольно простой: сначала по очереди идут первые байты блоков, потом в том же порядке вторые байты и так далее. Отличная иллюстрация есть в статье Взлом Bitcoin по телевизору: обфускуй, не обфускуй, все равно получим QR:

При совмещении этой техники с тем фактом, что байты при избыточном кодировании содержат информацию о двух байтах информации мы получаем, что они разносятся по разным участкам, из-за этого прочитать данные становится труднее, на следующей картинке отмечено как на самом деле располагаются символы в коде выше

На этом всё, спасибо за вниманием и с новым годом, Хабр!

Комментарии (5)

buratino
31.12.2025 11:41
#29326276
очень интересно, но нихрена не понятно. Кто такой КПДВ?
С практической точки зрения
- Сканер QR кодов на андроиде распознал оба кода
- Сканер QR кодов от Сбербанка на верхний код написал "вы распознали QR код для перехода на сайт, чтобы оплатить услугу, отсканируйте другой QR код", на нижний - "Нельзя платить по этому QR коду \ услуга не найдена..."
- Сканер QR кодов от распальцованной команды Озон банка, которая не может осилить ГОСТ Р 56042-2014, пишет "Не распознали QR код"
1. malkovsky Автор
  31.12.2025 11:41
  #29326322
  КДПВ -- "картинка для привлечения внимания", т.е. титульная. Статья (и пакет qr-verbose) не про то, чтобы генерировать QR коды, а про то помочь разобраться как они устроены, основной посыл, что данные в нижнем коде уложены уже не так просто, как в верхнем, в других статьях-туториалах на хабре вы такого не найдёте (смотрите самую последнюю картинку в статье). В любом случае, спасибо, что проверили!
  
  По поводу сканируемости: оба сканируются с андроида -- да, так и должно быть. По поводу сбербанка, сам им не пользуюсь, но судя по тому, что вы написали, это видимо сканнер платежа, полагаю что он ожидает какой-то идентификатор платежа, а не просто какую-то произвольную информацию. Думаю, что в Озоне тоже самое
  1. buratino
    31.12.2025 11:41
    #29326396
    Большинство программеров, которые используют QR коды для их генерации или сканирования не забивают себе голову тем, как оно устроено, а используют готовые библиотеки.
    
    По поводу банковских приложений - чтобы понять, что это платеж, нужно распознать QR код. В случае сбербанка похоже, что распознавание происходит в обоих случаях, но почему-то реакция разная. В случае Озонбанка похоже, что приложение понимает, что это QR код, но распознать не может. Если бы оно распознало, то по идее ругалось бы какими-нибудь другими словами. Интересно, что будут делать приложения других банков
1. MozgFx
  31.12.2025 11:41
  #29327490
  Версия это процент резервирования данных. То есть 30% кода на версии 6 можно закрыть картинкой и его можно будет считать
  
  Версию удобно использовать ещё тогда когда код увеличивается при разном количестве данных в нем и чтобы избежать увеличения кода явно можно указать версию кода и масштаб. Тогда даже если будет закодировано меньше данных код не уменьшится. Если будет достигнут предел получим что код не поддерживается. Так реализовано в принтерах этикеток brother резервирование до 30%. Но накладывание картинки достигается редактором а не самим кодом.
  1. malkovsky Автор
    31.12.2025 11:41
    #29327604
    30% кода можно закрыть на любой версии при выставленном уровне коррекции ошибок H и в статье об этом написано.

И еще немного о QR кодах +8

Как читать QR код, опять

Что происходит начиная с версии 3

Комментарии (5)

buratino

malkovsky Автор

buratino

MozgFx

malkovsky Автор