Вместо предисловия
Не так давно на просторах интернета узнал о такой замечательной и удивительной копии Вавилонской библиотеки как о формуле Таппера. Вернее, это больше неравенство Таппера, чем формула. Особенность данного неравенства — оно создает собственное же изображение на графике. Просто посмотрите на это чудо!
(Источник Wikipedia)
То, что Вы видите на изображении, и является формулой того самого Джеффа Таппера. Наверное, половина читателей уже понеслась в вольфраме рисовать результат выполнения данного неравенства… Но тут не все так просто. Как вы можете заметить в данном изображении, формула на графике может быть замечена на отрезке по оси OY [k; k+15]. Что же это за загадочное число k? Где же его взять? Все дело в том, что данное неравенство, по концепции Вавилонской библиотеки, способно вывести абсолютно любое изображение с разрешением 106х17! Каждое изображение, имеет собственную позицию на графике, тем самым, имеет уникальное число k. Таким образом, для каждого числа k существует единственное изображение на всем графике!
Для данного же изображения число k выглядит следующим образом:
4858450636189713423582095962494202044581400587983244549483093085061934704708809928450644769865524364849997247024915119110411605739177407856919754326571855442057210445735883681829823754139634338225199452191651284348332905131193199953502413758765239264874613394906870130562295813219481113685339535565290850023875092856892694555974281546386510730049106723058933586052544096664351265349363643957125565695936815184334857605266940161251266951421550539554519153785457525756590740540157929001765967965480064427829131488548259914721248506352686630476300
Интересно посмотреть на людей, которые будут прокручивать до такой координаты, чтобы увидеть формулу
Мне пришла в голову идея написать программу на Python3, которая позволяла бы конвертировать изображение в число k и наоборот и рассказать Вам еще об одном прекрасном способе закодировать изображение в цифру.
Теория
(Добавлено) Как же это работает?
Давайте взглянем на саму формулу:
Определимся с её синтаксисом:
— число, округленное вниз
mod(x,y) — остаток от деления числа x на число y
А дальше, вроде бы, всё и так понятно.
Заметим, что как x, так и y округляются вниз. Именно такое округление в итоге нам дает пиксельную картинку
Обозначим все, что округляется в правой части неравенства за .
Тогда
Что очевидно, ведь целое выражение округляется вниз.
Пусть y = 17r + q, где r — целая часть от деления y на 17, а r — остаток от деления. Таким образом, мы в формуле можем заменить на r, а на q.
Получаем
Или же
mod(,2) принимает 2 значения — 0 или 1. Соответсвенно, данное неравенство будет говорить, является ли число четным или нет.
Заметим, что изображение рассмаривается на промежутке [N, N+16], соответственно остается постоянным на протяжении всей высоты изображения, что нельзя сказать про число r (на протяжении всего изображения меняется от 0 до 16).
А теперь вишенка на торте. Число будет нечетным тогда и только тогда, когда бит под номером (17x+r) в двоичном предствалении числа q будет равен 1. А так как с высотой число q постоянно меняется и его двоичное представление тоже, то мы каждый раз получаем уникальное изображение! Именно так и работает формула Таппера.
Теперь посмотрим, как же вычислить высоту, на которой мы хотим увидеть наше изображение
Принцип вычисления числа k
Сам Таппер описал вычисление числа k для любого изображения размером 106х17 (это важно!) следующим образом:
- Перевести изображение в черно-белое представление
- Читать каждый пиксель снизу-вверх, слева направо и класть его в буфер. Если пиксель черный — то кладем 1, если белый — 0.
- Перевести двоичное число в десятичное и умножить на 17
- Профит!
Чтобы получить из числа k изображение — делаем все с точностью наоборот. Ну что же, поехали кодить!
Кодим
UPD: В комментариях народ немного улучшил код, сделал его проще и прозрачнее. В данной статье опубликованы данные обновления. Если хотите увидеть старые версии кода — идите в репозиторий гитхаба (пока не закомитил, ссылка в конце статьи) и в комментарии
Из k в изображение
UPD
По просьбе комментаторов, был добавлен новый способ вычисления изображения с помощью данного неравенства и k! Теперь мы не будем делать манипуляции с числом, переводом в двоичную систему, а непосредственно затронем саму функцию!
Использование метода Таппера для декодирования числа k
Получаем от пользователя число k,
def from_k_to_bin(k: int) -> list:
k //= 17
binary = bin(k)[2:]
Понимаем, что некоторые начальные пиксели могут быть белыми (равны 0), соответственно у нашего двоичного числа первые биты будут нулями, а при переводе числа в десятиричную систему эти начальные нули потеряются. Поэтому проверяем размер полученного двоичного числа, если он будет меньше 1802, то добавляем в начало нули.
def from_k_to_bin(k: int) -> list:
k //= 17
binary = bin(k)[2:]
#Спасибо за исправление RadicalDreamer
binary = ("0" * (1802 - len(binary))) + binary
Далее объявим двумерный список, в котором будем хранить информацию о каждой строчке изображения. Затем записываем туда все те биты, которые прочитали (не забываем алгоритм, по которому создается число k — снизу-вверх, слева-направо)
lists = [[] for x in range(17)]
#Cпасибо за исправление RadicalDreamer
for x in range(1802):
lists[-(x % 17)].append(binary[x])
<b>Давайте рисовать!</b>
<source lang="python">
#-----Рисовашки!-----#
image = Image.new("1", (106,17), (0)) #Создаем черно-белое изображение 106х17
draw = image.load()
for y in range(17):
for x in range(106):
image.putpixel(xy=(105-x,16-y), value=(int(lists[y][x]),)) #каждый пиксель окрашиваем в цвет, который хранится в двумерном списке lists
image.save("image.png") #сохраняем изображение
Давайте попробуем запихнуть в нашу программу число k, которое я указал в начале статьи, и получим следующее:
Как видим, у нас все получилось, и мы теперь способны декодировать любой k!
Использование неравенства для генерации картинки из числа k
Для начала запишем функцию в питоне:
def f(x,y):
return ((y//17)//(1 << (17*x+(y%17))))%2
Благодаря операторам // и << реализация функции была сильно упрощена. Гарантируется, что числа x и y будут целыми!
Создаем опять двумерный список, где будем хранить биты изображения и записываем в него информацию о каждой строчке с помощью циклов
lists = [[] for x in range(17)]
for y in range(16,-1,-1):
for x in range(105,-1,-1):
lists[y].append(int(f(x,y+k) > 1/2))
И далее как и в предыдущем примере рисуем картинку с помощью библиотеки PIL.
Полностью функция выглядит вот так:
def from_k_to_bin(k: int) -> list:
lists = [[] for x in range(17)]
for y in range(16,-1,-1):
for x in range(105,-1,-1):
lists[y].append(int(f(x,y+k) > 1/2))
return lists
Изображение в k
Чтож, теперь научимся любое изображение кодировать в число k.
Cначала получим само изображение
def get_image() -> Image:
name = input("Введите название изображения (должно находится в одной папке со скриптом):")
try:
im = Image.open(name)
except Exception:
print("Неудача!")
exit(0)
return im
Проверим его размер
_SIZE_WIDTH = 106
_SIZE_HEIGHT = 17
image = get_image()
width, height = image.size
flag_okay = False
if width == _SIZE_WIDTH and height == _SIZE_HEIGHT:
flag_okay = True
if not flag_okay:
print("Недопустимый размер изображения")
print(width, height)
exit(0)
print("Все ок!")
Делаем изображение черно-белым и начинаем читать попиксельно:
image = image.convert('1')
byteset = ""
for x in range(105,-1,-1):
for y in range(0,17):
#cпасибо m03r за исправление
if image.getpixel((x,y)) > 127:
byteset += '1'
else:
byteset += '0'
Остается только перевести в десятичную систему и умножить на 17.
k = int(byteset,2)*17
print("Все готово:")
print(k)
Ну что же, пошли тестировать!
Я решил закодировать логотип хабра. Вот исходное изображение:
Запускаем программу и указываем имя изображения:
Мы получили следующее k:
4858487703217654168507377107565676789145697178497253677539145555247620343537955749299116772611982962556356527603203744742682135448820545638134012705381689785851604674225344958377377969928942310236199337805399065932982909660659786056259547094494380793146587709009524498386724160055692719747815828234655968636671461350354316223620304956111171025410498514602810746287134775641383930152393933036921599511277388743068766568352667661462097979110006690900253037600818522726237351439443865433159187625289316917268254866954663750093103703327097252478959
Давайте же его проверим на нашей же программе.
Вот изображение, которое мы получили:
Оно было немного изкажено из-за немного кривого перевода изображения в черно-белые цвета.
Итог
Исходный код программы: Github
Источники: статья на Вики
Комментарии (29)
xytop
04.07.2018 17:18+3Пост о неравенстве Таппера… которое показано лишь на картинке в самом начале и дальше никакого упоминания о нем нет.
Почему бы не объяснить как (и почему) работает эта формула, не написать ее в нормальном виде?
Хоть бы в Python-коде использовали эту функцию для рисования, что ли…
А так, любую картинку в любом предопределенном разрешении можно в число и обратно перевести, даже на 17 умножать не надо.JungleTryne Автор
04.07.2018 17:48Если вам интересен механизм работы самого неравенства, доказательство его работы, то вам сюда ТЫК (Если руки дойдут, то и перевод возможно напишу)
Впринципе, можно сделать реализацию через PyPlot, только остается вопрос, будет ли они быстрой и эффективной… А так, спасибо за идею для второй части :)xytop
04.07.2018 17:52+2Я говорю о теме поста, и о том что идет по сути в его теле :)
Они не взаимосвязаны никак, вообще. Ни код, ни текст не раскрывают темы.JungleTryne Автор
04.07.2018 17:56Почему же? Джефф Таппер описал простой способ генерации числа k для каждого изображения. Да, так можно сделать с изображением любого формата, но данный пост показывает, что мы это делаем не просто так — все связано с его формулой. Как эта формула работает — я Вам уже отправил ссылку. Тема топика — реализация алгоритма на Python — алгоритм нахождения числа k был реализован, хоть и показался немного детским
JungleTryne Автор
04.07.2018 18:43+1Вы правы, добавил краткое разъяснение работы формулы Таппера в начало статьи. А то как то суховато получилось
m03r
04.07.2018 17:19А зачем преобразовывать число в строку?
byte = str(image.getpixel((x,y))) if byte == "255": byteset += '1' else: byteset += '0'
Лучше было бы так:
if image.getpixel((x,y)) > 127: byteset += '1' else: byteset += '0'
Заодно монохром будет выглядеть немножко лучше.JungleTryne Автор
04.07.2018 17:48Да, действительно, спасибо за исправление.
Когда писал программу, думал, что функция getpixel вернет мне 1 или 0, т.к. изображение черно белое, потом понял, что это не так работает. Так и появился этот костыль
kamiLLxiii
04.07.2018 17:44Для тех, кому интересно, как оно работает www.youtube.com/watch?v=_s5RFgd59ao
RadicalDreamer
04.07.2018 20:06+2Забавно.
Но позвольте сделать несколько замечаний к самому коду.
if len(binary) < 1802: new_binary = "" for i in range(1802-len(binary)): new_binary += "0" binary = new_binary + binary
Можно упростить до
binary = ("0" * (1802 - len(binary))) + binary
А чтобы не сортировать список lists в обратном порядке, поменяйте знак индекса на противоположный, т.е.
for x in range(1802): lists[x%17].append(binary[x]) lists.reverse() #Немножко костылей - без этого изображение будет отзеркаленным
можно заменить на
for x in range(1802): lists[-(x % 17)].append(binary[x])
JungleTryne Автор
04.07.2018 20:29+1Спасибо за исправление
RadicalDreamer
04.07.2018 21:03Пожалуйста!
binary = ("0" * (1802 - len(binary))) + binary
Возможно, здесь меня поправят, так что замечу, что вариант
binary = binary.rjust(1802, "0")
будет чище и куда уместнее первого.
goiliago
05.07.2018 15:39Ещё можно заменить
flag_okay = False if width == _SIZE_WIDTH and height == _SIZE_HEIGHT: flag_okay = True if not flag_okay:
На просто
if width != _SIZE_WIDTH or height != _SIZE_HEIGHT:
AntonyMcGreen
05.07.2018 18:01Противоположный индекс не сгодится, ведь
lists[-0]==lists[0]
, а должен бытьlists[-1]
. Я бы предложилlists[16-(x%17)]
RadicalDreamer
05.07.2018 19:09Да, Вы правы. Проверял свой код на изображении хабра в статье, и там баг не выявился, т.к. первый и последний элементы списка совпали.
RadicalDreamer
05.07.2018 19:24Более обобщенно, здесь подойдет
lists[-(x % 17) - 1]
JungleTryne, сорри за внесенную путаницу.
JungleTryne Автор
04.07.2018 21:29+1UPD: Добавлен новая реализация функции from_k_to_bin, которая использует непосредственно функцию. Также были исправлены кусочки кода и заменены на более красивые, которые были предложены комментаторами. Добавлена теория про само неравенство в самое начало статьи
begemot_sun
05.07.2018 09:44К сожалению, формула Таппера — это просто способ закодировать изображение, а не как-нибудь его сжать.
Число К из статьи — 1807 бит. Количество пиксель в картинке 106*17 = 1802.
Для сжатия не пойдет, и практической ценности видимо не имеет. Или всё же имеет?thatsme
05.07.2018 10:17+1А само число сжимается или у него слишком высокая энтропия?
begemot_sun
05.07.2018 15:51Ну тут надо смотреть на энтропию изображения и энтропию его числа. Думаю что порядок величин одинаковый, так что не выстрелит.
thatsme
06.07.2018 05:28Ну строковое представление числа, отлично сжимается, там энтропия априори низкая (и чем длинее число тем ниже). Сжатие строкового представления числа «хабр» более чем в два раза с помощью bz2. Если число перевести в 256 бит то уже не нужно сжимать — 32 байта. Только нет гарантии, что для любой картинки нам хватит 256 бит.
trapwalker
05.07.2018 17:06Да, это даже не квайн, просто способ обфускации. А вот циклический многоязыковой квайн, который бы в одной из фаз был визуальным представлением формулы и QR-кода с числом к.
iamoverit
05.07.2018 17:59+1Интересен другой момент, ведь эта формула описывает и свастику в том числе, и как привели выше если ее расширить до цветной и содержащий большее количество пикселей, то и детское порно можно найти, должна ли быть данная формула заблокирована РКНом?
JungleTryne Автор
05.07.2018 18:00+1Ответ такой же, как и на следующий вопрос: В Вавилонской Библиотеке есть все совпадения симоволов. Одни из них могут содержать гос тайну всех стран. Должно ли РКН заблокировать Вавилонскую библиотеку?
SCINER
06.07.2018 01:02Не понимаю, в чем ценность данного действия?
Можно ведь просто изображение сохранить в двухцветном *.BMP файле и полученный файл без заголовка просто принять за большое число сконвертировав его Base10 алгоритмом.
phaggi
Забавно!
А подобные алгоритмы с другими параметрами (размерностями растра, например) бывают?
AntonSor
Легко подобрать, играясь коэффициентами. Вместо 17 в знаменателях ставите ваше число строк.
thatsme
Изображеня можно делать и цветные, тогда будет 3 числа к — для каждого цвета (если с альфа-каналом то 4-е), потом нужно просто после преобразования из к в битплейн, перевести из 3(4-х) битплейновых массивов в 1-н 32-х битный.