Самая короткая программа вывода десятичного числа / forpes.ru

Главная
Самая короткая программа вывода десятичного числа

Самая короткая программа вывода десятичного числа +62

13.04.2020 06:39

Manwe_SandS 29 13100 Источник

В 1984-ом году вышла культовая книга Стивена Леви “Хакеры: герои компьютерной революции”. Существует любительский русский перевод, но он далёк от идеала. Я было взялся исправлять неточности в нём, положив рядом английский оригинал (кстати, и он не без греха), да забросил после второй главы. Так или иначе, хочу обратить ваше внимание на фрагмент (можно прочитать его в виде отдельной статьи), посвящённый подпрограмме печати числа в десятичной системе. Насколько можно уменьшить такую программу? Каков предел?

В августе 2018-го года я писал программу для измерения точного времени исполнения команд советского процессора 1801ВМ1 (он обладает набором инструкций PDP-11). Знание точного времени (в тактах процессора) было необходимо при работе над демо “Good Apple” для компьютера БК 0011М. Результаты измерений я хотел видеть в десятичной системе счисления. Для этого пришлось написать свою подпрограмму – системные функции были недоступны в силу специфики теста.

Первое, что я сделал – составил массив TEN со степенями числа 10. Процедура принимает число в регистре R0, на выходе текстовая строка по адресу NUMBER. Важно: в процессоре нет инструкции деления!

	MOV #NUMBER,R1	; pointer to output text string
	MOV #TEN,R5
1:	CMP (R5)+,R0 	; skip leading zeros
	BHI 1		; branch if higher, for 16-bit not signed
	MOV -(R5),R3
	BEQ 4		; if less then 10

2:	MOV #47.,R4	; 0 symbol in ASCII codepage - 1
3:	INC R4		; count digits
	SUB R3,R0
	BHIS 3		; branch if higher or same, for 16-bit not signed
	MOVB R4,(R1)+	; print R4

	ADD (R5)+,R0
	MOV (R5),R3
	BNE 2

4:	ADD #48.,R0	; 0 symbol in ASCII codepage
	MOVB R0,(R1)+	; print R0
	CLRB (R1) 	; end of text marker
	RET

TEN:	.WORD 10000.,1000.,100.,10.,0

Чтобы понимать ассемблер PDP-11, достаточно помнить, что аргументы записывают слева направо (сначала источник, затем приёмник), а команды условных переходов начинаются с буквы B (от слова branch – ветвление). Описывать алгоритм не стану, он ничем не интересен и приведён здесь лишь в качестве отправной точки. Размер этой подпрограммы – 22 слова (не считая данных).

После того, как всё заработало, я вдруг вспомнил историю из книги Стивена Леви: хакеры бились над уменьшением размера аналогичной программы, причём тоже на архитектуре PDP. Правда, у них была PDP-1, но через несколько лет они заполучили и PDP-11.

Открыв книгу, я обнаружил крайне туманное описание. Начинали хакеры из MIT так же, как и я — со списка десятичных разрядов. Но что произошло дальше, из текста непонятно. Очевидно, это не было понятно и автору книги, он просто записал общие слова из уст очевидцев того хакерского состязания.

Пришлось покопаться в Интернет-архиве программ для PDP-1. Там много интересного: Minskytron, Munching squares и другие так называемые “дисплейные хаки” (кстати, примечательно, что уже тогда – в начале 60-ых – хакеры из MIT использовали термин “демо” в том же смысле, в котором мы используем его сейчас на демосцене). В архиве много системных подпрограмм, но вывода десятичного числа среди них, увы, нет.

Тогда, вооружившись отладчиком, я решил посмотреть, как реализована эта процедура в операционной системе MKDOS, которой я пользуюсь на БК 0010 и БК 0011М. О, чудо! – присмотревшись, я понял, что подпрограмма очень хорошо подходит под туманное описание из книги “Хакеры”. Вот её код:

	MOV #10.,R4
	CLR R2
1:	CLR R1
2:	SUB R4,R0 	; вычитаем из числа 10, пока ничего не останется
	BLO 3
	INC R1 		; счётчик - сколько вычитаний сделали
	BR 2
3:	ADD R4,R0
	ADD #48.,R0 	; ASCII-код числа 0
	INC R2		; счётчик - сколько символов сохранили
	MOVB R0,-(SP)
	MOV R1,R0 	; теперь число вычитаний - наш новый аргумент
	BNE 1
	INC R2
	MOVB #32.,-(SP)	; ASCII-код пробела
4:	MOVB (SP)+,R0
	CALL PRINT
	SOB R2,4	; цикл по числу сохранённых символов
	RET

Программа формирует текстовую строку в стеке, затем вызывает процедуру печати каждого сохранённого символа. Судя по всему, именно это имелось в виду в книге Стивена Леви под фразой «конвертирует обратным образом, а при помощи хитрого программного фокуса печатает в нужном порядке». Остальные особенности алгоритма должны быть понятны по комментариям к коду.

Размер подпрограммы – 23 слова, но сравнивать ей с моей подпрограммой напрямую нельзя: слишком разные условия. Я решил переделать программу из MKDOS под свои условия: формирование текстовой строки в памяти.

В конечном итоге я понял, что лучше оставить только идею вычитания числа 10, а всё остальное написать с нуля. После нескольких кругов ~~Сансары~~ оптимизации у меня получилось следующее:

	MOV #NUMBER,R1	; pointer to output text string
	CLRB -(R1)	; end of text marker
	MOV #10.,R4
1:	MOV #-1.,R5
2:	INC R5		; counter of 10s
	SUB R4,R0
	BHIS 2		; branch if higher or same
	ADD #58.,R0	; #10. + '0' ASCII code
	MOVB R0,-(R1)	; store R0 to text string
	MOV R5,R0	; let's count next how many 10s in number of 10s
	BNE 1
	RET		; returns text string pointer in R1

16 слов, предел достигнут (думал я), вот она – Нирвана, о которой так эмоционально писал Стивен Леви!

Какие трюки здесь применены:

Первая команда устанавливает указатель не в начало, а в конец текстовой строки. Текст заполняется справа налево – это удобно ещё и тем, что на выходе мы получаем адрес начала строки, готовый к передаче в процедуру печати текста.
Счётчик вычитаний начинается не с нуля, а с минус единицы. Первая команда внутри цикла (INC R5) увеличивает счётчик на 1. Всё равно получается 0, так почему бы сразу не очищать счётчик, зачем всё это?.. Дело в том, что при первом же вычитании 10 можно получить отрицательный результат – тогда нужно выйти из цикла, при этом счётчик должен равняться нулю. Значит, увеличение счётчика придётся делать уже после проверки. А следом нужна команда перехода в начало цикла. Итого – на одну команду больше. С точки зрения размера разницы нет: мы потеряем 1 слово, добавив команду перехода, но сэкономим 1 слово на записи минус единицы (очистка регистра короче). И всё же, имеет смысл уменьшить количество команд внутри цикла, так он будет исполняться быстрей. Да и программа в целом визуально сократится. Поэтому я пришёл к решению с -1.
Вычитая число 10, мы могли бы не дожидаться отрицательного результата, а выходить из цикла раньше, когда аргумент станет меньше десяти. Но сравнение с числом – отдельная операция (и дополнительное время). В противовес этому, сравнение с нулём производится процессором автоматически после любой арифметической операции – можно сразу совершать условный переход. Однако, потом всё же придётся прибавить десятку, несправедливо отнятую у входного аргумента. Оба варианта (сравнивать с числом 10 в цикле или прибавлять 10 в конце) одинаковы по размеру. Но вот что я заметил: поскольку потом всё равно нужно прибавить к аргументу ASCII-код символа 0, можно сразу прибавлять и десятку! Этот трюк, пожалуй, стал самым большим откровением для меня. Инструкция ADD #58.,R0 делает именно это (48+10).

Я был настолько доволен программой, что решил поделиться ей на форуме zx-pk.ru (ничего не подозревая о местных традициях критиковать без аргументов). Реакция сообщества была примерно такой: “надо было просто посмотреть, как сделали в DEC, это же классика”.

Что ж, вот программа от DEC – компании, создавшей PDP-11 и вобравшей в свои ряды некоторых хакеров из MIT:

; RETURNS:
; R0 = 0
; R1 -> byte following last digit in converted number
CVBTOD:	MOV	R0,-(SP)	;SAVE THE NUMBER PASSED TO US
	CLR	R0		;SET FOR CRUDE DIVIDE BY 10.
10$:	INC	R0		;BUMP QUOTIENT
	SUB	#10.,(SP)	;REDUCE NUMBER BY 10.
	BHIS	10$		;IF SIGN DIDN'T CHANGE...
	ADD	#10.+48.,(SP)	;MAKE REMAINDER PRINTABLE
	DEC	R0		;REDUCE QUOTIENT
	BEQ	20$		;IF ZERO, TIME TO PRINT
	CALL	CVBTOD		;OTHERWISE, RECURSE !
20$:	MOVB	(SP)+,(R1)+	;STORE A CONVERTED DIGIT
	RETURN			;UNWIND THE RECURSION

14 слов, круто! Или… нет? Мне засчитали поражение, но давайте посмотрим внимательней:

Прибавление ASCII-кода символа 0 и числа 10 сделано одной операцией. Оказывается, такой трюк применяли ещё в 70-ых. Классно.
Программа вызывает сама себя рекурсивно – красивое решение!
Вычисления проводятся в стеке – это медленней, зато экономится один регистр. Хорошо это или плохо – зависит от контекста применения процедуры.
После выхода R1 указывает на конец строки. Это неудобно, так как перед печатью придётся заново указывать адрес строки, а это лишняя команда.
Ой, подождите! А где исходный адрес строки?.. Оказывается, он задаётся за пределами подпрограммы. Таким образом, критики с zx-pk.ru не досчитались команды MOV #NUMBER,R1 из двух слов!

Итого, реальный размер – 16 слов. Ровно как у моей. Обе программы состоят из 12 инструкций. Так какая лучше?

Даже если заменить обращения к стеку на обращения к регистру, программа DEC окажется медленней из-за инструкций DEC R0 и CALL внутри цикла.

Но это ещё не всё. Начав писать эту статью, я заметил, что в моей программе осталась рудиментарная (от MKDOS) инструкция MOV #10.,R4 – она не несёт никакого смысла, кроме ускорения внутреннего цикла. Пора избавиться от неё.

	MOV #NUMBER,R1	; pointer to output text string
	CLRB -(R1)	; end of text marker
1:	MOV #-1.,R5
2:	INC R5		; counter of 10s
	SUB #10.,R0
	BHIS 2		; branch if higher or same
	ADD #58.,R0	; #10. + '0' ASCII code
	MOVB R0,-(R1)	; store R0 to text string
	MOV R5,R0	; let's count next how many 10s in number of 10s
	BNE 1 		; loop if R0 is not zero
	RET		; returns text string pointer in R1

15 слов. 11 инструкций. Вот теперь, похоже, всё.

Что ж, у меня идеи по оптимизации закончились. Это был вдохновляющий, даже азартный, челлендж. Замечательно, что идея, предложенная студентом-хакером в начале 60-ых для PDP-1, использовалась компанией DEC десять и даже двадцать лет спустя, а на советском компьютере БК 0011М она применялась до начала 2000-ых годов. Удивительно, что в 2018-ом году оказалось возможным частично переизобрести и оптимизировать алгоритм. Характерно, что многие считали это невозможным.

Итак, перед вами Святой Грааль (по выражению Стивена Леви), найти который пытались хакеры 60-ых — самая короткая программа вывода десятичного числа для PDP. Или… можно ещё короче?

Update: я знал, что этот день наступит, но не думал, что так скоро :) Оказалось, программу можно сократить ещё на одно слово! Идею предложил в комментариях Mr_Rm:

	MOV #NUMBER,R1	; pointer to output text string
	CLRB -(R1)	; end of text marker
1:	CLR R5
2:	INC R5		; counter of 10s +1
	SUB #10.,R0
	BHIS 2		; branch if higher or same
	ADD #58.,R0	; #10. + '0' ASCII code
	MOVB R0,-(R1)	; store R0 to text string
	MOV R5,R0	; let's count how many 10s in number of 10s
	SOB R0,1	; subtract 1 and loop if not zero
	RET		; returns text string pointer in R1

14 слов. 11 инструкций.
Фокус вот в чём. Помните, я писал, что при “неправильной” организации цикла R5 получается на единицу больше нужного? Ну и пусть! Мы уменьшим его в самом конце программы. В прошлом варианте R5 копировался в R0, после чего команда BNE (Branch if Not Equal to zero) проверяла R0, и если он не равен нулю, переходила в начало цикла. Вот бы нам сперва уменьшить R0 на единицу, а потом уже (если получили не ноль) переходить в начало… Минуточку, да ведь это обычная команда цикла SOB (Subtract One and Branch). Правда, здесь она использована не каноническим образом: отрабатывает один раз, а дальше счётчик цикла перетирается. Это выглядит обескураживающе, но если разобраться в предыдущей версии подпрограммы, становится понятно как из неё получилась новая, укороченная на одно слово.

Полезные ссылки:

Журнал Downgrade на русском языке, выпуски 28 и 29 – статьи об ассемблерных трюках на БК/PDP.
Программирование под БК 0010 в 2019-ом году – обзор современных инструментов разработки.
Демки для БК 0010 и БК 0011М на портале pouet.net
Хакерские корни демосцены – запись семинара на Chaos Constructions 2016, разбор «дисплейных хаков» 60-ых.
Hackers: Wizards of the Electronic Age – документальный фильм 1984-го года по мотивам книги Стивена Леви.

Комментарии (29)

dzolotarev
13.04.2020 10:05
#21493718
Спасибо. Леви читал несколько раз. Побольше бы таких статей.

Yak52
13.04.2020 12:40
#21494292
PDPшный ассемблер был образцом лаконичности и удобства для программиста. Изучался буквально за пару часов, причем в результате можно было писать программы прямо в машинных кодах и позволял делать, например, вот такие трюки:
MOV -(PC), -(PC)
1. perfect_genius
  18.04.2020 21:49
  #21514180
  Сейчас изучаю м68к и они похожи, да?

maximnik0q
13.04.2020 13:35
#21494492
Крис Касперский как то написал статью как в результате спора классика «HELLO WORD»
для BSD -Linux ужали до 96 байт.Самое прикольное-до 300 байт вообще не напрягались, в течение часа ужали.А дальше дым коромыслом-убили 4 часа…

Mr_Rm
13.04.2020 16:23
#21495226
+1
Вот теперь, похоже, всё.
А если так:
```
    MOV #NUMBER,R1
    CLRB -(R1)
1:  CLR (R5)
2:  INC R5
    SUB #10.,R0
    BHIS 2
    ADD #58.,R0
    MOVB R0,-(R1)
    MOV R5,R0
    SOB R0, 1
    RET
```
14 слов, 11 инструкций.
Счетчик вычитаний в R5 начинается с нуля и после цикла будет на единицу больше, чем должен.
Команда SOB вычтет лишнюю единицу, проверит на 0 и выполнит переход к началу цикла.
1. Manwe_SandS Автор
  13.04.2020 17:04
  #21495378
  Гениально. Только скобки вокруг R5 лишние.
  Сейчас погоняю тесты на реальной БК 0010 (хотя, что может пойти не так?) и добавлю в статью со ссылкой на Вас.
  1. Mr_Rm
    13.04.2020 17:14
    #21495424
    Да, точно, со скобками явно ошибся.

mpa4b
13.04.2020 18:34
#21495724
Правильно ли я понял, как работает эта самая короткая программа? Она узнаёт остаток и частное от деления числа на 10 методом вычитания этих самых десяток? И если например у нее на входе будет 30000 то она будет заниматься вычитаниями 3 тысячи раз, в первом проходе по большому циклу? И сколько это времени займёт? Полсекунды на БК? Может, действительно такая процедура самая короткая, но в реальной жизни неприменима.
1. Manwe_SandS Автор
  13.04.2020 19:02
  #21495804
  Да, алгоритм вычитает 10 много раз. Практика показала, что на БК 0010 числа от 60000 выводятся этой процедурой примерно по 7 штук за секунду. В реальной жизни аналогичный алгоритм всё же применялся в системе MKDOS.
1. Tarson
  13.04.2020 22:01
  #21496366
  В часах электронных используется, если программа на ассемблере.
  1. mpa4b
    13.04.2020 22:02
    #21496370
    В электронных часах гораздо проще считать время сразу в десятичной системе, байт на цифру (даже не BCD).

Videoman
13.04.2020 22:45
#21496482
+3
Подпрограммка конечно маленькая и по своему красивая, но на практике ее ценность приближается к нулю. Гораздо практичнее будет добавить еще порядка 10 байт с табличкой: [10000, 1000, 100, 10, 1]. Функция станет не сильно больше, но скорость возрастет в тысячи раз.
1. Manwe_SandS Автор
  14.04.2020 00:23
  #21496668
  +1
  С такой программы статья и начинается.
  1. Videoman
    14.04.2020 02:05
    #21496798
    Да, извиняюсь, невнимательно просмотрел первый листинг.
  1. Videoman
    14.04.2020 11:33
    #21497530
    Еще, если помните, на БК был обалденный отладчик «PARADISE». Его особенность была в том, что он был полностью перемещаемым, ну очень функциональным и очень компактным. Все ядро занимало 6Кб. Его разработчики очень сильно поработали над оптимизацией по размеру кода. Не думаю что там будет магия какая-то, но вдруг: можно посмотреть как там реализован вывод 10-х целых.
    
    Mr_Rm
    14.04.2020 15:06
    #21498606
    Там может вообще не быть вывода десятичных чисел, только восьмеричных.
    
    Videoman
    14.04.2020 15:18
    #21498650
    Восьмеричные там по умолчанию. Но абсолютно точно есть как десятичные, так и шестнадцатеричные.
    
    perfect_genius
    18.04.2020 21:53
    #21514192
    Не застал тех времён, но "перемещаемый" — значит мог запускаться вместе с другой программой, перезаписав все свои внутренние адреса?
    
    Videoman
    18.04.2020 23:30
    #21514398
    Перемещаемая программа — это программа которая может работать будучи загружена по любому произвольному адресу. Обычно программы на ассемблере писались в расчете на то, что они будут загружены по конкретным адресам. Как правило это о1000. PDP-11 имела 8 режимов адресации. Некоторые из этих режимов задавали не абсолютный адрес операнда, а текущий адрес команды (PC) + смещение. Таким образом, используя вместо абсолютных адресов относительные, программа не зависела от адреса загрузки.

martyncev
14.04.2020 10:30
#21497360
+1
Комментарий не по теме. Но…
БК. Это мое детство. Именно на ней я в 7 лет начинал изучать Бейсик, именно на ней в 12 лет на ассемблере в 98м году написал операционку DOS98 с FAT16 файловой системой :-D
Сколько игр на ней сыграно… А операционные системы? ANDOS, MKDOS, CSIDOS, NORD, RT-11… А демосцена? Не знал, что для нее еще пишут демки — честь и хвала вам!
P.S> В серверной, на полке в дальнем углу до сих пор лежит две пачки пятидюймовых дискет с софтом и наработками. Все еще надеюсь что записи прочтутся, что когда-нибудь найду комплект БК+флоповод и прочту все это. Не хочется выкидывать детство))
1. Manwe_SandS Автор
  14.04.2020 10:40
  #21497384
  Очень интересно посмотреть Вашу DOS98!
  С прочтением дискет могу помочь (Москва). Есть активные БКшники в Питере и в Казани – они тоже могут помочь.
  1. martyncev
    14.04.2020 10:53
    #21497410
    Я бы сам не против ее посмотреть, но для этого надо найти дискету… а на ней исходники…
    По поводу прочтения — это супер, как кончится карантин я с Вами постараюсь связаться!)

necryin
14.04.2020 11:57
#21497652
А я то думал чем вдохновлялись создатели игры Human Resource Machine

br0x
14.04.2020 20:46
#21499986
+1
Вы всколыхнули ностальгию по серии size optimization Hugi Compo

perfect_genius
18.04.2020 21:54
#21514198
Вот бы побольше код-гольфинга на Хабре.

MaxVetrov
19.04.2020 00:07
#21514472
Важно: в процессоре нет инструкции деления!
Есть. Деление на 2.
1. Manwe_SandS Автор
  19.04.2020 10:23
  #21515122
  Строго говоря, инструкции деления и умножения подразумевают наличие в процессоре соответствующего микрокода для универсальных вычислений. В 1801ВМ1 такого микрокода нет. А деление и умножение на 2 традиционно называют «сдвигами».
  1. MaxVetrov
    19.04.2020 11:05
    #21515232
    Сдвигами можно укоротить код?
    
    MaxVetrov
    19.04.2020 12:55
    #21515494
    Есть универсальный алгоритм для любого делителя:
    
    Q := 0 -- Initialize quotient and remainder to zero R := 0 for i := n ? 1 .. 0 do -- Where n is number of bits in N R := R << 1 -- Left-shift R by 1 bit R(0) := N(i) -- Set the least-significant bit of R equal to bit i of the numerator if R ? D then R := R ? D Q(i) := 1 end end
    
    Может его можно изменить конкретно для 10, и это повысит скорость вычисления?

Самая короткая программа вывода десятичного числа +62

Комментарии (29)

Manwe_SandS Автор

Manwe_SandS Автор

Manwe_SandS Автор

Manwe_SandS Автор

Manwe_SandS Автор