В данной статье разбирается способ установки интерпретатора и запуск файла EXE через DOSBox. Планировалось погрузить читателя в особенности программирования на TASM, но я согласился с комментаторами. Есть много учебников по Ассемблер и нет смысла перепечатывать эти знания вновь. Лично мне в изучении очень помог сайт av-assembler.ru. Рекомендую. В комментариях также вы найдёте много другой литературы по Assembler. А теперь перейдём к основной теме статьи.
Для начала давайте установим наш старенький интерпретатор.
Ссылка
Почему именно vk.com?
Я прекрасно понимаю, что это ещё тот колхоз делиться файлами через обсуждения VK, но кто знает, во что может превратиться эта маленькая группа в будущем.
После распаковки файлов, советую сохранить их в папке Asm на диск C, чтобы иметь меньше расхождений с представленным тут материалом. Если вы разместите директорию в другое место, изменится лишь путь до файлов, когда вы будете использовать команду mount.
Для запуска интерпретатора нам так же потребуется эмулятор DOSBox. Он и оживит все наши компоненты. Скачаем и установим его!
Ссылка
В папке Asm я специально оставил файл code.asm. Именно на нём мы и потренируемся запускать нашу программу. Советую сохранить его копию, ибо там хранится весь код, который в 99% случаев будет присутствовать в каждом вашем проекте.
code.asm
s_s segment
s_s ends
d_s segment
d_s ends
c_s segment
assume ss:s_s, ds:d_s, cs:c_s
begin:
mov ax, d_s
mov ds, ax
mov ax, 0
; Your code needs to be here
mov ah, 4ch
int 21h
c_s ends
end begin
Итак. Запускаем наш DOSBox и видим следующее:
Для простоты сопоставим имя пути, по которому лежит наша папка Asm. Чтобы это сделать, пропишем следующую команду:
mount d: c:\asm
Здесь вместо d: мы можем использовать любую другую букву. Например назвать i или s. А C это наш реальный диск. Мы прописываем путь до наших файлов ассемблера.
Теперь, откроем смонтированный диск:
d:
Прописав команду dir, мы сможем увидеть все файлы, которые там хранятся. Здесь можно заметить и наш файл CODE с расширением ASM, а также дату его создания.
И только теперь мы начинаем запускать наш файл! Бедные программисты 20 века, как они только терпели всё это? Пропишем следующую команду:
tasm code.asm
После мы увидим следующее сообщение, а наша директория пополнится новым файлом с расширением OBJ.
Теперь пропишем ещё одну команду:
tlink code.obj
В нашей папке появилась ещё пара файлов – CODE.MAP и CODE.EXE. Последний как раз и есть исполняемый файл нашего кода assembler.
Если он появился, значит, мы можем запустить режим отладки нашей программы, введя команду последнюю команду. Обратите внимание, теперь мы не указываем расширение файла, который запускаем.
td code
Этот старинный интерфейс насквозь пропитан духом ушедшей эпохи старых операционных систем. Тем не менее…
Нажав F7 или fn + F7 вы сможете совершить 1 шаг по коду. Синяя строка начнёт движение вниз, изменяя значения регистров и флагов. Пока это всего лишь шаблон, на котором мы потренировались запускать нашу программу в режиме дебага. Реальное “волшебство” мы увидим лишь с полноценным кодом на asm.
Небольшой пример для запуска
Прога проверяет, было ли передано верное число открывающих и закрывающих скобок:
s_s segment
dw 20 dup('$')
s_s ends
d_s segment
string db '()','$';
result db 0
d_s ends
c_s segment
assume ss:s_s,ds:d_s,cs:c_s
begin: ; начало программы
mov ax,d_s
mov ds,ax
xor ax,ax
lea si, string
;Ищем в строке скобку
search:
lodsb
;Проверка, это конец строки?
cmp al, '$'
je endString
;Это открывающая или закрывающая скобка?
;Это открывающие скобки?
cmp al, '('
je inStack
cmp al, '{'
je inStack
cmp al, '['
je inStack
;Это закрывающие скобки?
cmp al, ')'
je outStack
cmp al, '}'
je outStack
cmp al, ']'
je outStack
jmp search
;Помещаем скобку в Stack, увеличиваем счётчик
inStack:
inc cx
push ax
jmp search
;Выниманием из Stack скобку, проверяем пару
outStack:
;Была передана лишняя закрыв. скобка?
cmp cx, 0
je error3
dec cx
pop bx
;Вскрытая скобка закрыта верно?
cmp bl, '('
jne close1
cmp al, ')'
jne error1
jmp search
close1:
cmp bl, '['
jne close2
cmp al, ']'
jne error1
jmp search
close2:
cmp bl, '{'
cmp al, '}'
jne error1
jmp search
;Остались ли незакрытые скобки?
endString:
cmp cx, 0
jne error2
jmp exit
;Скобки остались, это ошибка №2
error2:
mov result, 2
jmp exit
;Лишняя скобка передана, ошибка №3
error3:
mov result, 3
jmp exit
;Закрывающая скобка несоответствует открывающей, ош №1
error1:
mov result, 1
jmp exit
;Пред-завершение. Каков результат программы?
exit:
cmp result, 1
jne enough
;Ищем нужную скобку для исправления ошибки №1
cmp bl, '('
jne next1
mov bl, ')'
jmp enough
next1:
cmp bl, '{'
jne next2
mov bl, '}'
jmp enough
next2:
cmp bl, '['
mov bl, ']'
jmp enough
enough:
mov dl, result
xor dx, dx
mov dl, bl
mov ah,4ch
int 21h
c_s ends
end begin
Давайте ознакомимся с имеющимися разделами.
CS
Code segment – место, где turbo debug отражает все найденные строки кода. Важное замечание – все данные отражаются в TD в виде 16-ричной системы. А значит какая-нибудь ‘12’ это на самом деле 18, а реальное 12 это ‘C’. CS аналогичен разделу “Begin end.” на Pascal или функции main.
DS
Data segment, отражает данные, которые TD обнаружил в d_s. Справа мы видим их символьную (char) интерпретацию. В будущем мы сможем увидеть здесь наш “Hello, world”, интерпретируемый компилятором в числа, по таблице ASCII. Хорошей аналогией DS является раздел VAR, как в Pascal. Для простоты можно сказать, что это одно и тоже.
SS
Stack segment – место хранения данных нашего стека.
Регистры
Все эти ax, bx, cx, si, di, ss, cs и т. д. – это наши регистры, которые используются как переменные для хранения данных. Да, это очень грубое упрощение. Переменные из Pascal и регистры Assembler это не одно и тоже, но надеюсь, такая аналогия даёт более чёткую картину. Здесь мы сможем хранить данные о циклах, арифметических операциях, системных прерываниях и т. д.
Флаги
Все эти c, z, s, o, p и т.д. это и есть наши флаги. В них хранится промежуточная информация о том, например, было ли полученное число чётным, произошло ранее переполнение или нет. Они могут хранить результат побитого сдвига. По опыту, могу сказать, на них обращаешь внимание лишь при отладке программы, а не во время штатного исполнения.
Ещё одно замечание. Если вы измените данные исходного файла с расширением .ASM, то вам придётся совершить все ранее описанные операции вновь, ибо обновив например code.asm вы не меняете code.obj или code.exe.
Маленькая шпаргалка для заметок:
mount d: c:\asm – создаём виртуальный диск, где корень –папка asm
d: - открываем созданный диск
tasm code.asm – компилируем исходный код
tlink code.obj – создаём исполняемый файл
td code – запускаем debug
F7 – делаем шаг в программе
Буду ждать комментарии от всех, кому интересен Assembler. Чувствую, я где-то мог накосячить в терминологии или обозначении того или иного элемента. Но статья на Habr отличный повод всё повторить.
cobhc
Обучение людей ассемблеру — поддерживаю, но… TASM и DosBox?
Желающим приобщиться к теме я бы лучше порекомендовал вооружиться NASM/SASM и либо книгой «Assembly Language Step-by-Step» для совсем начинающих, либо «Assembly Programming and Computer Architecture for Software Engineers» для тех, кто покрепче.
VEG
Как мне кажется, для обучения 16-битного x86 и DOS более чем достаточно. Оно ближе к железу (хоть и эмулируемому), что для обучения возможно даже лучше. На 32-битный и 64-битный x86 перейти потом очень легко, так как основные команды те же, с легко усваиваемыми изменениями и дополнениями. Я тоже начинал с 16-битного x86 где-то в 2007, и после устаревших уже на тот момент трюков с видеобуфером и написанием резидентных софтин, легко переключился на x86-32 для написания уже полезных патчей для любимых игр. Потом на досуге ещё освоил 6502 для программирования под NES/Famicom/Dendy родом из 1983, где нет даже команды умножения, и нет помощи от чего-то вроде BIOS (то есть общение с железом возможно только напрямую), и считаю это тоже интересным опытом, полезным для расширения кругозора в этой области.
mistergrim
В 16-битном ассемблере для DOS очень много мусора (на текущий момент). Сегментная модель памяти, ближняя/дальняя адресация, ограничения на использование регистров как индексных, да и сами вызовы DOS, в конце концов.
LAutour
32-проще - по факту не приходится возится с сегментами, меньше ограничений по адресациям через регистры. Под винду практичнее (асм вставки и отладка 32-битных приложений).
DistortNeo
Всё зависит от цели изучения ассемблера. Использование ассемблера на практике, как правило, не ограничено одной архитектурой. Поэтому полезно и x86/x64 изучать, и ARM, и прочую экзотику.
А чтобы понять базовые принципы, то можно и с MSIL начать.
tbl
MSIL и java bytecode не очень подходят в силу того, что это ассемблеры для стековых виртуальных машин
tyomitch
Каким образом из второго следует первое?
DistortNeo
Так, наоборот, с них проще начинать: нет регистров, флагов. И на практике легко применять. А уже потом можно более глубоко погрузиться в ассемблер.
lain8dono
Я бы голосовал за современный 64-битный ARM. Он банально проще.