

低階有機器語言(0 與 1 的組合), 組合語言(以簡易的名稱/指令來代表 0/1 的組合).

當原始碼寫好,要將他轉成機碼時, 在低階(ASM)叫做組譯, 如果是高階(C, BASIC)叫做編譯/直譯...

相對的, 把 ASM 翻成機碼叫組譯, 那把組譯翻成 ASM 叫反組譯

要看你電腦的平台是什麼,理論上是可以,實際上就要看有沒現成的工具給你用,不然只好自己寫,不過有時高階寫出來的一行等於低階的好幾 xxx 行,此時你在閱讀程式碼時就造成了困擾了

add a, b,c (將暫存器b,c的值相加放回暫存器a)
sub d,e ,f(將暫存器e,f的值相減放回暫存器d)
0001 0010 0011
0100 0101 0110

printf("Hello World\n");
[root@localhost test]# ls
[root@localhost test]# gcc hello.c
[root@localhost test]# ls
a.out hello.c
[root@localhost test]# ./a.out
Hello Wolrd
[root@localhost test]# objdump -d a.out > hello.asm #反組譯
[root@localhost test]# ls
a.out hello.asm hello.c
[root@localhost test]# vi hello.asm #反組譯結果
先從 compiler 說起, 假設一個程式很簡單就是

int main()
printf('hello, world');

只是很簡單的一行程式, 在螢幕上 show "hello, world", 在 compile 成執行檔就是一大堆 binary code, 當你用反組譯程式解回來時,當然不會是你上面看到的樣子,實際上類似這樣:

520:0100 0100 ADD [BX+SI],AX
520:0102 CD21 INT 21
520:0104 7217 JB 011D
520:0106 40 INC AX
520:0107 A3A800 MOV [00A8],AX
520:010A 48 DEC AX
520:010B 8EC0 MOV ES,AX
520:010D B449 MOV AH,49
520:010F CD21 INT 21
520:0111 720A JB 011D
520:0113 B80158 MOV AX,5801
520:0116 BB0000 MOV BX,0000
520:0119 CD21 INT 21
520:011B 7303 JNB 0120
520:011D E98901 JMP 02A9

你唯一會看到的是一大堆 assembly code, 道理很簡單, 雖然只是一行程式, 但實際上有很多 I/O & Function Call 在運作, 上面是C程式,算是中階語言,如果換做是其他更高階的電腦語言,如 BASIC -> C -> ASM 中間經過多少道 "轉換" 程序. 這也就是我所謂即使解出來意義也不大了.