3/18/2009

Ildasm.exe 教學

文章&圖示請參照http://msdn.microsoft.com/zh-tw/library/aa309387(VS.71).aspx

這個教學課程提供了 .NET Framework SDK 中所附之 MSIL 反組譯工具 (Ildasm.exe) 的簡介。Ildasm.exe 工具可以剖析任何 .NET Framework .exe 或 .dll 組件 (Assembly),並且以人們可閱讀的 (Human-Readable) 格式顯示資訊。Ildasm.exe 不只會顯示 Microsoft Intermediate Language (MSIL) 程式碼,也會顯示包括介面在內的命名空間 (Namespace) 和型別。您可以使用 Ildasm.exe 來檢查 .NET Framework 的原生組件 (例如 Mscorlib.dll),以及其他人提供的或是您自行建立的 .NET Framework 組件。大部分 .NET Framework 開發人員都會認為 Ildasm.exe 是不可或缺的工具。

對於這個教學課程,請使用隨附在 SDK 中之 WordCount 範例的 Visual C# 版本。您也可以使用 Visual Basic 版本,但是這兩種語言所產生的 MSIL 將會不同,畫面影像也不盡相同。WordCount 位於 \Samples\Applications\WordCount\ 目錄中。若要建置 (Build) 和執行範例,請依照 Readme.htm 檔案中所列的指示進行。這個教學課程會使用 Ildasm.exe 來檢查 WordCount.exe 組件。

若要開始,請建置 WordCount 範例,並使用下列命令列將它載入 Ildasm.exe 中:

ildasm WordCount.exe

這樣便會使 Ildasm.exe 的視窗顯示出來,如下圖所示。



Ildasm.exe 視窗中的樹狀結構會顯示 WordCount.exe 內部包含的組件資訊清單資訊,以及四個全域類別型別:App、ArgParser、WordCountArgParser 和 WordCounter。

按兩下樹狀結構中的任何型別,即可看見型別的詳細資訊。在下圖中,已將 WordCounter 類別型別展開。



在上圖中,您可以看見所有的 WordCounter 成員。下列表格將說明每一個圖形符號所代表的意義。

符號 意義
詳細資訊
命名空間
類別
介面
數值類別
列舉型別
方法
靜態方法
欄位
靜態欄位
事件
屬性
資訊清單或類別資訊項目

按兩下 .class public auto ansi beforefieldinit 項目會顯示下列資訊:



在上圖中,您可以清楚地看出來,WordCounter 型別是從 System.Object 型別衍生而來。

WordCounter 型別還包含另外一個型別,名稱為 WordOccurrence。您可以將 WordOccurrence 型別展開,即可看見它的成員,如下圖所示。



從樹狀結構中可以看出來,WordOccurrence 實作了 System.IComparable 介面,更明確地講,就是 CompareTo 方法。不過,在後續的說明中,我們將略過 WordOccurrence 型別,而將焦點集中在 WordCounter 型別上。

您可以看到 WordCounter 型別含有五個 private 欄位:totalBytes、totalChars、totalLines、totalWords 和 wordCounter。前四個欄位是 int64 型別的執行個體 (Instance),而 wordCounter 欄位則是 System.Collections.SortedList 型別的參考。

在這些欄位之後,您可以看見方法。第一個方法 .ctor 是建構函式 (Constructor)。這個特殊的型別只有一個建構函式,但是其他型別則可以有多個建構函式,每一個的簽名碼 (Signature) 都不同。WordCounter 建構函式的傳回型別 (Return Type) 為 void (和所有建構函式一樣),而且不接受參數。如果按兩下建構函式方法,會出現新的視窗,它會顯示方法中所包含的 MSIL 程式碼,如下圖所示。



MSIL 程式碼實際上很容易閱讀和了解 (如需所有的詳細資訊,請參閱位於 \Tool Developers Guide\Docs 資料夾 Partition III CIL.doc 檔案中的 CIL Instruction Set Specification)。在最接近頂端的地方,您可以看見這個建構函式需要 50 個位元組的 MSIL 程式碼。從這個數字並不能判斷出 JIT 編譯器將會發出多少機器碼,因為它的大小是根據主機 CPU 和用來產生程式碼的編譯器而定。

Common Language Runtime 為堆疊架構。因此,若要執行任何作業,MSIL 程式碼會先將運算元推入虛擬堆疊中,然後執行運算子。運算子會將運算元從堆疊中抓取出來、執行所需的作業,然後將結果放回堆疊上。不論任何時候,這個方法推入虛擬堆疊上的運算元都不能超過八個。您只要查看出現在 MSIL 程式碼前面的 .maxstack 屬性,就可以辨識出這個數目。

現在,請檢查前面幾個 MSIL 指令,如下列四行:

IL_0000: ldarg.0 ; Load the object's 'this' pointer on the stack
IL_0001: ldc.i4.0 ; Load the constant 4-byte value of 0 on the stack
IL_0002: conv.i8 ; Convert the 4-byte 0 to an 8-byte 0
IL_0003: stfld int64 WordCounter::totalLines

位於 IL_0000 的指令會將傳遞至方法的第一個參數載入到虛擬堆疊上,而且一定會將物件記憶體的位址傳遞給每一個執行個體方法 (Instance Method)。這個引數稱為 Argument Zero,而且不會明確顯示在方法的簽名碼中。因此,即使 .ctor 方法看起來像是接收了零個引數,實際上是接收了一個引數。接著,位於 IL_0000 的指令會將這個物件的指標載入到虛擬堆疊上。

位於 IL_0001 的指令會將 4 位元組的零值常數載入到虛擬堆疊上。

位於 IL_0002 的指令會取得堆疊頂端的數值 (4 位元組的零),並將它轉換成 8 位元組的零,如此便會將 8 位元組的零放到堆疊的頂端。

這時,堆疊含有兩個運算元:8 位元組的零和指向這個物件的指標。位於 IL_0003 的指令會使用這兩個運算元,將堆疊頂端的數值 (8 位元組的零) 儲存到堆疊上所辨識物件的 totalLines 欄位中。

totalChars、totalBytes 和 totalWords 欄位會重複相同的 MSIL 指令序列 (Sequence)。

wordCounter 欄位的初始化是從位於 IL_0020 的指令開始,如以下所示:

IL_0020: ldarg.0
IL_0021: newobj instance void [mscorlib]System.Collections.SortedList::.ctor()
IL_0026: stfld class [mscorlib]System.Collections.SortedList WordCounter::wordCounter

位於 IL_0020 的指令會將 WordCounter 的 this 指標推入虛擬堆疊上。newobj 指令不會使用這個運算元,但是位於 IL_0026 的 stfld 指令將會使用。

位於 IL_0021 的指令會告知 Runtime 建立新的 System.Collections.SortedList 物件,並且不使用任何引數呼叫它的建構函式。當 newobj 傳回時,SortedList 物件的位址是在堆疊上。這時候,位於 IL_0026 的 stfld 指令會將 SortedList 物件的指標儲存到 WordCounter 物件的 wordCounter 欄位中。

在所有 WordCounter 物件的欄位都完成初始化之後,位於 IL_002b 的指令會將 this 指標推到虛擬堆疊上,然後 IL_002b 會呼叫基底型別 (Base Type) (System.Object) 中的建構函式。

當然,位於 IL_0031 的最後一個指令是傳回指令,會使 WordCounter 建構函式傳回到建立函式的程式碼中。建構函式必須傳回 void,在建構函式傳回之前才不會將任何物件放入堆疊上。

下面是另外一個範例。請按兩下 GetWordsByOccurranceEnumerator 方法,即可看見它的 MSIL 程式碼,如下圖所示。



您可以看見,這個方法的程式碼大小為 69 個位元組,而且這個方法在虛擬堆疊上需要有四個位置。此外,這個方法還有三個區域變數:一個為 System.Collection.SortedList 型別,另外兩個為 System.Collections.IDictionaryEnumerator 型別。請注意,除非組件與 /debug 選項相容,否則不會將原始程式碼中提到的變數名稱發出到 MSIL 程式碼中。如果沒有使用 /debug,會分別使用 V_0、V_1 和 V_2 等變數名稱來取代 sl、de 和 CS$00000003$00000000。

當這個方法開始執行時,第一件事就是執行 newobj 指令,這個指令會建立新的 System.Collections.SortedList 物件,並呼叫這個物件的預設建構函式。當 newobj 傳回時,所建立物件的位址是在虛擬堆疊上。stloc.0 指令 (位於 IL_0005) 會將這個值儲存在區域變數 0 或 sl (不含 /debug 的 V_0) (屬於 System.Collections.SortedList 型別) 中。

位於 IL_0006 和 IL_0007 的指令會將 WordCounter 物件的 this 指標 (在傳遞至方法的 Argument Zero 中) 載入到堆疊上,並呼叫 GetWordsAlphabeticallyEnumerator 方法。當 call 指令傳回時,列舉值的位址是在堆疊上。stloc.1 指令 (位於 IL_000c) 會將這個位址儲存在區域變數 1 或 de (不含 /debug 的 V_1),這個變數屬於 System.Collections.IDictionaryEnumerator 型別。

位於 IL_000d 的 br.s 指令會造成 while 陳述式的 IL 測試條件無條件分支。這個 IL 測試條件從位於 IL_0032 的指令開始。在 IL_0032 位址中,會將 de (或 V_1) (IDictionaryEnumerator) 的位址推到堆疊上,然後在 IL_0033 位址呼叫它的 MoveNext 方法。如果 MoveNext 傳回 True,表示有要列舉的項目,而且 brtrue.s 指令會跳到位於 IL_000f 的指令。

在位於 IL_000f 和 IL_0010 的指令中,會將 sl (或 V_0) 和 de (或 V_1) 中的物件位址推到堆疊上。然後,呼叫 IdictionaryEnumerator 物件的 get_Value 屬性方法,以取得目前項目的項目數目。這個數目是儲存在 System.Int32 中的 32 位元值。程式碼會將 Int32 物件轉換成 int 數值型別 (Value Type)。將參考型別 (Reference Type) 轉換成數值型別需要位於 IL_0016 的 unbox 指令。當 unbox 傳回時,Unboxed 數值的位址是在堆疊上。ldind.i4 指令 (位於 IL_001b) 會將 4 位元組的數值 (這個數值會指向目前在堆疊上的位址) 載入到堆疊上。換句話說,Unboxed 4 位元組整數是放在堆疊上。

在位於 IL_001c 的指令中,會將 sl (或 V_1) 的數值 (IDictionaryEnumerator 的位址) 推到堆疊上,並呼叫它的 get_Key 屬性方法。當 get_Key 傳回時,System.Object 的位址是在堆疊上。程式碼知道字典中包含字串,因此編譯器會使用位於 IL_0022 的 castclass 指令,將這個 Object 轉換成 String。

以下幾個新的指令 (從 IL_0027 到 IL_002d) 會建立新的 WordOccurrence 物件,然後將物件的位址傳遞至 SortedLists 物件的 Add 方法。

在位於 IL_0032 的指令中,會再評估一次 while 陳述式的測試條件。如果 MoveNext 傳回 True,迴圈 (Loop) 會執行另一個循環。但是,如果 MoveNext 傳回 False,迴圈會停止執行,並在位於 IL_003a 的指令結束。位於 IL_003a 到 IL_0040 的指令會呼叫 SortLists 物件的 GetEnumerator 方法。傳回的值為 System.Collections.IDictionaryEnumerator,它是被留在堆疊上而成為 GetWordsByOccurrenceEnumerator 傳回值。