這次我們翻譯了一篇Unity官方博客上的文章,原文題目為AN INTRODUCTION TO IL2CPP INTERNALS ,作者是從事Unity軟體開發的Joshua Peterson,文章的看點在于,它是以IL2CPP內部開發人員的角度來講述的,所以對于開發者來說非常有參考價值,
AN INTRODUCTION TO IL2CPP INTERNALS
作者:Joshua Peterson
翻譯:Bowie
大約在一年以前,我們寫了一篇博客討論Unity中腳本將來會是個什么樣子,在那篇博客中我們提到了嶄新的IL2CPP后端,并許諾其會為Unity帶來更高效和更適合于各個平臺的虛擬機,在2015年的一月份,我們正式發布了第一個使用IL2CPP的平臺:iOS 64-bit,而隨著Unity 5的發布,又帶給大家另一個使用IL2CPP的平臺:WebGL,感謝我們社區中用戶的大量寶貴的反饋,我們在接下來的時間里根據這些反饋得以更新IL2CPP,發布補丁版本,從而持續的改進IL2CPP的編譯器和運行時庫,
我們沒有停止改進IL2CPP的打算,但是在目前這個時間點上,我們覺得可以回過頭來抽出點時間告訴大家一些IL2CPP的內部作業機制,在接下來的幾個月的時間里,我們打算對以下話題(或者還有其他未列出的話題)進行討論,來做一個IL2CPP深入講解系列,目前準備討論的話題有:
1.基礎 - 工具鏈和命令列引數(本篇博文)
2.IL2CPP生成代碼介紹
3.IL2CPP生成代碼除錯小竅門
4.方法呼叫介紹(一般方法呼叫和虛方法呼叫等)
- 通用代碼共享的實作
6.P/invoke(Platform Invocation Service)對于型別(types)和方法(methods)的封裝
7.垃圾回收器的集成
8.測驗框架(Testing frameworks)及其使用
為了能讓這個系列的討論成為可能,我們會涉及到一些將來肯定會進行改動的IL2CPP的實作細節,但這也沒有關系,通過這些討論,我們希望能給大家提供一些有用和有趣的資訊,
什么是IL2CPP?
從技術層面上來說,我們說的IL2CPP包含了兩部分:一個進行 預先編譯(譯注:ahead-of-time,又叫AOT,以下一律使用AOT縮寫)的編譯器,
一個支持虛擬機的運行時庫
AOT編譯器將由.NET 輸出的中間語言(IL)代碼生成為C++代碼,運行時庫則提供諸如垃圾回收,與平臺無關的執行緒,IO以及內部呼叫(C++原生代碼直接訪問托管代碼結構)這樣的服務和抽象層,
AOT編譯器
IL2CPP AOT編譯器實際的執行檔案是il2cpp.exe,在Windows平臺你可以在Unity安裝路徑的Editor\Data\il2cpp目錄下找到,對于OSX平臺,它位于Unity安裝路徑的Contents/Frameworks/il2cpp/build目錄內, il2cpp.exe這個工具是一個托管代碼可執行檔案,其完全由C#寫成,在開發IL2CPP的程序中,我們同時使用.NET和Mono編譯器對其進行編譯,
il2cpp 接受來自Unity自帶的或者由Mono編譯器產生的托管程式集,將這些程式集轉換成C++代碼,這些轉換出的C++代碼最終由部署目標平臺上的C++編譯器進行編譯,
你可以參照下圖理解IL2CPP工具鏈的作用:

IL2CPP工具鏈
運行時庫
IL2CPP的另外一個部分就是對虛擬機提供支持的運行時庫,我們基本上是用C++代碼來實作整個運行時庫的(好吧,其實里面還是有一些和平臺相關的代碼使用了程式集,這個只要你知我知便好,不要告訴別人 ),我們把運行時庫稱之為libli2cpp,它是作為一個靜態庫被連接到最終的游戲可執行檔案中,這么做的一個主要的好處是可以使得整個IL2CPP技術是簡單并且是可移植的,
你能通過查看隨Unity一起發布的libil2cpp頭檔案來窺探其代碼組織方式(Windows平臺,頭檔案在Editor\Data\PlaybackEngines\webglsupport\BuildTools\Libraries\libil2cpp\include目錄中,OSX平臺,頭檔案在Contents/Frameworks/il2cpp/libil2cpp目錄中),舉個例子,由il2cpp產生的C++代碼和libil2cpp之間的介面API,存在于codegen/il2cpp-codegen.h這個檔案中,
運行時的另外一個重要的部分,就是垃圾收集器,在Unity 5中,我們使用libgc垃圾收集器,它是一個典型的貝姆垃圾收集器(Boehm-Demers-Weiser garbage collector),(譯注:相對使用保守垃圾回收策略),然而我們的libil2cpp被設計成可以方便使用其他垃圾回收器,因此我們現在也在研究集成微軟開源的垃圾回收器(Microsoft GC),對于垃圾回收器這一點,我們會在后續的一篇中專門的討論,這里就不多說了,
il2cpp是如何執行的?
讓我們從一個簡單的例子入手,這里使用Unity的版本是5.0.1,在Windows環境并且建立一個全新的空專案,然后創建一個帶MonoBehaviour的腳本檔案,將其作為組件加入到Main Camera上,代碼也是非常的簡單,輸出Hello World:
- using UnityEngine;
- public class HelloWorld : MonoBehaviour {
- void Start () {
- Debug.Log("Hello, IL2CPP!");
- }
- }
當我切換到WebGL平臺進行專案生成的時候,我們可以用Process Explorer來對il2cpp的命令列進行觀察,得到以下內容:
"C:\Program Files\Unity\Editor\Data\MonoBleedingEdge\bin\mono.exe" "C:\Program Files\Unity\Editor\Data\il2cpp/il2cpp.exe" --copy-level=None --enable-generic-sharing --enable-unity-event-support --output-format=Compact --extra-types.file="C:\Program Files\Unity\Editor\Data\il2cpp\il2cpp_default_extra_types.txt" "C:\Users\Josh Peterson\Documents\IL2CPP Blog Example\Temp\StagingArea\Data\Managed\Assembly-CSharp.dll" "C:\Users\Josh Peterson\Documents\IL2CPP Blog Example\Temp\StagingArea\Data\Managed\UnityEngine.UI.dll" "C:\Users\Josh Peterson\Documents\IL2CPP Blog Example\Temp\StagingArea\Data\il2cppOutput"
嗯,這個真是老太太的裹腳布 - 又臭又長......,所以讓我們把命令分拆一下,Unity運行的是這個可執行檔案:
"C:\Program Files\Unity\Editor\Data\MonoBleedingEdge\bin\mono.exe"
下一個引數是il2cpp.exe工具本身:
"C:\Program Files\Unity\Editor\Data\il2cpp/il2cpp.exe"
請注意剩下的引數其實都是傳遞給il2cpp.exe的而不是mono.exe,上面的例子里傳遞了5個引數給il2cpp.exe:
–copy-level=None
指明il2cpp.exe不對生成的C++檔案進行copy操作
–enable-generic-sharing
告訴IL2CPP如果可以,對通用方法進行共享,這個可以減少代碼并降低最后二進制檔案的尺寸
–enable-unity-event-support
確保和Unity events相關的,通過反射機制來運作的代碼,能夠正確生成,
–output-format=Compact
在生成C++代碼時為里面的型別和方法使用更短的名字,這會使得C++代碼難以閱讀,因為原來在IL中的名字被更短的取代了,但好處是可以讓C++編譯器運行的更快,
–extra-types.file=”C:\Program Files\Unity\Editor\Data\il2cpp\il2cpp_default_extra_types.txt”
使用默認的(也是空的)額外型別檔案,il2cpp.exe會將在這個檔案中出現的基本型別或者陣列型別看作是在運行時生成的而不是一開始出現在IL代碼中來對待,
需要注意的是這些引數可能會在以后的Unity版本中有所變化,我們現在還沒有穩定到把il2cpp.exe的命令列引數整理固定下來的階段,
最后,我們有由兩個檔案組成的一個串列和一個目錄在這個長長的命令列中:
“C:\Users\Josh Peterson\Documents\IL2CPP Blog Example\Temp\StagingArea\Data\Managed\Assembly-CSharp.dll”
“C:\Users\Josh Peterson\Documents\IL2CPP Blog Example\Temp\StagingArea\Data\Managed\UnityEngine.UI.dll”
“C:\Users\Josh Peterson\Documents\IL2CPP Blog Example\Temp\StagingArea\Data\il2cppOutput”
il2cpp.exe工具可以接收一個由IL程式集組成的串列,在上面這個例子中,程式集包含了專案中的簡單腳本程式集:Assembly-CSharp.dll,和GUI程式集:UnityEngine.UI.dll,大家可能會注意到這里面明顯少了什么:UnityEngine.dll到哪去了?系統底層的mscorlib.dll也不見了蹤影,實際上,il2cpp.exe會在內部自動參考這些程式集,你當然也可以把這些放入串列中,但他們不是必須的,你只需要提及那些根程式集(那些沒有被其他任何程式集參考到的程式集),剩下的il2cpp.exe會根據參考關系自動加入,
裹腳布的最后一塊是一個目錄,il2cpp.exe會將最終的C++代碼生成到這里,如果你還保持著一顆好奇的心,可以看看這個目錄中產生的檔案,這些檔案是我們下一個討論的主題,在你審視這些代碼前,可以考慮將WebGL構建設定中的“Development Player”選項勾上,這么做會移除–output-format=Compact命令列引數從而讓C++代碼中的型別和方法的名字更加可讀,
嘗試在WebGL或者iOS構建設定中進行些改變,這樣你會發現傳遞給il2cpp.exe的引數也會相應的發生變化,例如,將“Enable Exceptions” 設定成“Full” 會將–emit-null-checks,–enable-stacktrace,和 –enable-array-bounds-check這三個引數加入il2cpp.exe命令列,
IL2CPP沒做的事情
我想指出IL2CPP有一向挑戰我們沒有接受,而且我們也高興我們忽略了它,我們沒有嘗試重寫整個C#標準庫,當你使用IL2CPP后端構建Unity專案的時候,所有在mscorlib.dll,System.dll等中的C#標準庫和原來使用Mono編譯時候的一模一樣,
我們可以依賴健壯的且久經考驗的C#標準庫,所以當處理有關IL2CPP的bug的時候,我們可以很肯定的說問題出在AOT編譯器或者運行時庫這兩個地方而不是在其他地方,
我們如何開發,測驗,發布IL2CPP
自從我們在一月份的4.6.1 p5版本中首次引入IL2CPP以來,我們已經連續發布了6個Unity版本和7個補丁(Unity版本號跨越4.6和5.0),在這些發布中我們修正了超過100個bug,
為了確保持續的改進得以實施,我們內部只保留一份最新的開發代碼在主干分之(trunk branch)上,在發布各個版本之前,我們會將IL2CPP的改動掛到一個特定的分之下,然后進行測驗,確保所有的bug已經正確的修正了,我們的QA和維護作業組為此付出了驚人的努力才得以保證發布版本的快速迭代,(譯注:感覺是版本管理的標準的開發流程)
提供高質量Bug的用戶社區被證明是一個無價之寶,我們非常感謝用戶的反饋來幫助我們改進IL2CPP,并且希望這類反饋越多越好,
我們的IL2CPP研發組有很強烈的“測驗優先”意識,我們時常使用“Test Driven Design”方法,在沒有進行足夠全面的測驗的情況下,幾乎不會進行代碼的合并作業,這個策略用在IL2CPP專案上非常的棒,我們現在所面對的大部分bug并不是意想不到的行為產生的,而是由意想不到的特殊情況產生的,(例如在一個32位的索引陣列中使用了64位的指標從而導致C++編譯器失敗)面對這種型別的bug我們可以快速的并且很自信的進行修正,
有了社區的幫助,我們非常努力的讓IL2CPP既快又穩定,順便說一句,如果你對我剛才說的這些有興趣,我們正在招人(嗯.....我只是這么一說)
好戲連臺
關于IL2CPP我們還有很多可以說的,下一次我們會深入到il2cpp.exe代碼生成的細節中,看看對于C++編譯器來說,由il2cpp.exe生成的代碼會是個什么樣子,
作者:IndieACE
鏈接:https://www.jianshu.com/p/dd430c991d0b
來源:簡書
簡書著作權歸作者所有,任何形式的轉載都請聯系作者獲得授權并注明出處,
轉載請註明出處,本文鏈接:https://www.uj5u.com/net/112654.html
標籤:C#
