一、垃圾回收

1.1 判斷物件是否可用

判斷物件是否可用主要有兩種方法：參考計數法和可達性分析，

參考計數法：給物件中添加一個參考計數器，每當有一個地方參考它，計數器就加1；當參考失效時，計數器就減1；任何時刻計數器為0的物件就是不再被使用的，python、Squirrel等使用這種演算法，

優點：實作簡單，效率高

缺點：可能出現回圈參考（A參考B，B參考A，除此之外再沒有任何地方參考A和B，由于兩者相互參考，計數不為0）

可達性分析：通過一系列的被稱為“GC Roots”的物件作為起始點，從這些節點開始向下搜索，搜索走過的路徑成為參考鏈，當一個物件到GC Roots沒有任何參考鏈相連時，則證明此物件不可用，

選取GC Roots的標準是，明確GC Roots物件自己當前是可用的，在Java中，其主要是全域性的參考（比如常量或類靜態屬性）和執行背景關系（比如堆疊幀中的本地變數表），可作為GC Roots的物件包括下面幾種：

1. 虛擬機堆疊（堆疊幀中的本地變數表）中參考的物件

2. 方法區中靜態屬性參考的物件

3. 方法區中常量參考的物件

4. 本地方法中JNI參考的物件（JNI可以參考Java深入JVM原始碼核心探秘Unsafe(含JNI完整使用流程)）

1.2 四種參考

強參考：在程式代碼中普遍存在，類似“Object obj = new Object()”這類的參考，只要強參考還存在，垃圾收集器永遠不會回收被參考的物件，
軟參考：描述一些還有用，但非必須的物件，對于軟參考的物件，在記憶體溢位之前，將會把這些物件列進回收范圍之中進行二次回收，如果這次回識訓是沒有獲得足夠的記憶體，才會拋出記憶體溢位例外，
弱參考：描述非必須的物件，強度比軟參考更弱一些，弱參考的物件只能生存到下一次GC之前，GC時，無論當前記憶體是否足夠，都會回收掉只被弱參考的物件，可使用WeakReference類實作弱參考，
虛參考：最弱的一種參考關系，無法通過虛參考獲得物件實體，其必須和參考佇列一起使用：當GC準備回收一個物件時，如果發現它還有虛參考，就會在GC后將這個虛參考加入參考佇列，在其關聯的虛參考出隊前，不會徹底銷毀該物件，所以可以通過檢查參考佇列中是否有相應的虛參考來判斷物件是否已經被回收了，以達到個跟蹤垃圾回收的目的，可使用PhantomReference類實作虛參考，

如果一個物件沒有強參考和軟參考，對于垃圾回收器而言便是可以被清除的，

1.3 多次標記

如果一個物件在經過可達性分析后認為不可用，那它將會被第一次標記，并且判斷其是否需要執行finalize()方法，判斷的標準是：沒有覆寫finalize()方法，或者方法已經被執行過，那么就認為不需要執行，如果這個物件需要執行finalize()方法，那么其會被放在一個叫做F-Queue的佇列中，并稍后由一個由虛擬機創建的、低優先級的Finalizer執行緒去執行：只是觸發執行，并不會等待其結束（防止finalize()方法執行緩慢導致F-Queue佇列中其它物件一直等待，進而導致GC系統崩潰），

GC將會對F-Queue中的物件進行第二次標記，物件可以在finalize()方法中將自己與參考鏈上的任何一個物件建立關聯，以實作自救，重新關聯后，第二次標記時它將被移出即將回收的集合；如果沒有重新建立關聯，那么就真的被回收了，

二、垃圾收集演算法

2.1 標記-清除演算法

有標記和清除兩個階段，首先標記出需要回收的物件，之后再統一回收被標記的物件，除了效率問題，此演算法最大的不足是清除之后可能會產生大量不連續的記憶體碎片，如果記憶體碎片太多，可能會導致后續需要分配較大物件時，即使空閑記憶體總量足夠，但是由于無法找到連續的記憶體空間而觸發另外一次GC操作，

2.2 標記-整理演算法

分為標記和整理兩個階段，標記程序和標記-清除演算法一樣，整理程序即是讓所有存活的物件都向一端移動，然后直接清理掉端邊界以外的記憶體，所以，以此演算法清理記憶體之后，不存在記憶體碎片，

2.3 復制演算法

將可用的記憶體按照容量劃分為大小相同的兩塊，每次只使用其中一塊，當某一塊記憶體使用告急時，將該記憶體塊中所有存活的物件全部復制到另外一塊中，然后一次性清理掉該記憶體塊中所有的物件，不會產生記憶體碎片，記憶體再次分配時，只需要移動堆頂指標順序分配即可(指標碰撞)，雖然簡單高效，但是可用記憶體空間只有原來的一半，

2.4 分代收集

根據物件不同的生命周期將記憶體劃分為不同的幾塊，比如堆分為新生代和老年代，新創建物件都在新生代，物件在新生代存活過”一段時間”則進入老年代（通常情況），這樣可以根據不同分代中物件的特點，采用適合的收集演算法，

比如，在新生代中，絕大多數的物件都是“短命”的，只有少量會進入老年代，那么可以采取復制演算法，并且不需要按照1:1的比例來劃分記憶體；而老年代的存活率則比較高，并且沒有其它空間對其進行“分配擔保”，則可以采取標記-清除或標記-整理演算法，

2.4.1 新生代垃圾收集

采用復制演算法收集回收新生代，IBM研究表明，新生代中98%的物件都是朝生夕死的，所以并不需要按照1:1的比例劃分記憶體，而將記憶體劃分為一塊較大的Eden空間和兩塊較小的Survivor空間，每次使用Eden和其中一塊Survivor，詳情可參考Hot Spot虛擬機新生代為什么是一個eden+2個survivor，

2.5 回收方法區

方法區中進行GC的性價比通常很低，其主要回收兩部分內容：廢棄常量和無用的類，

回收廢棄常量與回收Java堆中的物件類似，判斷一個常量是否為廢棄常量的標準是：以常量池中字面量的回收為例，對于一個常量池中的字串，如果沒有任何String物件參考它，也沒有其它任何地方參考了這個字面量，那么可以認為是廢棄常量，GC時可以被回收，常量池中的類（介面）、方法、欄位的符號參考等也與此類似，

判斷一個類是否為無用的類需要同時滿足一下3個條件：

該類所有實體都已被回收，即Java堆中不存在該類的實體，
加載該類的ClassLoader已經被回收，
該類對應的java.lang.Class物件沒有在任何地方被參考，無法在任何地方通過反射訪問該類的方法，

三、 HotSpot列舉GC Roots實作

列舉根節點的時候，物件的參考關系不能發生變化，不然結果可能不準確，所以GC進行時必須停頓所有的Java執行執行緒，這就是“Stop The World”，

由于GC Roots的節點主要是全域性的參考和執行背景關系，而方法區通常會很大，如果逐個檢查里面所有的參考，那會消耗很多的時間，由于目前主流Java虛擬機都使用的準確式GC，所以當執行系統停下來之后，虛擬機有辦法知道哪些地方存放著物件參考，而不需要一個不漏的檢查完所有執行背景關系和全域參考，

HotSpot使用一組稱為OopMap的資料結構來達到這個目的，在類加載完成之后，HotSpot就把物件內什么偏移量上是什么型別的資料計算出來，在JIT編譯程序中也會在特定的位置記錄下堆疊和暫存器中哪些位置是參考，這樣GC在掃描時能直接得知這些資訊，

3.1 安全點

由于可能導致OopMap內容變化的指令很多，如果為每條指令都生成對應的OopMap，那會消耗大量的額外空間，所以HotSpot沒有為每條指令都生成OopMap，在上面提到的特定的位置稱之為“安全點”，程式執行時只有在達到安全點時才能暫停，安全點基本上以程式“是否具有讓程式長時間執行的特征”為標準進行選定，比如方法呼叫、回圈跳轉、例外跳轉等，

讓執行緒到安全點停頓下來有兩種方案：

搶先試中斷：GC發生時，首先把所有執行緒全部中斷，如果發現有執行緒中斷的地方不在安全點上，則恢復執行緒，讓它“跑”到安全點，幾乎沒有虛擬機采取這個方案，

主動式中斷：GC需要中斷執行緒時，設定一個標志，各個執行緒執行時主動去輪詢這個標志，發現中斷標志為真時就自己中斷掛起，輪詢標志的地方和安全點是重合的，HotSpot的做法是：需要暫停執行緒時，將0x160100的記憶體頁設定為不可讀，執行緒執行test指令（輪詢指令）時就會產生一個自陷例外信號，然后在預先注冊的例外處理器中暫停執行緒實作等待，

3.2 安全域

另外，如果執行緒處于Sleep或者Blocked狀態，無法回應JVM的中斷請求，“跑”到安全點去中斷掛起，JVM也不會等待執行緒重新被分配CPU時間，這就需要安全域來解決，安全域是指在一段代碼片段中，參考關系不會發生變化，在這個區域中任意位置開始GC都是安全的，執行緒執行到安全域時，首先標識自己進入了安全域，在這離開安全域之前，JVM發起GC時，就不用再管它了，而在執行緒離開安全域時，它要檢查系統是否已經完成了根節點列舉或者整個GC程序，如果完成了則繼續執行，否則等待，直到收到可以離開安全域的信號為止，

轉載請註明出處，本文鏈接：https://www.uj5u.com/qita/261334.html

標籤：其他

上一篇：第一篇的學習記錄

下一篇：人工智能在網路安全中的攻擊和防御

《深入理解Java虛擬機》讀書筆記（三）--垃圾收集器與記憶體分配策略（上）