我是風箏,公眾號「古時的風箏」,一個兼具深度與廣度的程式員鼓勵師,一個本打算寫詩卻寫起了代碼的田園碼農!
文章會收錄在 JavaNewBee 中,更有 Java 后端知識圖譜,從小白到大牛要走的路都在里面,
我們都知道 Java 程式都是跑在 JVM 上的,一旦 JVM 有什么風吹草動,必然會影響服務的穩定性,幸運的話,服務會發生抖動,可能有部分請求出現延遲或例外,不幸的話,JVM 直接崩潰,導致服務完全中斷,
這可不是什么好事,與 JVM 一起崩潰的,除了服務,還有我們的心態,
所謂的 JVM 崩潰,一般情況下就是指記憶體溢位,也就是 OutOfMemoryError 和 StackOverflowError,另外還有一種情況就是堆外記憶體占用過大,這種情況會導致 JVM 所在機器的記憶體被撐爆,從而導致機器重啟等例外情況發生,我們把這種情況叫做記憶體泄漏,
那什么情況下會造成 JVM 崩潰呢,有哪幾種型別的崩潰呢?俗話說,知己知彼,方能百戰不殆,了解了發生崩潰的原因,才能更好的解決 JVM 崩潰問題,

首先還是放出 JVM 記憶體模型圖,JVM 要理解起來是很抽象的,借助下面這張圖可以具象化的了解 JVM 記憶體模型,而發生溢位的幾個部分都可以在圖中找到,在 JDK 8 中,永久代已經不存在了,取而代之的是元空間(metaspace),

下面就以 Hotspot JDK 8 為背景,看一下 JVM 記憶體溢位和記憶體泄漏的幾種情況,
首先設定 JVM 啟動引數,限制堆空間大小,堆空間設定為 20M,其中新生代10M,元空間10M,并指定垃圾收集演算法采用 CMS 演算法,之后的例子都會使用這套引數,
-XX:+UseConcMarkSweepGC
-XX:+UseCMSInitiatingOccupancyOnly
-XX:CMSInitiatingOccupancyFraction=70
-XX:+ExplicitGCInvokesConcurrentAndUnloadsClasses
-XX:+CMSClassUnloadingEnabled
-XX:+ParallelRefProcEnabled
-XX:+CMSScavengeBeforeRemark
-verbose:gc
-Xms20M
-Xmx20M
-Xmn10M
-XX:+PrintGCDetails
-XX:SurvivorRatio=8
-XX:+HeapDumpOnOutOfMemoryError
-XX:MetaspaceSize=10M
-XX:MaxMetaspaceSize=10M
-XX:HeapDumpPath=/Users/fengzheng/jvmlog
堆溢位
堆溢位,應該是最常見的一種記憶體溢位的場景了,JVM 中分配絕大多數物件實體和陣列都存在堆上,另外堆記憶體也是垃圾收集器作業的主要戰場,
當我們的 Java 程式啟動的時候,會指定堆空間的大小,新建物件和陣列的時候會分配到堆上面,當新物件申請空間的時候,如果堆記憶體不夠了,就會發生垃圾收集動作,大多數時候會發生在新生代,叫做 Minor GC,當新生代回收完成,空間仍然不夠的話,會發生一次 FullGC,FullGC 后,空間仍然不夠,此時就會發生 OOM 錯誤,也就是堆溢位,
模擬一下這個場景
private final static int _1K = 1024;
public static void main(String[] args){
List<byte[]> byteList = new ArrayList<>();
quietlyWaitingForCrashHeap(byteList);
}
public static void quietlyWaitingForCrashHeap(List<byte[]> byteList) {
try {
while (true) {
byteList.add(new byte[500 * _1K]);
//Thread.sleep(1000);
Thread.sleep(100);
}
} catch (InterruptedException e) {
}
}
上面的方法會持續的向List<byte[]>陣列中每次添加500k的元素,整個堆只有20M,可想而知,程式一運行起來,馬上就會將對空間填滿,導致后面的元素加不進去,而又回收不掉,從而導致堆記憶體溢位,
下面是程式運行之后的結果,經過垃圾回收最侄訓是沒有多余的空間,從而發生 java.lang.OutOfMemoryError: Java heap space例外,

發生堆記憶體溢位的根本原因就是使用中的物件大小超過了堆記憶體大小,
堆記憶體空間設定的太小,要根據預估的實際使用堆大小合理的設定堆空間設定,
程式有漏洞導致,某些靜態變數持續的增大,例如快取資料錯誤的初始化,導致快取無止境的增加,最終導致堆記憶體溢位,針對這種情況,恐怕沒什么好方法,除了做好測驗之外,就是在問題發生后做好日志分析,
堆疊溢位
虛擬機堆疊是用來存盤區域變數表、運算元堆疊、動態鏈接、方法出口等資訊的,每呼叫一個 Java 方法就會為此方法在虛擬機堆疊中生成堆疊幀,
堆疊除了包括虛擬機堆疊之外,還包括本地方法堆疊,當呼叫的方法是本地方法(例如 C 語言實作的方法)時,會用到本地方法堆疊,不過,在 HotSpot 虛擬機中,虛擬機堆疊和本地方法堆疊被合二為一了,
模擬堆疊溢位場景
public static void main(String[] args){
stackOverflow();
}
/**
* stackoverflow
*/
public static void stackOverflow() {
stackOverflow();
}
在上面的代碼中,stackOverflow() 方法的呼叫是一個無限遞回的程序,沒有遞回出口,前面說了,每呼叫一個方法就會在虛擬機堆疊中生成堆疊幀,無限的遞回,必定造成無限的生成堆疊幀,最后導致堆疊空間被填滿,從而發生溢位,

上面模擬了最常見的一種狀況,產生這種狀況的原因很可能是由于程式 bug 導致的,一般來說,遞回必定會有遞回出口,如果由于某些原因導致了程式在執行的程序中無法達到出口條件,那就會造成這種例外,還有就是回圈體,回圈體的回圈次數如果過大,也有可能出現堆疊溢位,
另外還可能是其他比較不容易出現的原因,比如創建的執行緒數過多,執行緒創建要在虛擬機堆疊中分配空間,如果創建執行緒過多,可能會出現 OutOfMemoryError例外,但是一般來說,都會用執行緒池的方法代替手動創建執行緒的方式,所以,這種情況不容易出現,
元空間溢位
用于存盤已被虛擬機加載的類資訊,常量,靜態變數,即時編譯(JIT)后的代碼等資料,在 JDK 8 中,已經用 metaSpace 代替了永久代的,默認情況下 metaSpace 的大小是沒有限制的,也就是所在服務器的實際記憶體大小,但是,一般情況下,最好還是設定元空間的大小,
一般在產生大量動態生成類的情景中,可能會出現元空間的記憶體溢位,
模擬元空間溢位
public static void main(String[] args){
List<byte[]> byteList = new ArrayList<>();
//quietlyWaitingForCrashHeap(byteList);
// stackOverflow();
methodAreaOverflow();
}
public static void methodAreaOverflow() {
int i = 0;
while (true) {
Enhancer enhancer = new Enhancer();
enhancer.setUseCache(false);
enhancer.setSuperclass(MethodOverflow.class);
enhancer.setCallback(new MethodInterceptor() {
@Override
public Object intercept(Object o, Method method, Object[] objects, MethodProxy methodProxy) throws Throwable {
return methodProxy.invokeSuper(o, objects);
}
});
enhancer.create();
System.out.println(++i);
}
}
通過 CGLIB 的方式動態的創建很多個動態類,這樣一來,類資訊就會越來越多的存到元空間,從而導致元空間溢位,

例如在使用 Spring、 MyBatis 等技術框架的時候會動態創建 Bean 實體類,另外,Spring AOP 也會產生動態代理類,
堆外記憶體溢位
大多數情況下,記憶體都會在 JVM 堆記憶體中分配,很少情況下需要直接在堆外分配記憶體空間,使用堆外記憶體的幾個好處是:
- 在行程間可以共享,減少虛擬機間的復制
- 對垃圾回收停頓的改善:如果應用某些長期存活并大量存在的物件,經常會出發YGC或者FullGC,可以考慮把這些物件放到堆外,過大的堆會影響Java應用的性能,如果使用堆外記憶體的話,堆外記憶體是直接受作業系統管理( 而不是虛擬機 ),這樣做的結果就是能保持一個較小的堆內記憶體,以減少垃圾收集對應用的影響,
- 在某些場景下可以提升程式I/O操縱的性能,少去了將資料從堆內記憶體拷貝到堆外記憶體的步驟,
通常在需要大量頻繁的進行 IO 操作的時候會用到堆外記憶體,例如 Netty、RocketMQ 等使用到了堆外記憶體,目的就是為了加快速度,
所以,在出現系統記憶體占用過大的情況時,排查堆疊無果后,可以看一下堆外記憶體的使用情況,看看是不是堆外記憶體溢位了,
總結
事前做好配置
JVM 問題本身就是比較抽象和難以直觀發現的,所以在專案上線前除了做好代碼邏輯的測驗外,還要對 JVM 引數進行合理配置,根據應用程式的體量和特點選擇好合適的引數,比如堆疊大小、垃圾收集器種類等等,
另外,垃圾收集日志一定要有保留,還有就是發生記憶體溢位時要保存 dump 檔案,
事中做好監控
在程式上線運行的程序中,做好 JVM 的監控作業,比如用 Spring Admin 這種比較輕量的監控工具,或者大型專案用 Cat、SkyWallking 等這些分布式鏈路監控系統,
事后做好現場保護和分析
再合理的引數配置和監控平臺,也難免不發生例外,這也是很正常的,不出現例外才有問題好吧,在發生例外之后,要及時的保留現場,如果是多實體應用,可以暫時將發生例外的實體做下線處理,然后再進行問題的排查,如果是單實體的服務,那要及時的確認最新的日志和dump已經留存好,確認完成后,再采取錯誤讓服務重啟,
這位英俊瀟灑的少年,如果覺得還不錯的話,給個推薦可好!
公眾號「古時的風箏」,Java 開發者,全堆疊工程師,bug 殺手,擅長解決問題,
一個兼具深度與廣度的程式員鼓勵師,本打算寫詩卻寫起了代碼的田園碼農!堅持原創干貨輸出,你可選擇現在就關注我,或者看看歷史文章再關注也不遲,長按二維碼關注,跟我一起變優秀!

轉載請註明出處,本文鏈接:https://www.uj5u.com/houduan/203309.html
標籤:其他
