如果你還沒意識到學 JVM 的必要性,或者不知道怎么學 JVM,那么看完這篇文章,你就能知道答案了,曾經的我很不屑于學 JVM,但是后來發現不學不行,這就像和媳婦吵架之后我不想道歉一樣,不道歉那是不可能的,道歉是早晚的事兒,逃不掉,

后來我明白了:
認慫越晚,結局越慘,
但是我學的時候才知道:JVM,你太過分了,太難學了!
我的學習程序可以說非常坎坷,不過經歷坎坷之后,我倒是發現學 JVM 的門道很多,
以我的經驗加上和同行們的交流,我認為學 JVM 最好的方法是:
在程式員不同的水平段,做精準的學習,
所謂的精準學習,就是學習對自己作業有巨大幫助的知識點,以作業內容帶動學習,等到積累多了,再一舉攻克所有 JVM 知識點,最終熟練掌握 JVM 底層原理,
下面我來說說初級、高級、資深程式員,如何循序漸進、分步學習,
初級程式員怎么學
對剛入行的新手程式員,作業一般是修復簡單 bug、開發簡單功能,如何編碼少出 bug,是這個階段的核心問題,
對于這個核心問題,JVM 原理必須深入掌握兩個知識點,
1. 類的初始化
類的初始化,要了解的非常深入才可以,否則,一不留神就會往專案里引入一些有關初始化的 bug,
比如看看下面這段代碼:
public class ParentClass {
private int parentX;
public ParentClass() {
setX(100);
}
public void setX(int x) {
parentX = x;
}
}
public class ChildClass extends ParentClass{
private int childX = 1;
public ChildClass() {}
@Override
public void setX(int x) {
super.setX(x);
childX = x;
System.out.println("ChildX 被賦值為 " + x);
}
public void printX() {
System.out.println("ChildX = " + childX);
}
}
public class TryInitMain {
public static void main(String[] args) {
ChildClass cc = new ChildClass();
cc.printX();
}
}
有興趣可以運行看看結果,一旦把這種代碼放到了生產環境里,排查非常困難,
2. Java 記憶體結構和物件分配**
第二個知識點,就是 Java 記憶體結構和物件分配的基礎知識,尤其是 JVM 記憶體中堆的布局和物件分配的關系,
比如,堆記憶體的布局

當然,Java7 后,新布局變了

知道布局了,就得知道java物件分配的基本原則:
- 物件優先在Eden區分配
- 物件太大直接會分配到老年代
只有知道這些知識,才不會經常寫下底下這種 bug:
// 將全部行數讀取的記憶體中
List<String> lines = FileUtils.readLines(new File("temp/test.txt"), Charset.defaultCharset());
for (String line : lines) {
// pass
}
上面這段代碼,一旦讀取到了大檔案,很可能把生產環境搞崩,
所以,把上述兩個知識點深入理解了,對新手提升自己的代碼質量非常非常有用,只有代碼質量上去了,你才能得到更好的發展,
對于這兩個知識點,我認為通過網路的文章去學習最好,如果直接看書,有兩個最大的缺點:
知識積累不足導致學不懂
書中冗余知識點太多,互相交雜,精力耗費過大,性價比不高
故這里學習推薦根據知識點去搜文章讀,而不是找原理性的書籍看,
高級程式員怎么學
對處于這個階段的朋友,他們已經可以熟練撰寫健壯的代碼了,經常會獨立開發出一個大的功能模塊,有的可能還能獨立開發出一個完整的小型專案,
這時候,他們可能會面臨兩種情況:
1. 需要寫一些工具類給全團隊使用
在這種情況下,你很可能就需要 Java 中的語法糖,因為語法糖能讓你寫出非常靈活簡單的代碼,這包括泛型,自動拆裝箱,可變引數還有遍歷回圈,
但是,使用這些語法糖的時候,如果你不熟悉他們在 JVM 中的實作原理,就非常容易栽個大跟頭,
比如:
public class GenericPitfall {
public static void main(String[] args) {
List list = new ArrayList();
list.add("123");
List<Integer> list2 = list;
System.out.println(list2.get(0).intValue());
}
}
2. 撰寫性能優越的代碼
什么時候需要性能優越的代碼?最常見的就是把以前性能不好的同步實作,轉化成異步實作,
而這種要求,就需要開發對 Java 的多執行緒開發非常熟悉,并且一定要深入理解多執行緒在 JVM 中的原理實作,
不然,可以看看下面這段代碼:
class IncompletedSynchronization {
int x;
public int getX() {
return x;
}
public synchronized void setX(int x) {
this.x = x;
}
}
再看看這段
Object lock = new Object();
synchronized (lock) {
lock = new Object();
}
如果把上面這些代碼上了生產環境,熬通宵排查問題的命運就注定了……
這里的知識點,我推薦通過網上的文章看,又因為涉及到了并發知識,我建議就著《Java Performance》第二版的“Chapter 9. Threading and Synchronization Performance”這章一起看,
還有余力,建議再繼續看周志明的那本《深入理解 JAVA 虛擬機》第三版中的 12-13 章,周志明這本書講的十分深入,也帶來個缺點:門檻高,此時,如果沒看懂可以放一放,
注意,我這里說的是并發的原理,不是并發實踐,讀者想學并發編程,《JAVA 并發編程實踐》我認為是前提條件,故不會贅述,
資深程式員怎么學
這時候的你,已經開始承擔專案開發中很重要的職責了,有些出色的朋友都開始帶團隊了,那這時候,你可能會做下面的事:
1. 合理規劃專案使用資源
合理規劃專案使用資源,前提是對垃圾回收有非常深入的了解,
如果說在新手期,已經對 Java 物件的記憶體分配和記憶體使用有了大致的概念,那么,這個垃圾回收,則是這類知識的進一步拓展,
只有理解了各種垃圾回收的原理,再配合著 Java 記憶體布局的基礎知識,才能更好地規劃出專案用什么回收演算法,才能在合適的資源利用度上得到最佳性能,
比如,新生代和老年代之間的合適比例,比如,新生代中 Eden 和 Survivor 區域間的比例,
2. 排查各種線上問題
要排查各種問題,就需要對 JVM 提供的各種故障排查工具非常了解,
這些工具又分為兩類:
- 基礎的命令列形式的故障處理工具,比如 jps、jstack 等等
- 第二類是可視化的故障處理工具,比如 VisualVM
但是,掌握工具的使用還不夠,因為有關垃圾回收的問題,還必須得通過決議 GC 日志后,再通過工具的使用,才可能能定位到問題的根源,
所以,最好對使用故障排查工具和 GC 日志都非常熟練,
比如:
2021-05-26T14:45:37.987-0200: 151.126:
[GC (Allocation Failure) 151.126: [DefNew: 629119K->69888K(629120K), 0.0584157 secs] 1619346K->1273247K(2027264K), 0.0585007 secs]
[Times: user=0.06 sys=0.00, real=0.06 secs]
2021-05-26T14:45:59.690-0200: 172.829:
[GC (Allocation Failure) 172.829: [DefNew: 629120K->629120K(629120K), 0.0000372 secs]172.829: [Tenured: 1203359K->755802K(1398144K), 0.1855567 secs] 1832479K->755802K(2027264K), [Metaspace: 6741K->6741K(1056768K)], 0.1856954 secs]
[Times: user=0.18 sys=0.00, real=0.18 secs]
上面這條,應該一眼看出來,垃圾演算法用的是 Serial 收集器,并且年輕代分配出現了問題,大小可能需要調整,
這里的知識點,強烈反對看網上的文章,網上說的很多細節有問題,疏漏很多,所以,推薦看書,
《Java Performance》第二版里,“Chapter 5. An Introduction to Garbage Collection”,“Chapter 6. Garbage Collection Algorithms”的知識已經足夠,
有人去看《深入理解 JAVA 虛擬機》第三版中的第 3 章,講垃圾收集器與記憶體分配策略的,這里還是老問題,講的太細,我建議繞過 3.4 節,講 HotSpot 演算法細節的那塊兒,
這里安全點這個知識點挺重要,但是現在這個階段想理解挺難的,我覺得將來做一些底層框架,接觸到崩潰恢復的 checkpoint 相關思想了,再回頭來學習,那才能真正理解和掌握,
技術專家怎么學
達到這個級別了,那就需要對整套 JVM 要有非常深入的了解了,因為你是解決技術問題的最后保障了,有些時候,甚至還需要因為某些問題開發出各種各樣的工具,
曾經,有個專案時不時總是會報錯:
java.lang.OutOfMemoryError: GC overhead limit exceeded
這個問題幾個同事都沒搞定,就來找我,我看了看,突然想起來,以前在官方調優指南《HotSpot Virtual Machine Garbage Collection Tuning Guide》看到過相關介紹,
JVM 本身記憶體不足就會運行 GC,但是如果每次 GC 回收的記憶體不夠,那么很快就會開始下一次 GC,
JVM 有個默認的保護機制,如果發現在一個統計周期內,98% 的時間都是在運行 GC,記憶體回收卻少于 2% 的時候,就會報這個錯,
怎么引起的呢?這個問題如果去排查代碼,那真的是難如登天,首先,沒有任何堆疊錯誤去幫助定位問題,其次,專案代碼量大了去了,而且是年頭久遠,
這時,就需要通過對 JVM 總體的深入理解,去反推問題了,我當時是這樣推理的:
記憶體溢位,GC 無法回收問題,說明了兩個問題:
- 堆內的記憶體不夠用了
- 占用記憶體的物件要么就是該關閉的資源沒有關閉,要么被大量的暫時放在一起了
那如果我 dump 出記憶體檔案出來,再分析下就知道是哪些物件在占用記憶體了,
一查發現是大量的字串在占用記憶體,
綜合我前面的推測,字串不是資料庫連接,肯定沒有該關閉未關閉的問題,那就剩一個可能了,就是被大量的暫時放起來了,導致 GC 回收不了,
那么新問題來了,能大量放字串的,會是什么?
首先就去猜快取,根據這條線索,直接去原始碼搜 Cache 關鍵詞,把所有關于 Cache 的代碼都看了下,一下子就找到問題了,
原來,我們有個功能是決議一個非常大的檔案,檔案的格式如下:

需要把這個檔案的每一行內容按照列去一起存到資料庫里,
由于寫代碼的人偷懶,想一次決議完畢后一股腦全塞到資料庫里,所以,他弄了個 Map,Map 的 Key 是相同的列名,Value是每一行決議過的內容,
而這樣寫代碼的結果就是,一行對應了一個有三個條目的 HashMap,如果檔案有十幾萬行,就有十幾萬的 HashMap,然后,這些 HashMap 再存到一個串列里,再把這個串列放到一個叫做 xxxCache 的 HashMap 中,
示意代碼如下:
public class ParseFile4OOM {
public static void main(String[] args) {
List<Map<String, String>> lst = new ArrayList<>();
for (int i = 0; i < 100000; i++) {
Map<String, String> map = new HashMap<>();
map.put("Column1", "Content1");
map.put("Column2", "Content2");
map.put("Column3", "Content3");
lst.add(map);
}
Map<String, List<Map<String, String>>> contentCache = new HashMap<>();
contentCache.put("contents", lst);
}
}
那對這種情況怎么辦呢?代碼還不能大動,只能優化,
那時,我們已經用了 JDK8 了,引入了 String 常量池,同時,Hashmap 在這個業務場景下,容積是固定的,所以,就不應該給它多分配空間,就固定死為 3,
優化后,代碼如下:
public class ParseFile4OOM {
public static void main(String[] args) {
List<Map<String, String>> lst = new ArrayList<>();
for (int i = 0; i < 100000; i++) {
Map<String, String> map = new HashMap<>(3);
map.put("Column1".intern(), "Content1".intern());
map.put("Column2".intern(), "Content2".intern());
map.put("Column3".intern(), "Content3".intern());
lst.add(map);
}
Map<String, List<Map<String, String>>> contentCache = new HashMap<>();
contentCache.put("contents".intern(), lst);
}
}
把優化后的代碼上線,錯誤搞定了!
所以,在這個階段就非得把 JVM 吃透不可了,吃透原理就必須靠看書了,
周志明的《深入理解 JAVA 虛擬機》是必須的了,但是還不夠,
《Oracle JRockit: The Definitive Guide》這本書我也建議讀一讀,雖然老了,但是里面的很多內容,尤其前四章,對 JVM 原理真的快講透了,對 JVM 是如何彈性伸縮去平衡資源和性能關系的,娓娓道來,讓我醍醐灌頂,編程視野一下子打開了很多,
至此,不同階段的學習方法講完了,
總的來說,JVM 知識廣博復雜,如果想要掌握,不能一蹴而就,而且咱們程式員不容易,需要學的知識太多,然而咱們的精力卻是有限的,
所以,對于 JVM 原理來說,假設有些知識點眼前看不懂,用不上,可以先暫時放一放,做到精準學習,把省下來的精力用在別的知識甚至自己的生活上,更有意義,
看完如果覺得有識訓,希望能三連點贊+評論,你的支持對我很重要,
最后,祝大家早日學有所成,拿到滿意offer,快速升職加薪,走上人生巔峰,記得給我一個一鍵三連哦!老子愛你們!

轉載請註明出處,本文鏈接:https://www.uj5u.com/houduan/290071.html
標籤:java
