Java 集合框架其實都講過了,有一篇講 Collection 的,有一篇講 HashMap 的,那沒有看過的小伙伴快去補下啦,文末也都有鏈接;看過的小伙伴,那本文就是檢測學習成果的時候啦
今天這篇文章是單純的從面試的角度出發,以回答面試題為線索,再把整個 Java 集合框架復習一遍,希望能幫助大家拿下面試,
先上圖:

當面試官問問題時,我會先把問題歸類,鎖定這個知識點在我的知識體系中的位置,然后延展開來想這一塊有哪些重點內容,面試官問這個是想考察什么、接下來還想問什么,
這樣自己的思路不會混亂,還能預測面試官下一個問題,或者,也可以引導面試官問出你精心準備的問題,這場面試本質上就是你在主導、你在 show off 自己扎實的基礎知識和良好的溝通交流能力,
其實我在 LRU 那篇文章里就說到過這個觀點,然后就有讀者問我,說會不會被面試官看穿?
答:看出來了又怎樣?面試官閱人無數,是有可能看出來的,但是也只會莞爾一笑,覺得這個同學很用心,
精心準備面試既是對面試官個人時間的尊重,也是表明了你對這家公司的興趣,這樣的員工不是每家公司都想要的嗎?
好了,進入正題,今天就來解決這 9 大面試題,
1. ArrayList vs LinkedList
這題的問法很多,比如
最簡單的就直接問 ArrayList 和 LinkedList 的區別和聯系; 或者問你什么時候要選擇 ArrayList,什么時候選擇 LinkedList; 或者在你們聊到某個場景、或者在演算法題中,面試官問你如何選擇,
萬變不離其宗,
首先結論是:
絕大多數的情形下都偏向于用 ArrayList,除非你有明確的要使用LinkedList的理由,如果你不確定用哪個,就用 ArrayList,
兩者在實作層面的區別是:
ArrayList是用一個可擴容的陣列來實作的 (re-sizing array);LinkedList是用doubly-linked list來實作的,
而陣列和鏈表之間最大的區別就是陣列是可以隨機訪問的(random access),
這個特點造成了在陣列里可以通過下標用 O(1) 的時間拿到任何位置的數,而鏈表則做不到,只能從頭開始逐個遍歷,
兩者在增刪改查操作上的區別:
在「改查」這兩個功能上,因為陣列能夠隨機訪問,所以 ArrayList 的效率高; 在「增刪」這兩個功能上,如果不考慮找到這個元素的時間,陣列因為物理上的連續性,當要增刪元素時,在尾部還好,但是其他地方就會導致后續元素都要移動,所以效率較低;而鏈表則可以輕松的斷開和下一個元素的連接,直接插入新元素或者移除舊元素,
但是呢,實際上你不能不考慮找到元素的時間啊,,,雖然 LinkedList 可以 O(1) 的時間插入和洗掉元素,可以你得先找到地方啊!
不是有個例子么,修理這個零件只需要 1 美元,但是找到這個零件需要 9999 美元,我們平時修 bug 也是如此,重點是找到 root cause 的程序,
而且如果是在尾部操作,資料量大時 ArrayList 會更快的,
事實上,LinkedList 是很多性能問題的 bug,那么為什么呢?
因為 ListNode 在物理記憶體里的不連續,導致它用了很多小的記憶體片段,這會影響很多行程的性能以及 cache-locality(區域性);所以即便是理論上的時間復雜度和 ArrayList 一樣時,也會導致實際上比 ArrayList 慢很多,
2. ArrayList vs Vector
答:
Vector是執行緒安全的,而ArrayList是執行緒不安全的;擴容時擴多少的區別,文鄒鄒的說法就是 data growth methods不同,Vector默認是擴大至 2 倍;ArrayList默認是擴大至 1.5 倍,
回顧下這張圖,

Vector 和 ArrayList 一樣,也是繼承自 java.util.AbstractList,底層也是用陣列來實作的,
但是現在已經被棄用了,因為它是執行緒安全的,任何好處都是有代價的,執行緒安全的代價就是效率低,在某些系統里很容易成為瓶頸,所以現在大家不再在資料結構的層面加 synchronized,而是把這個任務轉移給我們程式員,
那怎么知道擴容擴多少的呢?
看原始碼:
這是 Vecotr 的擴容實作,因為通常并不定義 capacityIncrement,所以默認情況下它是擴容兩倍,
VS

這是 ArrayList 的擴容實作,算術右移操作是把這個數的二進制往右移動一位,最左邊補符號位,但是因為容量沒有負數,所以還是補 0.
那右移一位的效果就是除以 2,那么定義的新容量就是原容量的 1.5 倍,
3. ArrayDeque vs LinkedList
首先要清楚它們之間的關系:

答:
ArrayDeque 是一個可擴容的陣列,LinkedList 是鏈表結構; ArrayDeque 里不可以存 null 值,但是 LinkedList 可以; ArrayDeque 在操作頭尾端的增刪操作時更高效,但是 LinkedList 只有在當要移除中間某個元素且已經找到了這個元素后的移除才是 O(1) 的; ArrayDeque 在記憶體使用方面更高效, 所以,只要不是必須要存 null 值,就選擇 ArrayDeque 吧!
那如果是一個很資深的面試官問你,什么情況下你要選擇用 LinkedList 呢?
答:Java 6 以前,因為 ArrayDeque 在 Java 6 之后才有的, 為了版本兼容的問題,實際作業中我們不得不做一些妥協,
4. HashSet 實作原理
答:
HashSet 是基于 HashMap 來實作的,底層采用 Hashmap 的 key 來儲存元素,主要特點是無序的,基本操作都是 O(1) 的時間復雜度,很快, 所以它的實作原理可以用 HashMap 的來解釋,
5. HashMap 實作原理
答:
在 JDK1.6/1.7,陣列 + 鏈表;在 JDK 1.8,陣列 + 紅黑樹,
具體說來,
對于 HashMap 中的每個 key,首先通過 hash function 計算出一個哈希值,這個哈希值就代表了在桶里的編號,而“桶”實際上是通過陣列來實作的,但是桶有可能比陣列大呀,所以把這個哈希值模上陣列的長度得到它在陣列的 index,就這樣把它放在了陣列里,

這是理想情況下的 HashMap,但現實中,不同的元素可能會算出相同的哈希值,這就是哈希碰撞,即多個 key 對應了同一個桶,
為了解決哈希碰撞呢,Java 采用的是 Separate chaining 的解決方式,就是在碰撞的地方加個鏈子,也就是上文說的鏈表或者紅黑樹,
具體的 put() 和 get()這兩個重要 API 的操作程序和原理,大家可以在公眾號后臺回復「HashMap」獲取文章閱讀,
6. HashMap vs HashTable
答:
Hashtable是執行緒安全的,HashMap并非執行緒安全;HashMap允許key中有null值,Hashtable是不允許的,這樣的好處就是可以給一個默認值,
其實 HashMap 與 Hashtable 的關系,就像 ArrayList 與 Vector,以及 StringBuilder 與 StringBuffer,
Hashtable 是早期 JDK 提供的介面,HashMap 是新版的,這些新版的改進都是因為 Java 5.0 之后允許資料結構不考慮執行緒安全的問題,因為實際作業中我們發現沒有必要在資料結構的層面上上鎖,加鎖和放鎖在系統中是有開銷的,內部鎖有時候會成為程式的瓶頸,
所以 HashMap, ArrayList, StringBuilder 不再考慮執行緒安全的問題,性能提升了很多,
7. 為什么改 equals() 一定要改 hashCode()?
答:
首先基于一個假設:任何兩個 object 的 hashCode 都是不同的,也就是 hash function 是有效的,
那么在這個條件下,有兩個 object 是相等的,那如果不重寫 hashCode(),算出來的哈希值都不一樣,就會去到不同的 buckets 了,就迷失在茫茫人海中了,再也無法相認,就和 equals() 條件矛盾了,證畢,
hashCode()決定了key放在這個桶里的編號,也就是在陣列里的index;equals()是用來比較兩個object是否相同的,
8. 如何解決哈希沖突?
一般來說哈希沖突有兩大類解決方式:
Separate chaining Open addressing
Java 中采用的是第一種 Separate chaining,即在發生碰撞的那個桶后面再加一條“鏈”來存盤,

那么這個“鏈”使用的具體是什么資料結構,不同的版本稍有不同,上文也提到過了:
JDK1.6 和 1.7 是用鏈表存盤的,這樣如果碰撞很多的話,就變成了在鏈表上的查找,worst case 就是 O(n);
JDK 1.8 進行了優化,當鏈表長度較大時(超過 8),會采用紅黑樹來存盤,這樣大大提高了查找效率,
(話說,這個還真的喜歡考,已經在多次面試中被問過了,還有面試官問為什么是超過“8”才用紅黑樹 ??)
第二種方法 open addressing 也是非常重要的思想,因為在真實的分布式系統里,有很多地方會用到 hash 的思想但又不適合用 seprate chaining,
這種方法是順序查找,如果這個桶里已經被占了,那就按照“某種方式”繼續找下一個沒有被占的桶,直到找到第一個空的,

如圖所示,John Smith 和 Sandra Dee 發生了哈希沖突,都被計算到 152 號桶,于是 Sandra 就去了下一個空位 - 153 號桶,當然也會對之后的 key 發生影響:Ted Baker 計算結果本應是放在 153 號的,但鑒于已經被 Sandra 占了,就只能再去下一個空位了,所以到了 154 號,
這種方式叫做 Linear probing 線性探查,就像上圖所示,一個個的順著找下一個空位,當然還有其他的方式,比如去找平方數 Double hashing.
9. Collection vs Collections
這倆看似相近,實則相差十萬八千里,就好像好人和好人卡的區別似的,
Collection 是
集合介面;
是
Java 集合框架的root interface;落腳點是一個
interface;包含了以下這些介面和類:

想系統學習 Collection,可以在公眾號內回復「集合」,獲取爆款文章,
而 Collections 是工具類 utility class,是集合的操作類,提供了一些靜態方法供我們使用,比如:
addAll()binarySearch()sort()shuffle()reverse()
好了,以上就是集合的常考面試題匯總和答案了,希望不僅能幫助你拿下面試,也能真的理解透徹,靈活運用,
最近看到自己的文章在其他平臺被他人搬運,請大家認準全網統一唯一標識「碼農田小齊」,并且懇請大家如果看到沒有寫明作者和來源出處的我的文章,告知我一聲,這些文章都是自己的心肝寶貝啊嗷嗚~
最后,如果你覺得一個人堅持的很難,想有小伙伴一起學習、互相監督打氣的,記得加入我的自習室,
我是小齊,紐約程式媛,終生學習者,每天晚上 9 點,云自習室里不見不散!
更多干貨文章見我的 Github: https://github.com/xiaoqi6666/NYCSDE
轉載請註明出處,本文鏈接:https://www.uj5u.com/qita/166195.html
標籤:其他
