1:HashMap 的資料結構?
A:哈希表結構(鏈表散列:陣列+鏈表)實作,結合陣列和鏈表的優點,當鏈表長度超過 8 時,鏈表轉換為紅黑樹,
transient Node<K,V>\[\] table;
2:HashMap 的作業原理?
HashMap 底層是 hash 陣列和單向鏈表實作,陣列中的每個元素都是鏈表,由 Node 內部類(實作 Map.Entry介面)實作,HashMap 通過 put & get 方法存盤和獲取,
存盤物件時,將 K/V 鍵值傳給 put() 方法:
①、呼叫 hash(K) 方法計算 K 的 hash 值,然后結合陣列長度,計算得陣列下標;
②、調整陣列大小(當容器中的元素個數大于 capacity * loadfactor 時,容器會進行擴容resize 為 2n);
③、i.如果 K 的 hash 值在 HashMap 中不存在,則執行插入,若存在,則發生碰撞;
ii.如果 K 的 hash 值在 HashMap 中存在,且它們兩者 equals 回傳 true,則更新鍵值對;
iii. 如果 K 的 hash 值在 HashMap 中存在,且它們兩者 equals 回傳 false,則插入鏈表的尾部(尾插法)或者紅黑樹中(樹的添加方式),
(JDK 1.7 之前使用頭插法、JDK 1.8 使用尾插法)(注意:當碰撞導致鏈表大于 TREEIFY_THRESHOLD = 8 時,就把鏈表轉換成紅黑樹)
獲取物件時,將 K 傳給 get() 方法:①、呼叫 hash(K) 方法(計算 K 的 hash 值)從而獲取該鍵值所在鏈表的陣列下標;②、順序遍歷鏈表,equals()方法查找相同 Node 鏈表中 K 值對應的 V 值,
hashCode 是定位的,存盤位置;equals是定性的,比較兩者是否相等,
3.當兩個物件的 hashCode 相同會發生什么?
因為 hashCode 相同,不一定就是相等的(equals方法比較),所以兩個物件所在陣列的下標相同,"碰撞"就此發生,又因為 HashMap 使用鏈表存盤物件,這個 Node 會存盤到鏈表中,
4.你知道 hash 的實作嗎?為什么要這樣實作?
JDK 1.8 中,是通過 hashCode() 的高 16 位異或低 16 位實作的:(h = k.hashCode()) ^ (h >>> 16),主要是從速度,功效和質量來考慮的,減少系統的開銷,也不會造成因為高位沒有參與下標的計算,從而引起的碰撞,
5.為什么要用異或運算子?
保證了物件的 hashCode 的 32 位值只要有一位發生改變,整個 hash() 回傳值就會改變,盡可能的減少碰撞,
6.HashMap 的 table 的容量如何確定?loadFactor 是什么?該容量如何變化?這種變化會帶來什么問題?
①、table 陣列大小是由 capacity 這個引數確定的,默認是16,也可以構造時傳入,最大限制是1<<30;
②、loadFactor 是裝載因子,主要目的是用來確認table 陣列是否需要動態擴展,默認值是0.75,比如table 陣列大小為 16,裝載因子為 0.75 時,threshold 就是12,當 table 的實際大小超過 12 時,table就需要動態擴容;
③、擴容時,呼叫 resize() 方法,將 table 長度變為原來的兩倍(注意是 table 長度,而不是 threshold)
④、如果資料很大的情況下,擴展時將會帶來性能的損失,在性能要求很高的地方,這種損失很可能很致命,
7.HashMap中put方法的程序?
答:“呼叫哈希函式獲取Key對應的hash值,再計算其陣列下標;
如果沒有出現哈希沖突,則直接放入陣列;如果出現哈希沖突,則以鏈表的方式放在鏈表后面;
如果鏈表長度超過閥值( TREEIFY THRESHOLD==8),就把鏈表轉成紅黑樹,鏈表長度低于6,就把紅黑樹轉回鏈表;
如果結點的key已經存在,則替換其value即可;
如果集合中的鍵值對大于12,呼叫resize方法進行陣列擴容,”
8.陣列擴容的程序?
創建一個新的陣列,其容量為舊陣列的兩倍,并重新計算舊陣列中結點的存盤位置,結點在新陣列中的位置只有兩種,原下標位置或原下標+舊陣列的大小,
9.拉鏈法導致的鏈表過深問題為什么不用二叉查找樹代替,而選擇紅黑樹?為什么不一直使用紅黑樹?
之所以選擇紅黑樹是為了解決二叉查找樹的缺陷,二叉查找樹在特殊情況下會變成一條線性結構(這就跟原來使用鏈表結構一樣了,造成很深的問題),遍歷查找會非常慢,推薦:面試問紅黑樹,我臉都綠了,
而紅黑樹在插入新資料后可能需要通過左旋,右旋、變色這些操作來保持平衡,引入紅黑樹就是為了查找資料快,解決鏈表查詢深度的問題,我們知道紅黑樹屬于平衡二叉樹,但是為了保持“平衡”是需要付出代價的,但是該代價所損耗的資源要比遍歷線性鏈表要少,所以當長度大于8的時候,會使用紅黑樹,如果鏈表長度很短的話,根本不需要引入紅黑樹,引入反而會慢,
10.說說你對紅黑樹的見解?
- 每個節點非紅即黑
- 根節點總是黑色的
- 如果節點是紅色的,則它的子節點必須是黑色的(反之不一定)
- 每個葉子節點都是黑色的空節點(NIL節點)
- 從根節點到葉節點或空子節點的每條路徑,必須包含相同數目的黑色節點(即相同的黑色高度)
11.jdk8中對HashMap做了哪些改變?
在java 1.8中,如果鏈表的長度超過了8,那么鏈表將轉換為紅黑樹,(桶的數量必須大于64,小于64的時候只會擴容)
發生hash碰撞時,java 1.7 會在鏈表的頭部插入,而java 1.8會在鏈表的尾部插入
在java 1.8中,Entry被Node替代(換了一個馬甲,
12.HashMap,LinkedHashMap,TreeMap 有什么區別?
LinkedHashMap 保存了記錄的插入順序,在用 Iterator 遍歷時,先取到的記錄肯定是先插入的;遍歷比 HashMap 慢;
TreeMap 實作 SortMap 介面,能夠把它保存的記錄根據鍵排序(默認按鍵值升序排序,也可以指定排序的比較器)
13.HashMap & TreeMap & LinkedHashMap 使用場景?
一般情況下,使用最多的是 HashMap,
HashMap:在 Map 中插入、洗掉和定位元素時;
TreeMap:在需要按自然順序或自定義順序遍歷鍵的情況下;
LinkedHashMap:在需要輸出的順序和輸入的順序相同的情況下,
14.HashMap 和 HashTable 有什么區別?
①、HashMap 是執行緒不安全的,HashTable 是執行緒安全的;
②、由于執行緒安全,所以 HashTable 的效率比不上 HashMap;
③、HashMap最多只允許一條記錄的鍵為null,允許多條記錄的值為null,而 HashTable不允許;
④、HashMap 默認初始化陣列的大小為16,HashTable 為 11,前者擴容時,擴大兩倍,后者擴大兩倍+1;
⑤、HashMap 需要重新計算 hash 值,而 HashTable 直接使用物件的 hashCode
15.Java 中的另一個執行緒安全的與 HashMap 極其類似的類是什么?同樣是執行緒安全,它與 HashTable 在執行緒同步上有什么不同?
ConcurrentHashMap 類(是 Java并發包 java.util.concurrent 中提供的一個執行緒安全且高效的 HashMap 實作),
HashTable 是使用 synchronize 關鍵字加鎖的原理(就是對物件加鎖);
而針對 ConcurrentHashMap,在 JDK 1.7 中采用 分段鎖的方式;JDK 1.8 中直接采用了CAS(無鎖演算法)+ synchronized,
16.HashMap & ConcurrentHashMap 的區別?
除了加鎖,原理上無太大區別,另外,HashMap 的鍵值對允許有null,但是ConCurrentHashMap 都不允許,
17.為什么 ConcurrentHashMap 比 HashTable 效率要高?
HashTable 使用一把鎖(鎖住整個鏈表結構)處理并發問題,多個執行緒競爭一把鎖,容易阻塞;
ConcurrentHashMap
- JDK 1.7 中使用分段鎖(ReentrantLock + Segment + HashEntry),相當于把一個 HashMap 分成多個段,每段分配一把鎖,這樣支持多執行緒訪問,鎖粒度:基于 Segment,包含多個 HashEntry,
- JDK 1.8 中使用 CAS + synchronized + Node + 紅黑樹,鎖粒度:Node(首結點)(實作 Map.Entry),鎖粒度降低了,
18.針對 ConcurrentHashMap 鎖機制具體分析(JDK 1.7 VS JDK 1.8)
JDK 1.7 中,采用分段鎖的機制,實作并發的更新操作,底層采用陣列+鏈表的存盤結構,包括兩個核心靜態內部類 Segment 和 HashEntry,
①、Segment 繼承 ReentrantLock(重入鎖) 用來充當鎖的角色,每個 Segment 物件守護每個散列映射表的若干個桶;
②、HashEntry 用來封裝映射表的鍵-值對;
③、每個桶是由若干個 HashEntry 物件鏈接起來的鏈表

JDK 1.8 中,采用Node + CAS + Synchronized來保證并發安全,取消類 Segment,直接用 table 陣列存盤鍵值對;當 HashEntry 物件組成的鏈表長度超過 TREEIFY_THRESHOLD 時,鏈表轉換為紅黑樹,提升性能,底層變更為陣列 + 鏈表 + 紅黑樹,

19.ConcurrentHashMap 在 JDK 1.8 中,為什么要使用內置鎖 synchronized 來代替重入鎖 ReentrantLock?
①、粒度降低了;
②、JVM 開發團隊沒有放棄 synchronized,而且基于 JVM 的 synchronized 優化空間更大,更加自然,
③、在大量的資料操作下,對于 JVM 的記憶體壓力,基于 API 的 ReentrantLock 會開銷更多的記憶體,
20.ConcurrentHashMap 簡單介紹?
①、重要的常量:
private transient volatile int sizeCtl;
當為負數時,-1 表示正在初始化,-N 表示 N - 1 個執行緒正在進行擴容;
當為 0 時,表示 table 還沒有初始化;
當為其他正數時,表示初始化或者下一次進行擴容的大小,
②、資料結構:
Node 是存盤結構的基本單元,繼承 HashMap 中的 Entry,用于存盤資料;
TreeNode 繼承 Node,但是資料結構換成了二叉樹結構,是紅黑樹的存盤結構,用于紅黑樹中存盤資料;
TreeBin 是封裝 TreeNode 的容器,提供轉換紅黑樹的一些條件和鎖的控制,
③、存盤物件時(put() 方法):
如果沒有初始化,就呼叫 initTable() 方法來進行初始化;
如果沒有 hash 沖突就直接 CAS 無鎖插入;
如果需要擴容,就先進行擴容;
如果存在 hash 沖突,就加鎖來保證執行緒安全,兩種情況:一種是鏈表形式就直接遍歷到尾端插入,一種是紅黑樹就按照紅黑樹結構插入;
如果該鏈表的數量大于閥值 8,就要先轉換成紅黑樹的結構,break 再一次進入回圈
如果添加成功就呼叫 addCount() 方法統計 size,并且檢查是否需要擴容,
④、擴容方法 transfer():默認容量為 16,擴容時,容量變為原來的兩倍,
helpTransfer():呼叫多個作業執行緒一起幫助進行擴容,這樣的效率就會更高,
⑤、獲取物件時(get()方法):
計算 hash 值,定位到該 table 索引位置,如果是首結點符合就回傳;
如果遇到擴容時,會呼叫標記正在擴容結點 ForwardingNode.find()方法,查找該結點,匹配就回傳;
以上都不符合的話,就往下遍歷結點,匹配就回傳,否則最后就回傳 null,
21.ConcurrentHashMap 的并發度是什么?
程式運行時能夠同時更新 ConccurentHashMap 且不產生鎖競爭的最大執行緒數,默認為 16,且可以在建構式中設定,
當用戶設定并發度時,ConcurrentHashMap 會使用大于等于該值的最小2冪指數作為實際并發度(假如用戶設定并發度為17,實際并發度則為32)
原作者:菜鳥小于
原文鏈接: [HashMap面試必問的資料結構相關知識總結 - 菜鳥小于 - 博客園][HashMap_ - _ -]
原出處:博客園
侵刪
關注公眾號:java寶典
轉載請註明出處,本文鏈接:https://www.uj5u.com/houduan/262780.html
標籤:Java
下一篇:電影院售票管理系統

