HashMap面試靈魂幾問-有解無憂

hashMap 面試常問

1、HashMap的默認容量？

在這里插入圖片描述

2、hash如何put，如何解決hash沖突

2.1、如何計算hash值

hashmap 如何put，可以回答先計算得到hash值，然后確定hash桶的坐標

1、通過hashcode()方法，使其無符號右移 16 位，并且與自身位異域運算
在這里插入圖片描述
2、再用該hash與map（總容量-1）做位與運算，得到一個小于haspMap總容量的一個整數，

文字敘述：
如果 put一個（“xxx”,123）,首先根據 key 呼叫 hashcode()方法生成 hash值，然后無符號右移 16 位（jdk7 沒有這一部，jdk8為了是hash 低16位分布更加均勻，因為一般的長度不會超過 2的16次方），
然后進行位異域運算，之后再與容器長度（length -1）進行位與運算

2.2、如何解決hash沖突

hash沖突定義：
基于上面，基于一系列二進制運算最后會得到一個 int型別 hash值，
不同的key，通過一系列計算會得到，相同的 hash值，
這里有一個概念，就是，hashcode 相同，equal 可能不相同，equal相同 hashcode 一定相同，
1、如果初次插入，判斷 tab陣列節點是否為空，如果為空會 new一個node節點
在這里插入圖片描述
2、如果通過一系列二進制運算得到的hash值，在原本的陣列節點已經存在，
這里分為倆種情況，
一種是 map.put(“a”,“舊值”) ,再次 map.put(“a”,"新值 ") ，相同key 覆寫的情況，
會比較倆者hash 值，并且比較二者的key 是不是相同，
如果二者經過一系列二進制運算得到的hash值相同，并且key（這里的key指的是這里的 “a”）也相同，
就會重寫寫入該值，
在這里插入圖片描述
3、發生hash沖突，寫入鏈表，
基于步驟2，滿足hash值相同，并且 key值不相同，
會使用指標 p.next 存放當前發生沖突的key值，

4、如果發生沖突的時候，會檢測我們桶節點，鏈表的長度，如果鏈表的長度大于8，會轉成紅黑樹，
在這里插入圖片描述

3、為什么hashMap 的陣列大小為什么一定是 2 的冪？

1、HashMap為了存取高效，要盡量較少碰撞，就是要盡量把資料分配均勻，每個鏈表長度大致相同，這個實作就在把資料存到哪個鏈表中的演算法；

2、只有它的長度是2的N次方，對它進行減一操作，才能拿到所有是 1 的值
，這樣對它進行按位與運算時，才能快速的用位運算的方式，拿到陣列的下標，并且保證下標在容量之下，并且分配均勻

例如  2的5次方 = 32
       32 =  100000
       31 =   11111
#這樣的話，如果經過 map.put("key","value") 的操作，
#會首先得到一個hash值，跟 (32-1 ) 進行位異或運算
11100001 .... 11011
            & 11111
            = 11011 （二進制）
            = 27    （十進制）

4、為什么hashmap負載因子是0.75

在這里插入圖片描述

原始碼上面注釋大致意思就是說負載因子是0.75的時候，空間利用率比較高，
而且避免了相當多的Hash沖突，使得底層的鏈表或者是紅黑樹的高度比較低，提升了空間效率，
如果太高會導致查詢復雜度增加，如果太低會增加存盤空間

根據統計學來說，使用隨機哈希碼，節點出現的頻率在hash桶遵循泊松分布，
在負載因子0.75下，每個碰撞位置的鏈表長度超過8個概率很低，而出現 6或者 7個還挺大的，這里直接降低了，每個hash桶底層的查詢復雜度

5、JAVA7 HashMap的問題

1、并發環境容易死鎖
2、可以通過精心構造的惡意請求引發Dos

6、java7到java8 做了哪些改進？為什么？

1.7和1.8主要在處理哈希沖突和擴容問題上區別比較大，

1、底層設計改變

JDK1.8 （陣列+ 單鏈表 + 紅黑樹）解決了1.7的大資料查詢效率問題
JDK1.7的時候使用的是（陣列+ 單鏈表的資料結構），但是在JDK1.8及之后時，使用的是陣列+鏈表+紅黑樹的資料結構（當鏈表的深度達到8的時候，也就是默認閾值，就會自動擴容把鏈表轉成紅黑樹的資料結構來把時間復雜度從O（n）變成O（logN）提高了效率）出現哈希沖突時，1.7把資料存放在鏈表，1.8是先放在鏈表，鏈表長度超過8就轉成紅黑樹

2、擴容設計改變

擴容時插入順序的改變，解決了1.7的擴容時發生死鎖的問題
區別：
JDK1.7用的是頭插法，有可能在擴容時，出現回環，造成死鎖
而JDK1.8及之后使用的都是尾插法，但是仍有執行緒安全問題
總結：
HashMap之所以在并發下的擴容造成死回圈，是因為，多個執行緒并發進行時，因為一個執行緒先期完成了擴容，將原的鏈表重新散列到自己的表中，并且鏈表變成了倒序，后一個執行緒再擴容時，又進行自己的散列，再次將倒序鏈表變為正序鏈表，于是形成了一個環形鏈表，當表中不存在的元素時，造成死回圈，

雖然在JDK1.8中，Java的開發小組修正了這個問題，但是HashMap始終存在著其他的執行緒安全問題，所以在并發情況下，我們應該使用HastTable或者ConcurrentHashMap來代替HashMap，

7、為什么說，hashmap 不是執行緒安全的

1、HashMap 在插入的時候
　　現在假如 A 執行緒和 B 執行緒同時進行插入操作，然后計算出了相同的哈希值對應了相同的陣列位置，因為此時該位置還沒資料，然后對同一個陣列位置，兩個執行緒會同時得到現在的頭結點，然后 A 寫入新的頭結點之后，B 也寫入新的頭結點，那B的寫入操作就會覆寫 A 的寫入操作造成 A 的寫入操作丟失，
2、HashMap 在擴容的時候
　　HashMap 有個擴容的操作，這個操作會新生成一個新的容量的陣列，然后對原陣列的所有鍵值對重新進行計算和寫入新的陣列，之后指向新生成的陣列，
　　那么問題來了，當多個執行緒同時進來，檢測到總數量超過門限值的時候就會同時呼叫 resize 操作，各自生成新的陣列并 rehash 后賦給該 map 底層的陣列，結果最終只有最后一個執行緒生成的新陣列被賦給該 map 底層，其他執行緒的均會丟失，
3、HashMap 在洗掉資料的時候
　　洗掉這一塊可能會出現兩種執行緒安全問題，第一種是一個執行緒判斷得到了指定的陣列位置i并進入了回圈，此時，另一個執行緒也在同樣的位置已經刪掉了i位置的那個資料了，然后第一個執行緒那邊就沒了，但是洗掉的話，沒了倒問題不大，
　　再看另一種情況，當多個執行緒同時操作同一個陣列位置的時候，也都會先取得現在狀態下該位置存盤的頭結點，然后各自去進行計算操作，之后再把結果寫會到該陣列位置去，其實寫回的時候可能其他的執行緒已經就把這個位置給修改過了，就會覆寫其他執行緒的修改，
　　其他地方還有很多可能會出現執行緒安全問題，我就不一一列舉了，總之 HashMap 是非執行緒安全的，有并發問題時，建議使用 ConcrrentHashMap，

8、haspMap 為什么使用紅黑樹

hashMap 的場景要求，查詢快，插入快

1、紅黑樹（不完美平衡紅黑樹）
特點： 不追求完全平衡
插入比較快，因為不需要過多的自旋操作來維持，節點的絕對平衡，
查詢比較慢相對于完全平衡樹，

2、avl樹（完美平衡樹）
特點：
查詢比較快，底層資料
插入比較慢，為了維持高度的平衡，就要付出更多代價，

區別
查詢復雜度：
紅黑樹和avl樹查找的話都是logn，
插入、洗掉，復雜度：
平衡樹一般是 logn，可能需要通過一次或多次樹旋轉來重新平衡這個樹紅黑樹一般是也是logn，但不需要額外的自旋，
此外由于它的設計，任何不平衡都會在三次旋轉之內解決，

轉載請註明出處，本文鏈接：https://www.uj5u.com/qita/266337.html

標籤：其他

上一篇：【Java自頂向下】試手小公司，面試官問我ConcurrentHashMap，我微微一笑……

下一篇：mysql資料庫存盤程序和存盤函式