???大家好，我是賈斯汀！???

在這里插入圖片描述

學習目錄

學習背景
HashMap特性
HashMap添加元素四步曲
- 前奏：HashMap如何添加一個元素？
- 第一步曲：根據key得到hashCode值
- 第二步曲：根據hashCode值計算出hash值
- 第三步曲：根據hash值計算出哈希表陣列index下標
- 第四步曲：將元素節點保存到哈希表指定陣列index下標
- 終曲：為什么HashMap底層原始碼用這么多位運算？
HashMap鏈表轉為紅黑樹
- 紅黑樹結構
- 紅黑樹五大特性
- HashMap鏈表轉為紅黑樹程序
HashMap擴容機制
HashMap獲取元素
HashMap常用的API方法
HashMap底層原始碼關鍵屬性

學習背景

由于整個HashMap底層原始碼實作很多，很難全部剖析，望見諒，本文主要挑選作業和面試經常遇到的一些重點和難點進行剖析即可，希望對你有所幫助！
在進入正文之前，我們知道JDK底層原始碼很多地方都用到了位運算以及進制相關的知識，HashMap底層也不例外，二進制是計算機底層存盤格式，你電腦上所有東西，檔案，視頻，音樂，全部是二進制方式存盤的，十進制就是我們平時的阿拉伯數字沒啥可說，在學習本文時，建議先快速了解下Java幾種位運算以及常見進制說明，特別是二進制的位運算，可以查看我的這篇文章進行快速了解下 https://blog.csdn.net/JustinQin/article/details/120505776

HashMap特性

在這里插入圖片描述

繼承AbstractMap抽象類，實作Map介面以及Cloneable, java.io.Serializable克隆和序列化
底層是由陣列+鏈表組成的哈希表，JDK1.8鏈表長度超過8并且table陣列大小大于64時才會將鏈表優化為紅黑樹
增刪改查的效率都比較高，但多執行緒環境下是不安全的，可能存在問題
存盤的元素是鍵值對，key鍵是唯一的，并且允許為key/value為null但不保證順序
通過key的hash值計算出需要存放在哈希表中的陣列位置index
默認初始化容量大小為0，第一次呼叫put真正給默認大小16，每次擴容oldCap << 1即原來容量的2倍
常用的API方法put(key,value)/get(key)/size()/isEmpty()/containsKey(key)/remove(key)
底層原始碼關鍵屬性table、threshold、loadFactor、modCount、size

HashMap添加元素四步曲

前奏：HashMap如何添加一個元素？

HashMap底層資料結構主要通過put(K key, V value)方法添加元素，底層四步曲如下：

第一步曲：根據key得到hashCode值
第二步曲：根據hashCode值計算出hash值
第三步曲：根據hash值計算出哈希表陣列index下標
第四步曲：將元素節點保存到哈希表指定陣列index下標

HashMap添加元素的示例代碼：

        HashMap<Object, Object> map = new HashMap<>();
        map.put("name","Justin");

HashMap底層put(key,value)方法原始碼：

    public V put(K key, V value) {
        return putVal(hash(key), key, value, false, true);
    }

再看下，hash方法實作原始碼：

    static final int hash(Object key) {
        int h;
        return (key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16);
    }

接下來將解讀HashMap底層原始碼添加元素四部曲具體實作

第一步曲：根據key得到hashCode值

以上面示例代碼說明，這里key是字串"name"，String重寫了計算字串hashCode值的hashCode()方法，原始碼如下：
在這里插入圖片描述
計算得到hashCode值為3373707

第二步曲：根據hashCode值計算出hash值

hash值計算的程序用到了^（異或）和>>>(無符號右移)兩種位運算
(h = key.hashCode()) ^ (h >>> 16) 即 (3373707) ^ (3373707 >>> 16)
這里為了方便展示，二進制每四位使用空格格式化，位運算程序如下：
在這里插入圖片描述
計算key="name"的hash值二進制結果是1100110111101010111000轉成十進制為3373752

進制在線轉換：https://c.runoob.com/front-end/58/
在這里插入圖片描述
即計算key="name"的hash值為3373752，也可以debug斷點往后查看hash值剛好也是這個值

第三步曲：根據hash值計算出哈希表陣列index下標

公式：i = (n - 1) & hash
在這里插入圖片描述
這里公式(n - 1) & hash 用到了&按位與運算（都為1則得1），奧妙之處在于n表示HashMap中的陣列容量大小，并且剛好是16,32,64…2的次方，這種情況其實是等效于 hash % n 取模計算出的陣列index下標值，并且下標不會超過容量(n-1)即能夠保證不會陣列下標越界

但是HashMap這里沒有使用%取模，而是使用位運算，直接對記憶體資料進行操作，效率最高，如果使用%取模需要先將記憶體資料轉成十進制再進行運算，多了這部分的性能開銷，效率會變低

HashTable底層倒是用的%取模，hash值與十六進制0x7FFFFFFF做按位與運算目的是為了保證hash值始終是正數
在這里插入圖片描述
有的小伙伴可能會問了，使用%取模計算，那這里為啥HashTable還在用，我想說的是其實也可以優化，只不過HashTable本身就是主打synchronized執行緒安全，也就不考慮優化%取模為位運算了吧

第四步曲：將元素節點保存到哈希表指定陣列index下標

    final V putVal(int hash, K key, V value, boolean onlyIfAbsent,
                   boolean evict) {
        Node<K,V>[] tab; Node<K,V> p; int n, i;
        if ((tab = table) == null || (n = tab.length) == 0)
            n = (tab = resize()).length;
        if ((p = tab[i = (n - 1) & hash]) == null)
            //該位置首次添加節點，則直接新建節點添加
            tab[i] = newNode(hash, key, value, null);
        else {
            Node<K,V> e; K k;
            if (p.hash == hash &&
                ((k = p.key) == key || (key != null && key.equals(k))))
                e = p;
            else if (p instanceof TreeNode)
                //如果節點是紅黑樹，呼叫方法進行添加元素
                e = ((TreeNode<K,V>)p).putTreeVal(this, tab, hash, key, value);
            else {
                //如果節點是鏈表，則遍歷鏈表
                for (int binCount = 0; ; ++binCount) {
                    //遍歷鏈表到最后一個節點
                    if ((e = p.next) == null) {
                        //新建節點進行添加
                        p.next = newNode(hash, key, value, null);
                        //如果遍歷指定位置的鏈表現有節點已經是大于等于8個了
                        if (binCount >= TREEIFY_THRESHOLD - 1) // -1 for 1st
                            //則當前節點，需要通過該方法進行添加
                            //如果陣列容量大于64，該程序會進行鏈表轉化為紅黑樹
                            treeifyBin(tab, hash);
                        break;
                    }
                    if (e.hash == hash &&
                        ((k = e.key) == key || (key != null && key.equals(k))))
                        break;
                    p = e;
                }
            }
            //HashMap對于key已經存在的處理情況是
            //除非該key對應的value為null，否則一律不做任何處理
            //Hashtable中則是會直接更新key對應的value
            if (e != null) { // existing mapping for key
                V oldValue = e.value;
                if (!onlyIfAbsent || oldValue == null)
                    e.value = value;
                afterNodeAccess(e);
                return oldValue;
            }
        }
        //集合修改次數，沒操作一次+1
        ++modCount;
        //HashMap容量大小大于臨界值，則進行resize()擴容
        if (++size > threshold)
            resize();
        afterNodeInsertion(evict);
        return null;
    }

終曲：為什么HashMap底層原始碼用這么多位運算？

關于位運算的使用，文中在介紹第三步曲時，也提到了HashMap計算陣列下標使用%取模和位運算的問題，使用于位運算的奧妙之處在直接從記憶體讀取資料進行計算，不需要轉成十進制，如果使用%取模需要先轉成十進制，有性能開銷，效率比較低

HashMap底層除了文中提到的^按位異或、>>>無符號右移、&按位與位運算，其實在HashMap的擴容機制resize()中，還用到了<<左移運算
oldCap << 1
在這里插入圖片描述
這里oldCap << 1剛好是兩倍，可以總結的說一個數與n進行左移運算，結果為這個數乘以2的n次方
oldCap << 1 等值 oldCap = oldCap * (2的n次方)
同理，一個數與n進行右移運算結果為這個數除以2的n次方
oldCap >> 1 等值 oldCap = oldCap / (2的n次方)

HashMap鏈表轉為紅黑樹

紅黑樹結構

在這里插入圖片描述

紅黑樹五大特性

節點有紅色或黑色兩種；
根節點是黑色；
葉子節點全部是黑色(如圖方框是葉子節點)；
紅色節點必須配兩個黑色節點（即保證任意路不會出現兩個連續紅色節點）；
從任意節點到該節點下所有葉子節點包含的黑色節點個數相同（也簡稱黑高），

HashMap鏈表轉為紅黑樹程序

代碼示例：

public class Test {
    public static void main(String[] args) {
        HashMap<Object, Object> map = new HashMap<Object, Object>();
        //下標為0
        map.put(null, "Justin");
        map.put(16, "Justin");

        //下標為8
        map.put(8, "Justin");      //鏈表第1個節點
        map.put(24, "Justin");     //鏈表第2個節點
        map.put(40, "Justin");     //鏈表第3個節點
        map.put(56, "Justin");     //鏈表第4個節點
        map.put(72, "Justin");     //鏈表第5個節點
        map.put(88, "Justin");     //鏈表第6個節點
        map.put(104, "Justin");    //鏈表第7個節點
        map.put(120, "Justin");    //鏈表第8個節點
        map.put("name", "Justin"); //在添加第9個節點時，鏈表會被轉換為紅黑樹
    }
}

上述代碼添加元素完成后，大多數人認為，底層哈希表的資料結構如下：
在這里插入圖片描述
看起來好像沒啥毛病，但實際哈希表index=8的位置鏈表并不會轉成紅黑樹，原因如下：

再來看下treeifyBin(tab,hash)為什么不將鏈表轉成紅黑樹？

其中tab.length < MIN_TREEIFY_CAPACITY表示只要哈希表陣列大小于64容量的，不可能會發生鏈表樹化的程序，所以示例代碼中，在哈希表陣列下標index=8位置，添加第9個key="name"元素時，此時哈希表大小只有16， tab.length < MIN_TREEIFY_CAPACITY即16 < 64 接進行resize()擴容并重新計算各個元素存盤的位置了，并不會走后面的鏈表轉紅黑樹的程序，

在這里插入圖片描述

當添加key="name"節點時，會進行擴容，容量大小由16變為32，此時oldMap資料遷移到newMap后資料排列如何呢？
這里比較簡單，沒涉及到紅黑樹的拆分，而且鏈表長度都是大于1個的，直接由(hash & oldCap)重新計算位置：

public class Test {
    public static void main(String[] args) {
        cal(null,0);
        cal(16,0);

        cal(8,8);
        cal(24,8);
        cal(40,8);
        cal(56,8);
        cal(88,8);
        cal(72,8);
        cal(104,8);
        cal(120,8);
        cal("name",8);
    }

    static void cal(Object key,int oldIndex) {
        //將oldMap容量和節點hash值進行&按位與運算
        if( (16 & hash(key)) ==  0){//結果為0，節點放到newMap位置與在oldMap下標index位置一樣
            System.out.println("原key=" + key + "，遷移到newMap陣列下標位置為：" + oldIndex);
        }else{//結果不為0，節點放到newMap位置剛好等于oldMap下標index位置 + oldMap陣列容量大小
            System.out.println("原key=" + key + "，遷移到newMap陣列下標位置為：" + (oldIndex + 16));
        }
    }

    static final int hash(Object key) {
        int h;
        return (key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16);
    }
}

原來所有key，遷移到newMap后陣列index下標位置如下：

原key=null，遷移到newMap陣列下標位置為：0
原key=16，遷移到newMap陣列下標位置為：16
原key=8，遷移到newMap陣列下標位置為：8
原key=24，遷移到newMap陣列下標位置為：24
原key=40，遷移到newMap陣列下標位置為：8
原key=56，遷移到newMap陣列下標位置為：24
原key=88，遷移到newMap陣列下標位置為：24
原key=72，遷移到newMap陣列下標位置為：8
原key=104，遷移到newMap陣列下標位置為：8
原key=120，遷移到newMap陣列下標位置為：24
原key=name，遷移到newMap陣列下標位置為：24

所以示例代碼，添加元素后，正確的資料結構應該是這樣的：
在這里插入圖片描述

通過debug斷點，也可以看到擴容后節點主要被分配到了8、16、24這個三個陣列下標位置：
在這里插入圖片描述

不過一般情況下，HashMap擴容是發生在添加元素時，最后通過++size > threshold判斷容量大于臨界值時，才進行resize()擴容

HashMap擴容機制

擴容情況1：第一次添加元素會進行擴容，默認初始化容量為16
擴容情況2：哈希表容量小于64時，鏈表長度每次大于8，都會進行resize()擴容
擴容情況3：HashMap容量大于臨界值時

幾種擴容情況的原始碼如下：

    final V putVal(int hash, K key, V value, boolean onlyIfAbsent,
                   boolean evict) {
        Node<K,V>[] tab; Node<K,V> p; int n, i;
        if ((tab = table) == null || (n = tab.length) == 0)
            //擴容情況1：第一次添加元素會進行擴容，默認初始化容量為16
            n = (tab = resize()).length;
        if ((p = tab[i = (n - 1) & hash]) == null)
            tab[i] = newNode(hash, key, value, null);
        else {
            Node<K,V> e; K k;
            if (p.hash == hash &&
                ((k = p.key) == key || (key != null && key.equals(k))))
                e = p;
            else if (p instanceof TreeNode)
                e = ((TreeNode<K,V>)p).putTreeVal(this, tab, hash, key, value);
            else {
                for (int binCount = 0; ; ++binCount) {
                    if ((e = p.next) == null) {
                        p.next = newNode(hash, key, value, null);
                        if (binCount >= TREEIFY_THRESHOLD - 1) // -1 for 1st
                            //擴容情況2：見treeifyBin方法說明
                            treeifyBin(tab, hash);
                        break;
                    }
                    if (e.hash == hash &&
                        ((k = e.key) == key || (key != null && key.equals(k))))
                        break;
                    p = e;
                }
            }
            if (e != null) { // existing mapping for key
                V oldValue = e.value;
                if (!onlyIfAbsent || oldValue == null)
                    e.value = value;
                afterNodeAccess(e);
                return oldValue;
            }
        }
        ++modCount;
        if (++size > threshold)
            resize(); //擴容情況3：HashMap容量大于臨界值時
        afterNodeInsertion(evict);
        return null;
    }

treeifyBin原始碼如下：

    final void treeifyBin(Node<K,V>[] tab, int hash) {
        int n, index; Node<K,V> e;
        //擴容情況2：哈希表容量小于64時，鏈表長度每次大于8，都會進行resize()擴容
        if (tab == null || (n = tab.length) < MIN_TREEIFY_CAPACITY)
            resize(); 
        else if ((e = tab[index = (n - 1) & hash]) != null) {
            //鏈表樹化的程序...
        }
    }

再來看HashMap的resize()擴容關鍵原始碼：

    final Node<K,V>[] resize() {
        ...
        if (oldCap > 0) {
            ...
            //oldCap << 1即2倍擴容
            else if ((newCap = oldCap << 1) < MAXIMUM_CAPACITY &&
                     oldCap >= DEFAULT_INITIAL_CAPACITY)
                newThr = oldThr << 1; // double threshold
        }
        ...
        Node<K,V>[] newTab = (Node<K,V>[])new Node[newCap];
        table = newTab;
        if (oldTab != null) {
            //遍歷oldMap按一定規則，遷移資料到newMap
            for (int j = 0; j < oldCap; ++j) {
                Node<K,V> e;
                if ((e = oldTab[j]) != null) {
                    oldTab[j] = null;
                    if (e.next == null)
                        //對于哈希表陣列后鏈表只有一個節點的
                        //需要根據hash值重新計算新的下標位置
                        newTab[e.hash & (newCap - 1)] = e;
                    else if (e instanceof TreeNode)
                        //對紅黑樹進行拆分
                        ((TreeNode<K,V>)e).split(this, newTab, j, oldCap);
                    else { // preserve order
                        //對于哈希表陣列后鏈表有多個節點的
                        //通過(hash & oldMap)演算法以及lo、hi節點進行分組巧妙遷移
                        Node<K,V> loHead = null, loTail = null;
                        Node<K,V> hiHead = null, hiTail = null;
                        Node<K,V> next;
                        do {
                            next = e.next;
                            //這里是&按位與運算是oldMap遷移資料到newMap的奧妙之處
                            if ((e.hash & oldCap) == 0) {
                                if (loTail == null)
                                    loHead = e;
                                else
                                    loTail.next = e;
                                loTail = e;
                            }
                            else {
                                if (hiTail == null)
                                    hiHead = e;
                                else
                                    hiTail.next = e;
                                hiTail = e;
                            }
                        } while ((e = next) != null);
                        if (loTail != null) {
                            loTail.next = null;
                            //按位與結果為0的，節點遷移到newMap下標與oldMap中下標一樣
                            newTab[j] = loHead;
                        }
                        if (hiTail != null) {
                            hiTail.next = null;
                            //按位與結果不為0的，節點遷移到newMap下標
                            //則剛好等于原oldMap中下標 + oldCap老容量
                            newTab[j + oldCap] = hiHead;
                        }
                    }
                }
            }
        }
        return newTab;
    }

可以看到其實HashMap擴容機制很簡單，核心就是newCap = oldCap << 1即2倍擴容機制，難點在于oldMap舊資料遷移到newMap的程序，會涉及紅黑樹的拆分以及哈希表陣列后鏈表有多個節點用的位運算(hash & oldMap)以及lo、hi兩種節點，這個有點理解，特別是剛讀原始碼的小伙伴，讀不懂可以先放放，以后在慢慢深入理解，

HashMap獲取元素

map.get("name");

    public V get(Object key) {
        Node<K,V> e;
        return (e = getNode(hash(key), key)) == null ? null : e.value;
    }

這里hash值的獲取跟添加元素一模一樣：

    static final int hash(Object key) {
        int h;
        return (key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16);
    }

主要看下獲取節點元素getNode實作原始碼：

    final Node<K,V> getNode(int hash, Object key) {
        Node<K,V>[] tab; Node<K,V> first, e; int n; K k;
        //這里是確定元素在哈希表哪個陣列下標，跟添加元素中原理一樣
        //也是通過位運算(n-1) & hash能確定元素所在陣列index下標
        if ((tab = table) != null && (n = tab.length) > 0 &&
            (first = tab[(n - 1) & hash]) != null) {
            if (first.hash == hash && // always check first node
                ((k = first.key) == key || (key != null && key.equals(k))))
                //每次都進行key判斷和equals比較，都一樣說明是要找的元素直接回傳
                return first;
            if ((e = first.next) != null) {//繼續取鏈表下一節點
                //如果節點是紅黑樹，則呼叫紅黑樹查找方法能快速找到節點元素回傳
                if (first instanceof TreeNode)
                    return ((TreeNode<K,V>)first).getTreeNode(hash, key);
                //只是普通節點，則對鏈表進行遍歷，逐一比對節點的key，找到就回傳
                do {
                    if (e.hash == hash &&
                        ((k = e.key) == key || (key != null && key.equals(k))))
                        return e;
                } while ((e = e.next) != null);
            }
        }
        return null;
    }

HashMap常用的API方法

API	說明
put(key,value)	添加元素(鍵值對key/value)，并且key/value可為null，存在key時，除了value為null會替換value為新值，其他value不會替換新值，HashTable不允許value為null，否則直接NullPointException空指標例外，并且直接替換value為新值
get(key)	根據鍵key獲取元素(鍵值對key/value)
size()	獲取HashMap容量大小，平時需注意未初始化HashMap物件時直接呼叫該方法會導致NullPointException空指標
isEmpty()	判斷HashMap的size容量大小是否為0，同樣平時需注意未初始化HashMap物件時直接呼叫該方法會導致NullPointException空指標
containsKey(key)	根據key判斷HashMap中是否存在該key的鍵值對
remove(key)	根據key洗掉HashMap中的該鍵值對

HashMap底層原始碼關鍵屬性

屬性	說明
table	HashMap底層資料結構`哈希表節點陣列`Node<K,V>[] table;
size	HashMap`容量大小`，注意不是哈希表陣列的長度table.length
loadFactor	`裝載因子`，默認是一個浮點數0.75f，這是一個綜合計算比較優秀的值，可根據時間復雜度和空間負責度需要進行調整
threshold	`臨界值`，由HashMap容量大小 * loadFactor計算出，添加元素是當HashMap容量大小超過這個值就進行resize() 2倍擴容
modCount	`集合修改次數`添加、洗掉操作都會++modCount

本文對HashMap特性及底層資料結構暫時分析到這里，希望對你有所幫助！

如果你是一名Java初學者，建議先去學習本文提到的HashMap特性以及常用API如何使用，然后查看原始碼了解幾個關鍵屬性有什么用，再深入剖析增、刪、查方法底層實作的原理，其他Java基礎類別庫也是一樣，你會發現其中用到了很多資料結構與演算法、位運算等奧妙之處，

???原創不易，覺得有用的小伙伴（點贊+收藏）支持一下哇！???

在這里插入圖片描述

轉載請註明出處，本文鏈接：https://www.uj5u.com/houduan/304520.html

標籤：java

上一篇：Java集合原始碼剖析——基于JDK1.8中HashMap的實作原理

下一篇：2109 JAVASE每日復習總結鏈接匯總

Java--敲重點！JDK1.8 HashMap特性及底層陣列+單鏈表+紅黑樹知識(建議收藏)

學習目錄

學習背景

HashMap特性

HashMap添加元素四步曲

前奏：HashMap如何添加一個元素？

第一步曲：根據key得到hashCode值

第二步曲：根據hashCode值計算出hash值

第三步曲：根據hash值計算出哈希表陣列index下標

第四步曲：將元素節點保存到哈希表指定陣列index下標

終曲：為什么HashMap底層原始碼用這么多位運算？

HashMap鏈表轉為紅黑樹

紅黑樹結構

紅黑樹五大特性

HashMap鏈表轉為紅黑樹程序

HashMap擴容機制

HashMap獲取元素

HashMap常用的API方法

HashMap底層原始碼關鍵屬性