主頁 > 後端開發 > HashMap面試相關

HashMap面試相關

2022-08-31 07:03:25 後端開發

HashMap原始碼:
  • 加載因子:loadFactory -- 默認 0.75f
  • 初始容量大小: capacity 默認 16, 最大限制 1<<30
  • 擴容: 當陣列元素的數量 > 初始容量大小 * 加載因子,就會擴容. 會呼叫rehash方法將陣列長度擴容到之前的兩倍.擴容的時候,會生成一個新的陣列,原來的所有資料需要重新計算哈希碼值重新分配到新的陣列,所以擴容的操作非常消耗性能.
Jdk1.7和jdk1.8區別
  • jdk1.7之前 采用的是 陣列 + 鏈表的方式, 采用的是頭插法,擴容時會改變鏈表中元素原本的順序,以至于在并發場景下導致鏈表成環的問題
  • jdk1.8之后 采用的是 陣列 + 鏈表/紅黑樹的方式 當某個位置出現哈希沖突時,會將元素放到該位置的鏈表后面,當鏈表長度超過8時, 會嘗試采用紅黑樹來存盤, 若陣列長度 若大于 64,鏈表長度 大于8會 將鏈表的所有節點都轉換成紅黑樹,若陣列長度 小于64,會擴容
Map get() 和 put()原理
  • 1.8中put: put中呼叫putVal()方法
    • 1)首先判斷map中是否有資料,沒有就執行resize方法(擴容也是通過這個方法)
    • 2)如果要插入的鍵值對要存放的這個位置剛好沒有元素,那么就把他封裝成Node物件,放在這個位置上
    • 3)如果這個元素的key和與要插入的一樣,就替換一下
    • 4)如果當前節點是TreeNode型別的資料,執行putTreeVal方法
  • get:

    • 1)呼叫k的hashCode()計算出哈希值,并通過哈希演算法轉換成陣列的下標.

    • 2)通過上一步哈希演算法轉換成陣列的下標后,通過陣列快速定位到某個位置.如果這個位置上什么都沒有,回傳null如果有,則拿著K和單向鏈表上的每一個節點K進行equals,如果所有equals都回傳false,則回傳null若true,則回傳該value.

    • resize方法: 兩個職責,創建初始存盤表格,或者在容量不滿足需求的時候,進行擴容.

      具體鍵值對在哈希表中的位置取決于該位運算: i = (n-1) & hash

熱點問題:
為什么HashMap要樹化?

? 本質上是因為安全問題.因為,在元素的存放程序中,如果一個物件哈希沖突,都被放到一個桶里,則會形成一個鏈表,而鏈表的查詢是線性的會嚴重影響存取的性能.而現實情況中,構造哈希沖突的資料并不是非常復雜的事情,惡意代碼就會利用這些資料與服務器大量互動,導致服務器端cpu大量占用,這就構成了哈希碰撞拒絕服務攻擊.

ps:用哈希碰撞發起拒絕服務攻擊(DOS,Denial-Of-Service attack),常見的場景是攻擊者可以事先構造大量相同哈希值的資料,然后以JSON資料的形式發送給服務器,服務器端在將其構建成為Java物件程序中,通常以Hashtable或HashMap等形式存盤,哈希碰撞將導致哈希表發生嚴重退化,演算法復雜度可能上升一個資料級,進而耗費大量CPU資源,

HashMap,HashTable,TreeMap,LinkedHashMap的區別
  • HashMap繼承自AbstractMap類,而HashTable繼承自Dictionary類,不過它們都同時實作了map,cloneable,serializable介面.存盤的內容是基于 key-value的鍵值對映射,key不能重復,一個key只能映射一個value.HashSet的底層就是基于HashMap實作的.

  • HashTable的key,value都不能為null
    HashMap key 和 value 都可以為null,但只能有一個key為null,可以有多個null的value
    TreeMap 鍵值都不能為null

  • 一般情況下,選用HashMap,因為HashMap的鍵值對在取出時是隨機的,依據key的hashCode和鍵的equals方法來存取資料,具有很快的訪問速度,所以在map中插入,洗掉及索引元素時效率較高.而TreeMap的鍵值對在取出時是排過序的,所以效率低一點.

  • TreeMap是基于紅黑樹的一種提供順序訪問的map,與HashMap不同的是它的get,put,remove之類的操作都是o(log(n))的時間復雜度,具體順序可以由指定的Comparator來決定,或者根據鍵的自然順序來判斷.

  • LinkedHashMap適合需要輸出的順序和輸入的順序相同的情況

  • HashMap是執行緒不安全的,HashTable是執行緒安全的.所以HashTable的效率比不上HashMap

    前者默認初始化陣列大小為16,后者為11,擴容時,擴大兩倍,后者擴大兩倍+1

  • HashMap需要重新計算hash值,而hashTable直接使用物件的hashCode

HashMap在1.7和1.8之間的變化
  • 1.7中采用陣列+鏈表,1.8采用陣列+鏈表/紅黑樹
  • 1.7擴容時需要重新計算哈希值和索引位置,1.8并不重新計算哈希值,巧妙地采用和擴容后容量進行&操作來計算新的索引位置.
  • 1.7采用頭插法: 擴容時會改變鏈表中元素的原本順序,以至于在并發場景下導致鏈表成環的問
  • 1.8采用尾插法: 擴容時會保持鏈表原本的順序,避免了鏈表成環的問題.

當兩個物件的hashCode相同時會發生什么?

  • hashCode相同,equals不一定為true,所以兩個物件所在陣列的下標相同,"碰撞"就此發生.會存盤在陣列該位置的鏈表(紅黑樹)中.

你知道hash的實作嗎?為什么要這樣實作?

  • 1.8中,通過hashCode()的高16位異或低16位實作的

    (h = k.hashCode()) ^ (h >>> 16)
    

    主要是從速度,功效和質量來考慮的,減少系統的開銷,也不會因為高位沒有參與下標的計算,從而引起碰撞

  • 用異或運算子,保證了物件的hashCode的32位值只要有一位發生改變,整個hash()回傳值就會改變,盡可能的減少碰撞

拉鏈法導致的鏈表過深問題為什么不用二叉樹代替,而選擇紅黑樹?為什么不一直使用紅黑樹?
  • 紅黑樹是為了解決二叉查找樹的缺陷,二叉查找樹在特殊情況下會變成一條線性結構(這就跟原來使用鏈表結構一樣了,同樣會造成很深的問題),遍歷查找會非常慢.
  • 紅黑樹在插入新資料后會通過左旋,右旋或者變色操作來保持平衡,引入紅黑樹是為了查找資料快,解決鏈表查詢深度的問題,紅黑樹屬于平衡二叉樹,盡管為了保持平衡會付出代價,但該代價損耗的資源相比遍歷線性鏈表來說要少.所以,當長度大于8的時候,會使用紅黑樹.而為什么是8,是因為符合泊松分布,為8時資源損耗相對來說較少.
HashMap和CuncurrentHashMap的區別?
  • ConcurrentHashMap類是java并發包java.util.concurrent中提供的一個執行緒安全且高效的HashMap實作.
  • 1.7中ConcurrentHashMap采用分段鎖(ReentrantLock + segment +hashEntry),相當于把一個HashMap分成多個段,每段分配一把鎖,這樣支持多執行緒訪問.鎖粒度:基于segment,包含多個HashEntry
  • 1.8中采用CAS + synchronized + Node + 紅黑樹.鎖粒度: Node.鎖粒度降低了
  • HashTable則使用synchronized關鍵字加鎖
  • 區別: ConcurrentHashMap鍵值對都不允許為null
ConcurrentHashMap簡單介紹一下?
  • java.util.concurrent.ConcurrentHashMap屬于JUC包下的一個集合類,可以實作執行緒安全.

  • 1.8之前:

    • 由多個Segment組合而成,Segment本身就相當于一個HashMap物件.同HashMap一樣,Segment包含一個HashEntry陣列,陣列中的每一個HashEntry既是一個鍵值對,也是一個鏈表的頭節點.
    • Put: 首先,會嘗試獲取鎖,若獲取失敗,則利用scanAndLockForPut()自旋獲取鎖.如果重試的次數達到了MAX_SCAN_RETRIES則改為阻塞鎖獲取,保證能獲取成功.接著,遍歷該HashEntry,如果不為空則判斷傳入的key和當前遍歷的key是否相等,相等則覆寫舊的value.為空,則需要新建一個HashEntry并加入到Segment中,同時會先判斷是否需要擴容.

    • Get: key通過hash之后定位到具體的segment,再通過一次hash定位到具體元素上.

      由于HashEntry中的value屬性是用volatile關鍵字修飾的,保證了記憶體可見性,所以每次獲取時都是最新值. 整個程序非常搞笑,不需要加鎖.

  • 1.8之后:
    • 陣列+鏈表 改為 陣列+鏈表/紅黑樹,HashEntry改為Node
ConcurrentHashMap的key,value是否可以為null,為什么?
  • 都不可以為null,為null時會拋出空指標例外.

    ConcurrentHashMap是一個用于多執行緒并發場景下的并發容器(map),在多執行緒環境下執行增刪改查方法要保證執行緒安全性.

  • 不能為null,因為會產生二義性問題: 當我們用get方法去獲取一個value為null的時候,可能會沒有這個key,也可能會有這個key,只不過value為null.

  • HashMap如何解決二義性問題

    public boolean containsKey(Object key) {
    return getNode(hash(key), key) != null;
    }

    • 如果存在key為null的元素(key = null對應的hash值為0),getNode獲取到值不為null
    • 如果不存在key為null的元素,此時hash值=0對應的下標元素為null,即getNode獲取到的值為null
  • ConcurrentHashMap為什么不能解決二義性問題

    • 因為ConcurrentHashMap是一個用在多執行緒并發的map容器,不能put null 是因為無法分辨是key沒找到null,還是有key的值為null.這在多執行緒里沒法保證會不會有其他執行緒修改為null鍵和null值的情況,所以不讓put null.
參考檔案
  • HashMap詳解

  • 面試:HashMap奪命二十一問

  • 深入淺出ConcurrentHashMap

  • ConcurrentHashMap(1.8)講解及常見面試題

轉載請註明出處,本文鏈接:https://www.uj5u.com/houduan/503171.html

標籤:Java

上一篇:C++ inline

下一篇:因勢而變,因時而動,Go lang1.18入門精煉教程,由白丁入鴻儒,Go lang泛型(generic)的使用EP15

標籤雲
其他(157675) Python(38076) JavaScript(25376) Java(17977) C(15215) 區塊鏈(8255) C#(7972) AI(7469) 爪哇(7425) MySQL(7132) html(6777) 基礎類(6313) sql(6102) 熊猫(6058) PHP(5869) 数组(5741) R(5409) Linux(5327) 反应(5209) 腳本語言(PerlPython)(5129) 非技術區(4971) Android(4554) 数据框(4311) css(4259) 节点.js(4032) C語言(3288) json(3245) 列表(3129) 扑(3119) C++語言(3117) 安卓(2998) 打字稿(2995) VBA(2789) Java相關(2746) 疑難問題(2699) 细绳(2522) 單片機工控(2479) iOS(2429) ASP.NET(2402) MongoDB(2323) 麻木的(2285) 正则表达式(2254) 字典(2211) 循环(2198) 迅速(2185) 擅长(2169) 镖(2155) 功能(1967) .NET技术(1958) Web開發(1951) python-3.x(1918) HtmlCss(1915) 弹簧靴(1913) C++(1909) xml(1889) PostgreSQL(1872) .NETCore(1853) 谷歌表格(1846) Unity3D(1843) for循环(1842)

熱門瀏覽
  • 【C++】Microsoft C++、C 和匯編程式檔案

    ......

    uj5u.com 2020-09-10 00:57:23 more
  • 例外宣告

    相比于斷言適用于排除邏輯上不可能存在的狀態,例外通常是用于邏輯上可能發生的錯誤。 例外宣告 Item 1:當函式不可能拋出例外或不能接受拋出例外時,使用noexcept 理由 如果不打算拋出例外的話,程式就會認為無法處理這種錯誤,并且應當盡早終止,如此可以有效地阻止例外的傳播與擴散。 示例 //不可 ......

    uj5u.com 2020-09-10 00:57:27 more
  • Codeforces 1400E Clear the Multiset(貪心 + 分治)

    鏈接:https://codeforces.com/problemset/problem/1400/E 來源:Codeforces 思路:給你一個陣列,現在你可以進行兩種操作,操作1:將一段沒有 0 的區間進行減一的操作,操作2:將 i 位置上的元素歸零。最終問:將這個陣列的全部元素歸零后操作的最少 ......

    uj5u.com 2020-09-10 00:57:30 more
  • UVA11610 【Reverse Prime】

    本人看到此題沒有翻譯,就附帶了一個自己的翻譯版本 思考 這一題,它的第一個要求是找出所有 $7$ 位反向質數及其質因數的個數。 我們應該需要質數篩篩選1~$10^{7}$的所有數,這里就不慢慢介紹了。但是,重讀題,我們突然發現反向質數都是 $7$ 位,而將它反過來后的數字卻是 $6$ 位數,這就說明 ......

    uj5u.com 2020-09-10 00:57:36 more
  • 統計區間素數數量

    1 #pragma GCC optimize(2) 2 #include <bits/stdc++.h> 3 using namespace std; 4 bool isprime[1000000010]; 5 vector<int> prime; 6 inline int getlist(int ......

    uj5u.com 2020-09-10 00:57:47 more
  • C/C++編程筆記:C++中的 const 變數詳解,教你正確認識const用法

    1、C中的const 1、區域const變數存放在堆疊區中,會分配記憶體(也就是說可以通過地址間接修改變數的值)。測驗代碼如下: 運行結果: 2、全域const變數存放在只讀資料段(不能通過地址修改,會發生寫入錯誤), 默認為外部聯編,可以給其他源檔案使用(需要用extern關鍵字修飾) 運行結果: ......

    uj5u.com 2020-09-10 00:58:04 more
  • 【C++犯錯記錄】VS2019 MFC添加資源不懂如何修改資源宏ID

    1. 首先在資源視圖中,添加資源 2. 點擊新添加的資源,復制自動生成的ID 3. 在解決方案資源管理器中找到Resource.h檔案,編輯,使用整個專案搜索和替換的方式快速替換 宏宣告 4. Ctrl+Shift+F 全域搜索,點擊查找全部,然后逐個替換 5. 為什么使用搜索替換而不使用屬性視窗直 ......

    uj5u.com 2020-09-10 00:59:11 more
  • 【C++犯錯記錄】VS2019 MFC不懂的批量添加資源

    1. 打開資源頭檔案Resource.h,在其中預先定義好宏 ID(不清楚其實ID值應該設定多少,可以先新建一個相同的資源項,再在這個資源的ID值的基礎上遞增即可) 2. 在資源視圖中選中專案資源,按F7編輯資源檔案,按 ID 型別 相對路徑的形式添加 資源。(別忘了先把檔案拷貝到專案中的res檔案 ......

    uj5u.com 2020-09-10 01:00:19 more
  • C/C++編程筆記:關于C++的參考型別,專供新手入門使用

    今天要講的是C++中我最喜歡的一個用法——參考,也叫別名。 參考就是給一個變數名取一個變數名,方便我們間接地使用這個變數。我們可以給一個變數創建N個參考,這N + 1個變數共享了同一塊記憶體區域。(參考型別的變數會占用記憶體空間,占用的記憶體空間的大小和指標型別的大小是相同的。雖然參考是一個物件的別名,但 ......

    uj5u.com 2020-09-10 01:00:22 more
  • 【C/C++編程筆記】從頭開始學習C ++:初學者完整指南

    眾所周知,C ++的學習曲線陡峭,但是花時間學習這種語言將為您的職業帶來奇跡,并使您與其他開發人員區分開。您會更輕松地學習新語言,形成真正的解決問題的技能,并在編程的基礎上打下堅實的基礎。 C ++將幫助您養成良好的編程習慣(即清晰一致的編碼風格,在撰寫代碼時注釋代碼,并限制類內部的可見性),并且由 ......

    uj5u.com 2020-09-10 01:00:41 more
最新发布
  • Rust中的智能指標:Box<T> Rc<T> Arc<T> Cell<T> RefCell<T> Weak

    Rust中的智能指標是什么 智能指標(smart pointers)是一類資料結構,是擁有資料所有權和額外功能的指標。是指標的進一步發展 指標(pointer)是一個包含記憶體地址的變數的通用概念。這個地址參考,或 ” 指向”(points at)一些其 他資料 。參考以 & 符號為標志并借用了他們所 ......

    uj5u.com 2023-04-20 07:24:10 more
  • Java的值傳遞和參考傳遞

    值傳遞不會改變本身,參考傳遞(如果傳遞的值需要實體化到堆里)如果發生修改了會改變本身。 1.基本資料型別都是值傳遞 package com.example.basic; public class Test { public static void main(String[] args) { int ......

    uj5u.com 2023-04-20 07:24:04 more
  • [2]SpinalHDL教程——Scala簡單入門

    第一個 Scala 程式 shell里面輸入 $ scala scala> 1 + 1 res0: Int = 2 scala> println("Hello World!") Hello World! 檔案形式 object HelloWorld { /* 這是我的第一個 Scala 程式 * 以 ......

    uj5u.com 2023-04-20 07:23:58 more
  • 理解函式指標和回呼函式

    理解 函式指標 指向函式的指標。比如: 理解函式指標的偽代碼 void (*p)(int type, char *data); // 定義一個函式指標p void func(int type, char *data); // 宣告一個函式func p = func; // 將指標p指向函式func ......

    uj5u.com 2023-04-20 07:23:52 more
  • Django筆記二十五之資料庫函式之日期函式

    本文首發于公眾號:Hunter后端 原文鏈接:Django筆記二十五之資料庫函式之日期函式 日期函式主要介紹兩個大類,Extract() 和 Trunc() Extract() 函式作用是提取日期,比如我們可以提取一個日期欄位的年份,月份,日等資料 Trunc() 的作用則是截取,比如 2022-0 ......

    uj5u.com 2023-04-20 07:23:45 more
  • 一天吃透JVM面試八股文

    什么是JVM? JVM,全稱Java Virtual Machine(Java虛擬機),是通過在實際的計算機上仿真模擬各種計算機功能來實作的。由一套位元組碼指令集、一組暫存器、一個堆疊、一個垃圾回收堆和一個存盤方法域等組成。JVM屏蔽了與作業系統平臺相關的資訊,使得Java程式只需要生成在Java虛擬機 ......

    uj5u.com 2023-04-20 07:23:31 more
  • 使用Java接入小程式訂閱訊息!

    更新完微信服務號的模板訊息之后,我又趕緊把微信小程式的訂閱訊息給實作了!之前我一直以為微信小程式也是要企業才能申請,沒想到小程式個人就能申請。 訊息推送平臺🔥推送下發【郵件】【短信】【微信服務號】【微信小程式】【企業微信】【釘釘】等訊息型別。 https://gitee.com/zhongfuch ......

    uj5u.com 2023-04-20 07:22:59 more
  • java -- 緩沖流、轉換流、序列化流

    緩沖流 緩沖流, 也叫高效流, 按照資料型別分類: 位元組緩沖流:BufferedInputStream,BufferedOutputStream 字符緩沖流:BufferedReader,BufferedWriter 緩沖流的基本原理,是在創建流物件時,會創建一個內置的默認大小的緩沖區陣列,通過緩沖 ......

    uj5u.com 2023-04-20 07:22:49 more
  • Java-SpringBoot-Range請求頭設定實作視頻分段傳輸

    老實說,人太懶了,現在基本都不喜歡寫筆記了,但是網上有關Range請求頭的文章都太水了 下面是抄的一段StackOverflow的代碼...自己大修改過的,寫的注釋挺全的,應該直接看得懂,就不解釋了 寫的不好...只是希望能給視頻網站開發的新手一點點幫助吧. 業務場景:視頻分段傳輸、視頻多段傳輸(理 ......

    uj5u.com 2023-04-20 07:22:42 more
  • Windows 10開發教程_編程入門自學教程_菜鳥教程-免費教程分享

    教程簡介 Windows 10開發入門教程 - 從簡單的步驟了解Windows 10開發,從基本到高級概念,包括簡介,UWP,第一個應用程式,商店,XAML控制元件,資料系結,XAML性能,自適應設計,自適應UI,自適應代碼,檔案管理,SQLite資料庫,應用程式到應用程式通信,應用程式本地化,應用程式 ......

    uj5u.com 2023-04-20 07:22:35 more