主頁 >  其他 > 二叉查找樹、平衡二叉樹(AVLTree)和平衡多路查找樹(B-Tree),B+樹

二叉查找樹、平衡二叉樹(AVLTree)和平衡多路查找樹(B-Tree),B+樹

2020-09-16 22:02:05 其他

B+樹索引是B+樹在資料庫中的一種實作,是最常見也是資料庫中使用最為頻繁的一種索引,B+樹中的B代表平衡(balance),而不是二叉(binary),因為B+樹是從最早的平衡二叉樹演化而來的,在講B+樹之前必須先了解二叉查找樹、平衡二叉樹(AVLTree)和平衡多路查找樹(B-Tree),B+樹即由這些樹逐步優化而來,

二叉查找樹

二叉樹具有以下性質:左子樹的鍵值小于根的鍵值,右子樹的鍵值大于根的鍵值, 

如下圖所示就是一棵二叉查找樹, 


對該二叉樹的節點進行查找發現深度為1的節點的查找次數為1,深度為2的查找次數為2,深度為n的節點的查找次數為n,因此其平均查找次數為 (1+2+2+3+3+3) / 6 = 2.3次

二叉查找樹可以任意地構造,同樣是2,3,5,6,7,8這六個數字,也可以按照下圖的方式來構造:

但是這棵二叉樹的查詢效率就低了,因此若想二叉樹的查詢效率盡可能高,需要這棵二叉樹是平衡的,從而引出新的定義——平衡二叉樹,或稱AVL樹,

平衡二叉樹(AVL Tree)

平衡二叉樹(AVL樹)在符合二叉查找樹的條件下,還滿足任何節點的兩個子樹的高度最大差為1,下面的兩張圖片,左邊是AVL樹,它的任何節點的兩個子樹的高度差<=1;右邊的不是AVL樹,其根節點的左子樹高度為3,而右子樹高度為1; 


如果在AVL樹中進行插入或洗掉節點,可能導致AVL樹失去平衡,這種失去平衡的二叉樹可以概括為四種姿態:LL(左左)、RR(右右)、LR(左右)、RL(右左),它們的示意圖如下: 


這四種失去平衡的姿態都有各自的定義: 
LL:LeftLeft,也稱“左左”,插入或洗掉一個節點后,根節點的左孩子(Left Child)的左孩子(Left Child)還有非空節點,導致根節點的左子樹高度比右子樹高度高2,AVL樹失去平衡,

RR:RightRight,也稱“右右”,插入或洗掉一個節點后,根節點的右孩子(Right Child)的右孩子(Right Child)還有非空節點,導致根節點的右子樹高度比左子樹高度高2,AVL樹失去平衡,

LR:LeftRight,也稱“左右”,插入或洗掉一個節點后,根節點的左孩子(Left Child)的右孩子(Right Child)還有非空節點,導致根節點的左子樹高度比右子樹高度高2,AVL樹失去平衡,

RL:RightLeft,也稱“右左”,插入或洗掉一個節點后,根節點的右孩子(Right Child)的左孩子(Left Child)還有非空節點,導致根節點的右子樹高度比左子樹高度高2,AVL樹失去平衡,

AVL樹失去平衡之后,可以通過旋轉使其恢復平衡,下面分別介紹四種失去平衡的情況下對應的旋轉方法,

LL的旋轉,LL失去平衡的情況下,可以通過一次旋轉讓AVL樹恢復平衡,步驟如下:

  1. 將根節點的左孩子作為新根節點,
  2. 將新根節點的右孩子作為原根節點的左孩子,
  3. 將原根節點作為新根節點的右孩子,

LL旋轉示意圖如下: 

RR的旋轉:RR失去平衡的情況下,旋轉方法與LL旋轉對稱,步驟如下:

  1. 將根節點的右孩子作為新根節點,
  2. 將新根節點的左孩子作為原根節點的右孩子,
  3. 將原根節點作為新根節點的左孩子,

RR旋轉示意圖如下: 

LR的旋轉:LR失去平衡的情況下,需要進行兩次旋轉,步驟如下:

  1. 圍繞根節點的左孩子進行RR旋轉,
  2. 圍繞根節點進行LL旋轉,

LR的旋轉示意圖如下: 

RL的旋轉:RL失去平衡的情況下也需要進行兩次旋轉,旋轉方法與LR旋轉對稱,步驟如下:

  1. 圍繞根節點的右孩子進行LL旋轉,
  2. 圍繞根節點進行RR旋轉,

RL的旋轉示意圖如下: 

注:從這四種旋轉可以看出,首先我們應該判斷樹是LL、RR、LR、RL?然后對于LL就進行右旋轉一次,對于RR就進行左旋轉一次,對于LR先進行內旋轉(也就是右旋轉)再進行外旋轉(也就是左旋轉),對于RL同樣是先進行內旋轉(也就是左旋轉),然后進行外旋轉(也就是右旋轉)然后就把樹轉化成了平衡樹,

平衡多路查找樹(B-Tree)

B-Tree是為磁盤等外存盤設備設計的一種平衡查找樹,因此在講B-Tree之前先了解下磁盤的相關知識,

系統從磁盤讀取資料到記憶體時是以磁盤塊(block)為基本單位的,位于同一個磁盤塊中的資料會被一次性讀取出來,而不是需要什么取什么,

InnoDB存盤引擎中有頁(Page)的概念,頁是其磁盤管理的最小單位,InnoDB存盤引擎中默認每個頁的大小為16KB,可通過引數innodb_page_size將頁的大小設定為4K、8K、16K,在MySQL中可通過如下命令查看頁的大小:

mysql> show variables like 'innodb_page_size';

而系統一個磁盤塊的存盤空間往往沒有這么大,因此InnoDB每次申請磁盤空間時都會是若干地址連續磁盤塊來達到頁的大小16KB,InnoDB在把磁盤資料讀入到磁盤時會以頁為基本單位,在查詢資料時如果一個頁中的每條資料都能有助于定位資料記錄的位置,這將會減少磁盤I/O次數,提高查詢效率,

B-Tree結構的資料可以讓系統高效的找到資料所在的磁盤塊,為了描述B-Tree,首先定義一條記錄為一個二元組[key, data] ,key為記錄的鍵值,對應表中的主鍵值,data為一行記錄中除主鍵外的資料,對于不同的記錄,key值互不相同,

一棵m階的B-Tree有如下特性: 
1. 每個節點最多有m個孩子, 
2. 除了根節點和葉子節點外,其它每個節點至少有Ceil(m/2)個孩子, 
3. 若根節點不是葉子節點,則至少有2個孩子 
4. 所有葉子節點都在同一層,且不包含其它關鍵字資訊 
5. 每個非終端節點包含n個關鍵字資訊(P0,P1,…Pn, k1,…kn) 
6. 關鍵字的個數n滿足:ceil(m/2)-1 <= n <= m-1 
7. ki(i=1,…n)為關鍵字,且關鍵字升序排序, 
8. Pi(i=1,…n)為指向子樹根節點的指標,P(i-1)指向的子樹的所有節點關鍵字均小于ki,但都大于k(i-1)

B-Tree中的每個節點根據實際情況可以包含大量的關鍵字資訊和分支,如下圖所示為一個3階的B-Tree:

每個節點占用一個盤塊的磁盤空間,一個節點上有兩個升序排序的關鍵字和三個指向子樹根節點的指標,指標存盤的是子節點所在磁盤塊的地址,兩個關鍵詞劃分成的三個范圍域對應三個指標指向的子樹的資料的范圍域,以根節點為例,關鍵字為17和35,P1指標指向的子樹的資料范圍為小于17,P2指標指向的子樹的資料范圍為17~35,P3指標指向的子樹的資料范圍為大于35,

模擬查找關鍵字29的程序:

  1. 根據根節點找到磁盤塊1,讀入記憶體,【磁盤I/O操作第1次】
  2. 比較關鍵字29在區間(17,35),找到磁盤塊1的指標P2,
  3. 根據P2指標找到磁盤塊3,讀入記憶體,【磁盤I/O操作第2次】
  4. 比較關鍵字29在區間(26,30),找到磁盤塊3的指標P2,
  5. 根據P2指標找到磁盤塊8,讀入記憶體,【磁盤I/O操作第3次】
  6. 在磁盤塊8中的關鍵字串列中找到關鍵字29,

分析上面程序,發現需要3次磁盤I/O操作,和3次記憶體查找操作,由于記憶體中的關鍵字是一個有序表結構,可以利用二分法查找提高效率,而3次磁盤I/O操作是影響整個B-Tree查找效率的決定因素,B-Tree相對于AVLTree縮減了節點個數,使每次磁盤I/O取到記憶體的資料都發揮了作用,從而提高了查詢效率,

B+Tree

B+Tree是在B-Tree基礎上的一種優化,使其更適合實作外存盤索引結構,InnoDB存盤引擎就是用B+Tree實作其索引結構,

從上一節中的B-Tree結構圖中可以看到每個節點中不僅包含資料的key值,還有data值,而每一個頁的存盤空間是有限的,如果data資料較大時將會導致每個節點(即一個頁)能存盤的key的數量很小,當存盤的資料量很大時同樣會導致B-Tree的深度較大,增大查詢時的磁盤I/O次數,進而影響查詢效率,在B+Tree中,所有資料記錄節點都是按照鍵值大小順序存放在同一層的葉子節點上,而非葉子節點上只存盤key值資訊,這樣可以大大加大每個節點存盤的key值數量,降低B+Tree的高度,

B+Tree相對于B-Tree有幾點不同:

  1. 非葉子節點只存盤鍵值資訊,
  2. 所有葉子節點之間都有一個鏈指標,
  3. 資料記錄都存放在葉子節點中,

將上一節中的B-Tree優化,由于B+Tree的非葉子節點只存盤鍵值資訊,假設每個磁盤塊能存盤4個鍵值及指標資訊,則變成B+Tree后其結構如下圖所示: 

通常在B+Tree上有兩個頭指標,一個指向根節點,另一個指向關鍵字最小的葉子節點,而且所有葉子節點(即資料節點)之間是一種鏈式環結構,因此可以對B+Tree進行兩種查找運算:一種是對于主鍵的范圍查找和分頁查找,另一種是從根節點開始,進行隨機查找,

可能上面例子中只有22條資料記錄,看不出B+Tree的優點,下面做一個推算:

InnoDB存盤引擎中頁的大小為16KB,一般表的主鍵型別為INT(占用4個位元組)或BIGINT(占用8個位元組),指標型別也一般為4或8個位元組,也就是說一個頁(B+Tree中的一個節點)中大概存盤16KB/(8B+8B)=1K個鍵值(因為是估值,為方便計算,這里的K取值為〖10〗^3),也就是說一個深度為3的B+Tree索引可以維護10^3 * 10^3 * 10^3 = 10億 條記錄,

實際情況中每個節點可能不能填充滿,因此在資料庫中,B+Tree的高度一般都在2~4層,mysql的InnoDB存盤引擎在設計時是將根節點常駐記憶體的,也就是說查找某一鍵值的行記錄時最多只需要1~3次磁盤I/O操作,

資料庫中的B+Tree索引可以分為聚集索引(clustered index)和輔助索引(secondary index),上面的B+Tree示例圖在資料庫中的實作即為聚集索引,聚集索引的B+Tree中的葉子節點存放的是整張表的行記錄資料,輔助索引與聚集索引的區別在于輔助索引的葉子節點并不包含行記錄的全部資料,而是存盤相應行資料的聚集索引鍵,即主鍵,當通過輔助索引來查詢資料時,InnoDB存盤引擎會遍歷輔助索引找到主鍵,然后再通過主鍵在聚集索引中找到完整的行記錄資料,


轉載請註明出處,本文鏈接:https://www.uj5u.com/qita/60074.html

標籤:其他

上一篇:Codeforces Round #634 (div.3) A~D

下一篇:LeetCode刷題日記

標籤雲
其他(157675) Python(38076) JavaScript(25376) Java(17977) C(15215) 區塊鏈(8255) C#(7972) AI(7469) 爪哇(7425) MySQL(7132) html(6777) 基礎類(6313) sql(6102) 熊猫(6058) PHP(5869) 数组(5741) R(5409) Linux(5327) 反应(5209) 腳本語言(PerlPython)(5129) 非技術區(4971) Android(4554) 数据框(4311) css(4259) 节点.js(4032) C語言(3288) json(3245) 列表(3129) 扑(3119) C++語言(3117) 安卓(2998) 打字稿(2995) VBA(2789) Java相關(2746) 疑難問題(2699) 细绳(2522) 單片機工控(2479) iOS(2429) ASP.NET(2402) MongoDB(2323) 麻木的(2285) 正则表达式(2254) 字典(2211) 循环(2198) 迅速(2185) 擅长(2169) 镖(2155) 功能(1967) .NET技术(1958) Web開發(1951) python-3.x(1918) HtmlCss(1915) 弹簧靴(1913) C++(1909) xml(1889) PostgreSQL(1872) .NETCore(1853) 谷歌表格(1846) Unity3D(1843) for循环(1842)

熱門瀏覽
  • 網閘典型架構簡述

    網閘架構一般分為兩種:三主機的三系統架構網閘和雙主機的2+1架構網閘。 三主機架構分別為內端機、外端機和仲裁機。三機無論從軟體和硬體上均各自獨立。首先從硬體上來看,三機都用各自獨立的主板、記憶體及存盤設備。從軟體上來看,三機有各自獨立的作業系統。這樣能達到完全的三機獨立。對于“2+1”系統,“2”分為 ......

    uj5u.com 2020-09-10 02:00:44 more
  • 如何從xshell上傳檔案到centos linux虛擬機里

    如何從xshell上傳檔案到centos linux虛擬機里及:虛擬機CentOs下執行 yum -y install lrzsz命令,出現錯誤:鏡像無法找到軟體包 前言 一、安裝lrzsz步驟 二、上傳檔案 三、遇到的問題及解決方案 總結 前言 提示:其實很簡單,往虛擬機上安裝一個上傳檔案的工具 ......

    uj5u.com 2020-09-10 02:00:47 more
  • 一、SQLMAP入門

    一、SQLMAP入門 1、判斷是否存在注入 sqlmap.py -u 網址/id=1 id=1不可缺少。當注入點后面的引數大于兩個時。需要加雙引號, sqlmap.py -u "網址/id=1&uid=1" 2、判斷文本中的請求是否存在注入 從文本中加載http請求,SQLMAP可以從一個文本檔案中 ......

    uj5u.com 2020-09-10 02:00:50 more
  • Metasploit 簡單使用教程

    metasploit 簡單使用教程 浩先生, 2020-08-28 16:18:25 分類專欄: kail 網路安全 linux 文章標簽: linux資訊安全 編輯 著作權 metasploit 使用教程 前言 一、Metasploit是什么? 二、準備作業 三、具體步驟 前言 Msfconsole ......

    uj5u.com 2020-09-10 02:00:53 more
  • 游戲逆向之驅動層與用戶層通訊

    驅動層代碼: #pragma once #include <ntifs.h> #define add_code CTL_CODE(FILE_DEVICE_UNKNOWN,0x800,METHOD_BUFFERED,FILE_ANY_ACCESS) /* 更多游戲逆向視頻www.yxfzedu.com ......

    uj5u.com 2020-09-10 02:00:56 more
  • 北斗電力時鐘(北斗授時服務器)讓網路資料更精準

    北斗電力時鐘(北斗授時服務器)讓網路資料更精準 北斗電力時鐘(北斗授時服務器)讓網路資料更精準 京準電子科技官微——ahjzsz 近幾年,資訊技術的得了快速發展,互聯網在逐漸普及,其在人們生活和生產中都得到了廣泛應用,并且取得了不錯的應用效果。計算機網路資訊在電力系統中的應用,一方面使電力系統的運行 ......

    uj5u.com 2020-09-10 02:01:03 more
  • 【CTF】CTFHub 技能樹 彩蛋 writeup

    ?碎碎念 CTFHub:https://www.ctfhub.com/ 筆者入門CTF時時剛開始刷的是bugku的舊平臺,后來才有了CTFHub。 感覺不論是網頁UI設計,還是題目質量,賽事跟蹤,工具軟體都做得很不錯。 而且因為獨到的金幣制度的確讓人有一種想去刷題賺金幣的感覺。 個人還是非常喜歡這個 ......

    uj5u.com 2020-09-10 02:04:05 more
  • 02windows基礎操作

    我學到了一下幾點 Windows系統目錄結構與滲透的作用 常見Windows的服務詳解 Windows埠詳解 常用的Windows注冊表詳解 hacker DOS命令詳解(net user / type /md /rd/ dir /cd /net use copy、批處理 等) 利用dos命令制作 ......

    uj5u.com 2020-09-10 02:04:18 more
  • 03.Linux基礎操作

    我學到了以下幾點 01Linux系統介紹02系統安裝,密碼啊破解03Linux常用命令04LAMP 01LINUX windows: win03 8 12 16 19 配置不繁瑣 Linux:redhat,centos(紅帽社區版),Ubuntu server,suse unix:金融機構,證券,銀 ......

    uj5u.com 2020-09-10 02:04:30 more
  • 05HTML

    01HTML介紹 02頭部標簽講解03基礎標簽講解04表單標簽講解 HTML前段語言 js1.了解代碼2.根據代碼 懂得挖掘漏洞 (POST注入/XSS漏洞上傳)3.黑帽seo 白帽seo 客戶網站被黑帽植入劫持代碼如何處理4.熟悉html表單 <html><head><title>TDK標題,描述 ......

    uj5u.com 2020-09-10 02:04:36 more
最新发布
  • 2023年最新微信小程式抓包教程

    01 開門見山 隔一個月發一篇文章,不過分。 首先回顧一下《微信系結手機號資料庫被脫庫事件》,我也是第一時間得知了這個訊息,然后跟蹤了整件事情的經過。下面是這起事件的相關截圖以及近日流出的一萬條資料樣本: 個人認為這件事也沒什么,還不如關注一下之前45億快遞資料查詢渠道疑似在近日復活的訊息。 訊息是 ......

    uj5u.com 2023-04-20 08:48:24 more
  • web3 產品介紹:metamask 錢包 使用最多的瀏覽器插件錢包

    Metamask錢包是一種基于區塊鏈技術的數字貨幣錢包,它允許用戶在安全、便捷的環境下管理自己的加密資產。Metamask錢包是以太坊生態系統中最流行的錢包之一,它具有易于使用、安全性高和功能強大等優點。 本文將詳細介紹Metamask錢包的功能和使用方法。 一、 Metamask錢包的功能 數字資 ......

    uj5u.com 2023-04-20 08:47:46 more
  • vulnhub_Earth

    前言 靶機地址->>>vulnhub_Earth 攻擊機ip:192.168.20.121 靶機ip:192.168.20.122 參考文章 https://www.cnblogs.com/Jing-X/archive/2022/04/03/16097695.html https://www.cnb ......

    uj5u.com 2023-04-20 07:46:20 more
  • 從4k到42k,軟體測驗工程師的漲薪史,給我看哭了

    清明節一過,盲猜大家已經無心上班,在數著日子準備過五一,但一想到銀行卡里的余額……瞬間心情就不美麗了。最近,2023年高校畢業生就業調查顯示,本科畢業月平均起薪為5825元。調查一出,便有很多同學表示自己又被平均了。看著這一資料,不免讓人想到前不久中國青年報的一項調查:近六成大學生認為畢業10年內會 ......

    uj5u.com 2023-04-20 07:44:00 more
  • 最新版本 Stable Diffusion 開源 AI 繪畫工具之中文自動提詞篇

    🎈 標簽生成器 由于輸入正向提示詞 prompt 和反向提示詞 negative prompt 都是使用英文,所以對學習母語的我們非常不友好 使用網址:https://tinygeeker.github.io/p/ai-prompt-generator 這個網址是為了讓大家在使用 AI 繪畫的時候 ......

    uj5u.com 2023-04-20 07:43:36 more
  • 漫談前端自動化測驗演進之路及測驗工具分析

    隨著前端技術的不斷發展和應用程式的日益復雜,前端自動化測驗也在不斷演進。隨著 Web 應用程式變得越來越復雜,自動化測驗的需求也越來越高。如今,自動化測驗已經成為 Web 應用程式開發程序中不可或缺的一部分,它們可以幫助開發人員更快地發現和修復錯誤,提高應用程式的性能和可靠性。 ......

    uj5u.com 2023-04-20 07:43:16 more
  • CANN開發實踐:4個DVPP記憶體問題的典型案例解讀

    摘要:由于DVPP媒體資料處理功能對存放輸入、輸出資料的記憶體有更高的要求(例如,記憶體首地址128位元組對齊),因此需呼叫專用的記憶體申請介面,那么本期就分享幾個關于DVPP記憶體問題的典型案例,并給出原因分析及解決方法。 本文分享自華為云社區《FAQ_DVPP記憶體問題案例》,作者:昇騰CANN。 DVPP ......

    uj5u.com 2023-04-20 07:43:03 more
  • msf學習

    msf學習 以kali自帶的msf為例 一、msf核心模塊與功能 msf模塊都放在/usr/share/metasploit-framework/modules目錄下 1、auxiliary 輔助模塊,輔助滲透(埠掃描、登錄密碼爆破、漏洞驗證等) 2、encoders 編碼器模塊,主要包含各種編碼 ......

    uj5u.com 2023-04-20 07:42:59 more
  • Halcon軟體安裝與界面簡介

    1. 下載Halcon17版本到到本地 2. 雙擊安裝包后 3. 步驟如下 1.2 Halcon軟體安裝 界面分為四大塊 1. Halcon的五個助手 1) 影像采集助手:與相機連接,設定相機引數,采集影像 2) 標定助手:九點標定或是其它的標定,生成標定檔案及內參外參,可以將像素單位轉換為長度單位 ......

    uj5u.com 2023-04-20 07:42:17 more
  • 在MacOS下使用Unity3D開發游戲

    第一次發博客,先發一下我的游戲開發環境吧。 去年2月份買了一臺MacBookPro2021 M1pro(以下簡稱mbp),這一年來一直在用mbp開發游戲。我大致分享一下我的開發工具以及使用體驗。 1、Unity 官網鏈接: https://unity.cn/releases 我一般使用的Apple ......

    uj5u.com 2023-04-20 07:40:19 more