主頁 > 資料庫 > MySQL進階篇(02):索引體系劃分,B-Tree結構說明

MySQL進階篇(02):索引體系劃分,B-Tree結構說明

2020-09-14 02:05:58 資料庫

本文原始碼:GitHub·點這里 || GitEE·點這里

一、索引簡介

1、基本概念

首先要明確索引是什么:索引是一種資料結構,資料結構是計算機存盤、組織資料的方式,是指相互之間存在一種或多種特定關系的資料元素的集合,例如:鏈表,堆疊,佇列,二叉樹等等,

其次要清楚索引的作用:索引可以使存盤引擎快速找到資料記錄,這是最基本的作用,索引是對查詢速度最關鍵的影響,良好的索引設計可以使查詢的效率有質的飛越,

索引的使用:如果查詢陳述句使用所有,MySQL會在索引的資料結構上查詢,如果查詢到,就回傳包含該索引的資料行,

2、索引的優點

  • 唯一或者主鍵索引,保證列資料的唯一性
  • 減少資料掃描量,快速查詢資料;
  • 資料有序的索引,可以將隨機IO變成順序IO;
  • 有效的索引查詢,可以避免排序和臨時表;

3、索引分類

索引的種類非常多,如何分類取決多個場景和不同的角度,常見的劃分如下:

  • 產生作用:主鍵索引,普通索引,非空索引,全文索引;
  • 覆寫欄位:單列索引,組合索引;
  • 資料結構:B-Tree索引,哈希索引,R-Tree索引;

注意:索引的實作是在存盤引擎層面,相同的索引在不同的存盤引擎中,其實作方式可能都是不一樣的,

二、索參考法詳解

1、不同索引特點

普通索引

基本的索引,沒有任何使用限制,主要用來加速資料查詢,適合經常出現在查詢條件或排序條件中的資料列,

主鍵索引

特殊的唯一索引,不允許有空值,在建表的時候指定主鍵,就會創建主鍵索引,MySQL中最核心的索引,大量的業務資料都是基于主鍵查詢,

唯一索引

普通索引類似,不同的就是:索引列的值必須唯一,但允許有空值,如果是組合索引,則列值的組合必須是唯一性的,

全文索引

用于全文搜索,通過建立全文索引,基于分詞的查詢模式,可以極大的提升檢索效率,

組合索引

創建的索引覆寫兩個或者兩個以上的列,適應組合查詢的場景,也常用于要素驗證的業務,例如判斷用戶身份ID,手機號,郵箱,是否為同一個用戶,

2、管理索引語法

基礎用戶表

CREATE TABLE user_base (
	id INT (11) NOT NULL AUTO_INCREMENT COMMENT '主鍵ID',
	user_name VARCHAR (20) NOT NULL COMMENT '用戶名',
	phone VARCHAR (20) NOT NULL COMMENT '手機號',
	email VARCHAR (32) DEFAULT NULL COMMENT '郵箱',
	card_id VARCHAR (32) DEFAULT NULL COMMENT '身份編號',
	create_time datetime DEFAULT NULL COMMENT '創建時間',
	state INT (1) DEFAULT '1' COMMENT '是否可用,0-不可用,1-可用',
	PRIMARY KEY (`id`)
) ENGINE = INNODB DEFAULT CHARSET = utf8 COMMENT = '用戶基礎表';

創建單列索引

CREATE INDEX card_id_index ON user_base(card_id);

修改添加索引

ALTER TABLE user_base ADD INDEX state_index(state) ;

創建組合索引

CREATE INDEX bind_index ON user_base(phone,card_id);

洗掉索引

DROP INDEX card_id_index ON user_base ;

修改索引

MySQL不支持真正修改索引的語法規范,可以通過洗掉舊索引,添加新索引的方式進行操作,

3、查詢索引

分析MySQL查詢,多數情況下用來分析執行陳述句的SQL中是否使用索引,是否產生臨時表等性能相關問題,

基礎用法

EXPLAIN SELECT * FROM user_base WHERE id='1';

引數說明

  • id:相同,按table列由上至下順序執行,不同,如果是子查詢,id的序號會遞增,id的值越大優先級越高,越先被執行;
  • select_type:表示查詢的型別,主要是用于區別普通查詢、聯合查詢、子查詢等的復雜查詢;
simple:簡單select查詢,查詢中不包含子查詢或者
primary:查詢中若包含復雜的子部分,最外層查詢則被標記為primary
subquery:select或where中包含子查詢
derived:from中包含的子查詢被標記為derived衍生,mysql會遞回執行這些子查詢,且生成臨時表
union:第二個select出現在union后,標記為union
union-result:從union表獲取結果的select
  • table:指當前執行計劃中的資料表;
  • type:說明的是查詢使用了哪種型別,下面從好到差排序;
system-const:對查詢的某部分進行優化并轉換成一個常量時,會使用該型別
eq_ref:常見于主鍵或唯一索引掃描,表中只有一條記錄與之匹配
ref:非唯一性索引掃描,回傳匹配某個單獨值的所有行
index:遍歷索引結構,索引檔案通常比資料檔案小
all:遍歷全表進行查詢
  • possible_keys:在查詢中可能使用到的索引;
  • key:在查詢中實際使用到的索引;
  • key_len:查詢中索引欄位的最大可能長度,在不損失精確性的情況下,長度越短越好;
  • ref:表示本行被操作的物件的參照物件,可能是一個常量用const表示,也可能是其他表的key指向的物件;
  • rows:預估找到符合要求的記錄所需要掃描的行數,掃描越少越好;
  • extra:執行計劃中,一些十分重要的資訊;
Using-Filesort:查詢使用檔案排序,最差的執行計劃
Using-Temporary:臨時表保存中間結果,比檔案排序稍微強點
Using-Index:查詢操作中使用了覆寫索引
Using-Where:表明使用了where過濾條件
Using-Join-Buffer:表明使用了連接快取
Impossible-Where:表示where條件false,不能過濾元素
Distinct:優化distinct找到第一匹配的資料后即停止找同樣值的動作
Select-Tables-Optimized-Away:不必等到執行階段再進行計算,查詢執行計劃生成的階段即完成優化

三、B-Tree索引結構

1、B-Tree索引簡介

MySQL官方比較推薦的索引結構型別,在實際的資料庫開發中,基于MySQL中的表結構,大部分使用的都是B-Three索引結構,即二叉樹的結構,可以加快資料的訪問速度,存盤引擎不再需要進行全表掃描來獲取資料,資料分布在各個索引節點上,B-Tree索引結構如圖:

該結構是典型的二叉樹結構,特點:資料值按照順序存盤的,每個葉子節點到根部的距離是相同的,注意這里描述的是索引結構圖,

實際存盤結構上,資料順序存盤,每個節點包含索引值,索引指向的資料行的值,指向子頁的指標,指向葉子頁的指標,這樣才能把索引和資料結構組織起來,結構如圖:

這樣完整描述B-Tree索引的資料特點,基于樹搜索提升效率,減少掃描資料,資料被順序的組織起來,按照索引值順序排列,

2、搜索規則

索引的根本作用,減少掃描的資料量,提升查詢效率,基于B-Tree索引的結構的查詢規則基本如下:

  • 查詢從索引的根節點開始,逐步搜索;
  • 根節點的槽中存放指向子節點的指標,指向下層;
  • 根據節點頁的值和查詢值比較,判斷是否符合條件;
  • 不斷執行上述邏輯,直到查詢完成;

注意:必須要強調一點,查詢必須是在執行索引的基礎上,才是該邏輯,正常的開發中多分析一下查詢陳述句,有時候可能只是自己感覺查詢索引是執行的,實際可能是失效的,

3、索引查詢失效

好的索引設計十分重要,但是查詢的時候很可能因為觸發各種索引失效機制,導致SQL陳述句不執行索引搜索,嚴重損失性能,所以基于業務下資料查詢特點,設計相對好用的索引結構,是十分關鍵的,這里涉及很多場景問題,后續再詳細記錄,

四、索引導致的問題

索引有時候并不是最好的解決方式,當資料量龐大的時候,索引也會占據龐大的存盤空間,這里提供一個業務測驗場景,僅供引數:單表三個字符型別欄位,兩個欄位使用索引結構,存盤資料在700W量級,在A和B兩個資料庫,A資料庫有索引結構,B資料庫沒有索引,A庫占用的空間是B庫的1.6倍,寫入千萬資料的速度也比B資料庫慢9分鐘,

這里只想說明一點:索引雖然好,使用妥當才能發揮作用,

五、源代碼地址

GitHub·地址
https://github.com/cicadasmile/mysql-data-base
GitEE·地址
https://gitee.com/cicadasmile/mysql-data-base

推薦閱讀:MySQL系列

序號 文章標題
01 MySQL基礎:經典實用查詢案例,總結整理
02 MySQL基礎:從五個維度出發,審視表結構設計
03 MySQL基礎:系統和自定義函式總結,觸發器使用詳解
04 MySQL基礎:存盤程序和視圖,用法和特性詳解
05 MySQL基礎:邏輯架構圖解和InnoDB存盤引擎詳解
06 MySQL基礎:事務管理,鎖機制案例詳解
07 MySQL基礎:用戶和權限管理,日志體系簡介
08 MySQL進階:基于多個維度,分析服務器性能

轉載請註明出處,本文鏈接:https://www.uj5u.com/shujuku/29398.html

標籤:MySQL

上一篇:hadoop

下一篇:索引——談談你對索引的認識和理解

標籤雲
其他(157675) Python(38076) JavaScript(25376) Java(17977) C(15215) 區塊鏈(8255) C#(7972) AI(7469) 爪哇(7425) MySQL(7132) html(6777) 基礎類(6313) sql(6102) 熊猫(6058) PHP(5869) 数组(5741) R(5409) Linux(5327) 反应(5209) 腳本語言(PerlPython)(5129) 非技術區(4971) Android(4554) 数据框(4311) css(4259) 节点.js(4032) C語言(3288) json(3245) 列表(3129) 扑(3119) C++語言(3117) 安卓(2998) 打字稿(2995) VBA(2789) Java相關(2746) 疑難問題(2699) 细绳(2522) 單片機工控(2479) iOS(2429) ASP.NET(2402) MongoDB(2323) 麻木的(2285) 正则表达式(2254) 字典(2211) 循环(2198) 迅速(2185) 擅长(2169) 镖(2155) 功能(1967) .NET技术(1958) Web開發(1951) python-3.x(1918) HtmlCss(1915) 弹簧靴(1913) C++(1909) xml(1889) PostgreSQL(1872) .NETCore(1853) 谷歌表格(1846) Unity3D(1843) for循环(1842)

熱門瀏覽
  • GPU虛擬機創建時間深度優化

    **?桔妹導讀:**GPU虛擬機實體創建速度慢是公有云面臨的普遍問題,由于通常情況下創建虛擬機屬于低頻操作而未引起業界的重視,實際生產中還是存在對GPU實體創建時間有苛刻要求的業務場景。本文將介紹滴滴云在解決該問題時的思路、方法、并展示最終的優化成果。 從公有云服務商那里購買過虛擬主機的資深用戶,一 ......

    uj5u.com 2020-09-10 06:09:13 more
  • 可編程網卡芯片在滴滴云網路的應用實踐

    **?桔妹導讀:**隨著云規模不斷擴大以及業務層面對延遲、帶寬的要求越來越高,采用DPDK 加速網路報文處理的方式在橫向縱向擴展都出現了局限性。可編程芯片成為業界熱點。本文主要講述了可編程網卡芯片在滴滴云網路中的應用實踐,遇到的問題、帶來的收益以及開源社區貢獻。 #1. 資料中心面臨的問題 隨著滴滴 ......

    uj5u.com 2020-09-10 06:10:21 more
  • 滴滴資料通道服務演進之路

    **?桔妹導讀:**滴滴資料通道引擎承載著全公司的資料同步,為下游實時和離線場景提供了必不可少的源資料。隨著任務量的不斷增加,資料通道的整體架構也隨之發生改變。本文介紹了滴滴資料通道的發展歷程,遇到的問題以及今后的規劃。 #1. 背景 資料,對于任何一家互聯網公司來說都是非常重要的資產,公司的大資料 ......

    uj5u.com 2020-09-10 06:11:05 more
  • 滴滴AI Labs斬獲國際機器翻譯大賽中譯英方向世界第三

    **桔妹導讀:**深耕人工智能領域,致力于探索AI讓出行更美好的滴滴AI Labs再次斬獲國際大獎,這次獲獎的專案是什么呢?一起來看看詳細報道吧! 近日,由國際計算語言學協會ACL(The Association for Computational Linguistics)舉辦的世界最具影響力的機器 ......

    uj5u.com 2020-09-10 06:11:29 more
  • MPP (Massively Parallel Processing)大規模并行處理

    1、什么是mpp? MPP (Massively Parallel Processing),即大規模并行處理,在資料庫非共享集群中,每個節點都有獨立的磁盤存盤系統和記憶體系統,業務資料根據資料庫模型和應用特點劃分到各個節點上,每臺資料節點通過專用網路或者商業通用網路互相連接,彼此協同計算,作為整體提供 ......

    uj5u.com 2020-09-10 06:11:41 more
  • 滴滴資料倉庫指標體系建設實踐

    **桔妹導讀:**指標體系是什么?如何使用OSM模型和AARRR模型搭建指標體系?如何統一流程、規范化、工具化管理指標體系?本文會對建設的方法論結合滴滴資料指標體系建設實踐進行解答分析。 #1. 什么是指標體系 ##1.1 指標體系定義 指標體系是將零散單點的具有相互聯系的指標,系統化的組織起來,通 ......

    uj5u.com 2020-09-10 06:12:52 more
  • 單表千萬行資料庫 LIKE 搜索優化手記

    我們經常在資料庫中使用 LIKE 運算子來完成對資料的模糊搜索,LIKE 運算子用于在 WHERE 子句中搜索列中的指定模式。 如果需要查找客戶表中所有姓氏是“張”的資料,可以使用下面的 SQL 陳述句: SELECT * FROM Customer WHERE Name LIKE '張%' 如果需要 ......

    uj5u.com 2020-09-10 06:13:25 more
  • 滴滴Ceph分布式存盤系統優化之鎖優化

    **桔妹導讀:**Ceph是國際知名的開源分布式存盤系統,在工業界和學術界都有著重要的影響。Ceph的架構和演算法設計發表在國際系統領域頂級會議OSDI、SOSP、SC等上。Ceph社區得到Red Hat、SUSE、Intel等大公司的大力支持。Ceph是國際云計算領域應用最廣泛的開源分布式存盤系統, ......

    uj5u.com 2020-09-10 06:14:51 more
  • es~通過ElasticsearchTemplate進行聚合~嵌套聚合

    之前寫過《es~通過ElasticsearchTemplate進行聚合操作》的文章,這一次主要寫一個嵌套的聚合,例如先對sex集合,再對desc聚合,最后再對age求和,共三層嵌套。 Aggregations的部分特性類似于SQL語言中的group by,avg,sum等函式,Aggregation ......

    uj5u.com 2020-09-10 06:14:59 more
  • 爬蟲日志監控 -- Elastc Stack(ELK)部署

    傻瓜式部署,只需替換IP與用戶 導讀: 現ELK四大組件分別為:Elasticsearch(核心)、logstash(處理)、filebeat(采集)、kibana(可視化) 下載均在https://www.elastic.co/cn/downloads/下tar包,各組件版本最好一致,配合fdm會 ......

    uj5u.com 2020-09-10 06:15:05 more
最新发布
  • day02-2-商鋪查詢快取

    功能02-商鋪查詢快取 3.商鋪詳情快取查詢 3.1什么是快取? 快取就是資料交換的緩沖區(稱作Cache),是存盤資料的臨時地方,一般讀寫性能較高。 快取的作用: 降低后端負載 提高讀寫效率,降低回應時間 快取的成本: 資料一致性成本 代碼維護成本 運維成本 3.2需求說明 如下,當我們點擊商店詳 ......

    uj5u.com 2023-04-20 08:33:24 more
  • MySQL中binlog備份腳本分享

    關于MySQL的二進制日志(binlog),我們都知道二進制日志(binlog)非常重要,尤其當你需要point to point災難恢復的時侯,所以我們要對其進行備份。關于二進制日志(binlog)的備份,可以基于flush logs方式先切換binlog,然后拷貝&壓縮到到遠程服務器或本地服務器 ......

    uj5u.com 2023-04-20 08:28:06 more
  • day02-短信登錄

    功能實作02 2.功能01-短信登錄 2.1基于Session實作登錄 2.1.1思路分析 2.1.2代碼實作 2.1.2.1發送短信驗證碼 發送短信驗證碼: 發送驗證碼的介面為:http://127.0.0.1:8080/api/user/code?phone=xxxxx<手機號> 請求方式:PO ......

    uj5u.com 2023-04-20 08:27:27 more
  • 快取與資料庫雙寫一致性幾種策略分析

    本文將對幾種快取與資料庫保證資料一致性的使用方式進行分析。為保證高并發性能,以下分析場景不考慮執行的原子性及加鎖等強一致性要求的場景,僅追求最終一致性。 ......

    uj5u.com 2023-04-20 08:26:48 more
  • sql陳述句優化

    問題查找及措施 問題查找 需要找到具體的代碼,對其進行一對一優化,而非一直把關注點放在服務器和sql平臺 降低簡化每個事務中處理的問題,盡量不要讓一個事務拖太長的時間 例如檔案上傳時,應將檔案上傳這一步放在事務外面 微軟建議 4.啟動sql定時執行計劃 怎么啟動sqlserver代理服務-百度經驗 ......

    uj5u.com 2023-04-20 08:26:35 more
  • 云時代,MySQL到ClickHouse資料同步產品對比推薦

    ClickHouse 在執行分析查詢時的速度優勢很好的彌補了MySQL的不足,但是對于很多開發者和DBA來說,如何將MySQL穩定、高效、簡單的同步到 ClickHouse 卻很困難。本文對比了 NineData、MaterializeMySQL(ClickHouse自帶)、Bifrost 三款產品... ......

    uj5u.com 2023-04-20 08:26:29 more
  • sql陳述句優化

    問題查找及措施 問題查找 需要找到具體的代碼,對其進行一對一優化,而非一直把關注點放在服務器和sql平臺 降低簡化每個事務中處理的問題,盡量不要讓一個事務拖太長的時間 例如檔案上傳時,應將檔案上傳這一步放在事務外面 微軟建議 4.啟動sql定時執行計劃 怎么啟動sqlserver代理服務-百度經驗 ......

    uj5u.com 2023-04-20 08:25:13 more
  • Redis 報”OutOfDirectMemoryError“(堆外記憶體溢位)

    Redis 報錯“OutOfDirectMemoryError(堆外記憶體溢位) ”問題如下: 一、報錯資訊: 使用 Redis 的業務介面 ,產生 OutOfDirectMemoryError(堆外記憶體溢位),如圖: 格式化后的報錯資訊: { "timestamp": "2023-04-17 22: ......

    uj5u.com 2023-04-20 08:24:54 more
  • day02-2-商鋪查詢快取

    功能02-商鋪查詢快取 3.商鋪詳情快取查詢 3.1什么是快取? 快取就是資料交換的緩沖區(稱作Cache),是存盤資料的臨時地方,一般讀寫性能較高。 快取的作用: 降低后端負載 提高讀寫效率,降低回應時間 快取的成本: 資料一致性成本 代碼維護成本 運維成本 3.2需求說明 如下,當我們點擊商店詳 ......

    uj5u.com 2023-04-20 08:24:03 more
  • day02-短信登錄

    功能實作02 2.功能01-短信登錄 2.1基于Session實作登錄 2.1.1思路分析 2.1.2代碼實作 2.1.2.1發送短信驗證碼 發送短信驗證碼: 發送驗證碼的介面為:http://127.0.0.1:8080/api/user/code?phone=xxxxx<手機號> 請求方式:PO ......

    uj5u.com 2023-04-20 08:23:11 more