Sql性能優化看這一篇就夠了-有解無憂

前言：

一個優秀開發的必備技能：性能優化，包括：JVM調優、快取、Sql性能優化等，本文主要講基于Mysql的索引優化，
首先我們需要了解執行一條查詢SQL時Mysql的處理程序：

其次我們需要知道，我們寫的SQL在Mysql的執行順序是怎么樣的？sql的執行順序對sql的性能優化很有幫助，很重要，在建立復合索引的時候需要考慮到這點，

例：

在tb_dept中建立一個復合索引 idx_parent_id_code：

然后看下兩個sql 解釋的結果：

1）在當前索引下，哪一個sql索引利用率高？

借助于上文中查詢SQL的執行順序，是先執行 WHERE再執行 GROUP BY 的，即：

第一個sql執行的順序是先執行了 where后的 school_id 然后執行了 group by 后的 grade_id，順序是和索引的順序是一致的，type等級為ref，掃描行數rows為 4；

而第二個sql是先執行了 where后的 grade_id 然后執行了 group by 后的 school_id，順序是和索引的順序是不一致的，type等級為index，掃描行數rows為 19；

從解釋結果看，第一條的sql索引利用率高于第二條的，（后文會講到：索引type從優到差：System-->const-->eq_ref-->ref-->ref_or_null-->index_merge-->unique_subquery-->index_subquery-->range-->index-->all.）

或者從掃描的行數rows對比資料源也可直觀的看出，兩個陳述句的性能：

2）怎么優化？

如果業務中用到第二個sql，那么就需要調整索引的順序和sql執行順序一致，

或者兩個sql都用到了，那么就再建一個復合索引（idx_code_parent_id）

然后再看下第二條的執行計劃：

執行計劃分析（下面就是本文的重點內容了）：

通過explain可以知道mysql是如何處理陳述句的，并分析出查詢或是表結構的性能瓶頸，其實就是在干查詢優化器的事，通過expalin可以得到：

1. 表的讀取順序
2.表的讀取操作的操作型別
3.哪些索引可以使用
4. 哪些索引被實際使用
5.表之間的參考
6.每張表有多少行被優化器查詢

從上文的例子中我們可以看到執行explain時，結果會有一個表格，這個表格就是分析結果，下面我們來一個一個說明下這個表的表頭：

Id: MySQL QueryOptimizer 選定的執行計劃中查詢的序列號，表示查詢中執行select 子句或操作表的順序,id 值越大優先級越高,越先被執行，id 相同,執行順序由上至下，

Select_type: 一共有9中型別,只介紹常用的4種:

SIMPLE: 簡單的 select 查詢,不使用 union 及子查詢

PRIMARY: 最外層的 select 查詢

UNION: UNION 中的第二個或隨后的 select 查詢,不依賴于外部查詢的結果集

DERIVED: 用于 from 子句里有子查詢的情況， MySQL 會遞回執行這些子查詢, 把結果放在臨時表里，

Table: 輸出行所參考的表

Type: 從優到差的順序如下:（紅色標識的是常見的級別，）

system-->const-->eq_ref-->ref-->ref_or_null-->index_merge-->unique_subquery-->index_subquery-->range-->index-->all.

各自的含義如下:

system: 表僅有一行，這是 const 連接型別的一個特例，

const: const 用于用常數值比較 PRIMARY KEY 時，

eq_ref: 查詢使用了索引為主鍵或唯一鍵的全部時使用，即：通過索引關鍵字可能查找到一個符合條件的行，

ref: 通過索引關鍵字可能查找到多個符合條件的行，

ref_or_null: 如同 ref, 但是 MySQL 必須在初次查找的結果里找出 null 條目,然后進行二次查找，

index_merge: 說明索引合并優化被使用了，

unique_subquery: 在某些 IN 查詢中使用此種型別,而不是常規的 ref:valueIN (SELECT primary_key FROM single_table WHERE some_expr)

index_subquery: 在某些 IN 查詢中使用此種類型 , 與unique_subquery 類似,但是查詢的是非唯一性索引

range: 檢索給定范圍的行，當使用 <>、>、>=、<、<=、BETWEEN 或者 IN 運算子時,會使用到range，

index: 全表掃描,只是掃描表的時候按照索引次序進行而不是行，主要優點就是避免了排序, 但是開銷仍然非常大，

all: 最壞的情況,從頭到尾全表掃描，

possible_keys : 哪些索引可能有助于查詢，如果為空,說明沒有可用的索引，

key: 實際從 possible_key 選擇使用的索引，如果為 NULL,則沒有使用索引，很少的情況下,MYSQL 會選擇優化不足的索引，這種情況下,可以在 SELECT陳述句中使用 USE INDEX (indexname)來強制使用一個索引或者用IGNORE INDEX(indexname)來強制 MYSQL 忽略索引

key_len: 使用的索引的長度，在不損失精確性的情況下,長度越短越好，

ref: 顯示索引的哪一列被使用了

rows: 請求資料回傳的大概行數

extra: 其他資訊，出現Using filesort、Using temporary 意味著不能使用索引,效率會受到重大影響，應盡可能對此進行優化，

Using filesort: 沒有辦法利用現有索引進行排序，需要額外排序，建議：根據排序需要，創建相應合適的索引

Using temporary: 需要用臨時表存盤結果集，通常是因為group by的列列上沒有索引，也有可能是因為同
時有group by和order by，但group by和order by的列又不一樣

Using index ：利用覆寫索引，無需回表即可取得結果資料（即資料直接從索引檔案中讀取），這種結果是好的，

其中重要的幾個就是 key、type 、rows、extra，其中key為null、all 、index時，需要調整、優化索引，一般需要達到 ref、eq_ref 級別，范圍查找需要達到 range，extra有Using filesort、Using temporary 的一定需要優化，根據rows可以直觀看出優化結果，

優化手段：

① SQL優化

避免 SELECT *，只查詢需要的欄位，

小表驅動大表，即小的資料集驅動大的資料集：
當B表的資料集比A表小時，用in優化 exist兩表執行順序是先查B表再查A表查詢陳述句：SELECT * FROM tb_dept WHERE id in (SELECT id FROM tb_dept) ;
當A表的資料集比B表小時，用exist優化in ，兩表執行順序是先查A表，再查B表，查詢陳述句：SELECT * FROM A WHERE EXISTS (SELECT id FROM B WHERE A.id = B.ID) ;

盡量使用連接代替子查詢，因為使用 join 時，MySQL 不會在記憶體中創建臨時表，

② 優化索引的使用

盡量使用主鍵查詢，而非其他索引，因為主鍵查詢不會觸發回表查詢，

不做列運算，把計算都放入各個業務系統實作

查詢陳述句盡可能簡單，大陳述句拆小陳述句，減少鎖時間

or 查詢改寫成 union 查詢

不用函式和觸發器

避免 %xx 查詢，可以使用：select * from t where reverse(f) like reverse('%abc');

少用 join 查詢

使用同型別比較，比如 '123' 和 '123'、123 和 123

盡量避免在 where 子句中使用 != 或者 <> 運算子，查詢參考會放棄索引而進行全表掃描

串列資料使用分頁查詢，每頁資料量不要太大

避免在索引列上使用 is null 和 is not null

③ 表結構設計優化

使用可以存下資料最小的資料型別，

盡量使用 tinyint、smallint、mediumint 作為整數型別而非 int，

盡可能使用 not null 定義欄位，因為 null 占用 4 位元組空間，數字可以默認 0 ，字串默認 “”

盡量少用 text 型別，非用不可時最好獨立出一張表，

盡量使用 timestamp，而非 datetime，

單表不要有太多欄位，建議在 20 個欄位以內，

Mysql常用資料型別存盤大小及范圍：https://blog.csdn.net/HXNLYW/article/details/100104768

3.如果以上優化還是有問題，可以使用show profiles 分析sql 性能

show profiles

show profile for query [queryId]

具體請查看：https://blog.csdn.net/aeolus_pu/article/details/7818498

結尾：

本文是最近學習Mysql索引優化的一些總結和記錄，如有不對的地方，歡迎評論吐槽，

附：

索引相關知識：

———— 查看表索引：
show index from 【table】

———— 直接創建索引
CREATE INDEX indexName ON table(column(length))

———— 修改表結構的方式添加索引
ALTER tableADD INDEX indexName ON (column(length))
---主鍵索引
ALTER TABLE `table_name` ADD PRIMARY KEY ( `column` )
---唯一索引
ALTER TABLE `table_name` ADD UNIQUE (`column` )
---普通索引
ALTER TABLE `table_name` ADD INDEX index_name ( `column`(length) )
---復合索引
ALTER TABLE `table_name` ADD INDEX index_name ( `column1`, `column2`, `column3` )

length的確定：
如果索引列長度過長,這種列索引時將會產生很大的索引檔案,不便于操作,可以使用前綴索引方式進行索引，前綴索引應該控制在一個合適的點,控制在0.31黃金值即可(大于這個值就可以創建)，
SELECT COUNT(DISTINCT(LEFT(`title`,10)))/COUNT(*) FROM Arctic; -- 這個值大于0.31就可以創建前綴索引,Distinct去重復

———— 洗掉索引：
1）ALTER TABLE table_name DROP INDEX index_name
2）DROP INDEX index_name ON table_name;

MyISAM 和 InnoBD區別：

	MyISAM	InnoDB
主鍵	允許沒有任何索引和主鍵的表存在， myisam的索引都是保存行的地址，	如果沒有設定主鍵或者非空唯一索引，就會自動生成一個6位元組的主鍵(用戶不可見) innodb的資料是主索引的一部分，其他索引保存的是主索引的值，
事務處理上方面:	MyISAM型別的表強調的是性能，其執行數度比InnoDB型別更快，但是不提供事務支持、不支持外鍵	InnoDB提供事務支持事務，外部鍵（foreign key）等高級資料庫功能
DML操作	如果執行大量的SELECT，MyISAM是更好的選擇	1.如果你的資料執行大量的INSERT或UPDATE，出于性能方面的考慮，應該使用InnoDB表 2.DELETE FROM table時，InnoDB不會重新建立表，而是一行一行的洗掉，
自動增長	myisam引擎的自動增長列必須是索引，如果是組合索引，自動增長可以不是第一列，他可以根據前面幾列進行排序后遞增，	innodb引擎的自動增長必須是索引，如果是組合索引也必須是組合索引的第一列，
count()函式	myisam保存有表的總行數，如果select count(*) from table;會直接取出出該值	innodb沒有保存表的總行數，如果使用select count(*) from table；就會遍歷整個表，消耗相當大，但是在加了wehre 條件后，myisam和innodb處理的方式都一樣，
鎖	表鎖	提供行鎖，另外，InnoDB表的行鎖也不是絕對的，如果在執行一個SQL陳述句時MySQL不能確定要掃描的范圍，InnoDB表同樣會鎖全表，例如update table set num=1 where name like "%aaa%"

mysql相關配置引數優化：

? sort-buffer-size/join-buffer-size / read-rnd-buffer-size，4～8MB為宜
? optimizer_switch=“index_condition_pushdown=on,mrr=on,mrr_cost
_based=off,batched_key_access=on”
? tmp-table-size = max-heap-table-size，100MB左右為宜
? log-queries-not-using-indexes & log_throttle_queries_not_using_indexes

轉載請註明出處，本文鏈接：https://www.uj5u.com/houduan/2707.html

標籤：java

上一篇：flink 1.9.0 編譯：flink-shaded-hadoop-2 找不到

下一篇：小程式云函式中用group分組查詢，只能查詢20條，怎么解決？