主頁 > 資料庫 > MySQL 性能優化小結

MySQL 性能優化小結

2020-09-16 10:19:36 資料庫

基礎概念簡述

資料庫通過鎖機制來解決并發場景 — 共享鎖(讀鎖)和排他鎖(寫鎖),讀鎖是不阻塞的,多個客戶端可以在同一時刻讀取同一個資源;寫鎖是排他的,并且會阻塞其他的讀鎖和寫鎖,

簡單提下樂觀鎖和悲觀鎖:

  • 樂觀鎖:通常用于資料競爭不激烈的場景,多讀少寫,通過版本號和時間戳實作
  • 悲觀鎖:通常用于資料競爭激烈的場景,每次操作都會鎖定資料

要鎖定資料需要一定的鎖策略來配合,

  • 表鎖:鎖定整張表,開銷最小,但是會加劇鎖競爭
  • 行鎖:鎖定行級別,開銷最大,但是可以最大程度的支持并發

但是 MySQL 的存盤引擎的真實實作不是簡單的行級鎖,一般都是實作了多版本并發控制(MVCC),MVCC 是行級鎖的變種,多數情況下避免了加鎖操作,開銷更低,MVCC 是通過保存資料的某個時間點快照實作的,

事務

事務保證一組原子性的操作,要么全部成功,要么全部失敗,一旦失敗,回滾之前的所有操作,MySQL 采用自動提交,如果不是顯式的開啟一個事務,則每個查詢都作為一個事務,

隔離級別控制了一個事務中的修改,哪些在事務內和事務間是可見的,四種常見的隔離級別:

  • 未提交讀(Read UnCommitted):事務中的修改,即使沒提交對其他事務也是可見的,事務可能讀取未提交的資料,造成 臟讀
  • 提交讀(Read Committed):一個事務開始時,只能看見已提交的事務所做的修改,事務未提交之前,所做的修改對其他事務是不可見的,也叫 不可重復讀,同一個事務多次讀取同樣記錄可能不同
  • 可重復讀(RepeatTable Read):同一個事務中多次讀取同樣的記錄結果時結果相同
  • 可串行化(Serializable):最高隔離級別,強制事務串行執行

存盤引擎

  • InnoDB 引擎:最重要,使用最廣泛的存盤引擎,被用來設計處理大量短期事務,具有高性能和自動崩潰恢復的特性
  • MyISAM引擎:不支持事務和行級鎖,崩潰后無法安全恢復

創建時優化

Schema和資料型別優化

整數

TinyInt, SmallInt, MediumInt, Int, BigInt 使用的存盤8,16,24,32,64位存盤空間,

使用 Unsigned 表示不允許負數,可以使正數的上線提高一倍,

實數

  • Float, Double:支持近似的浮點運算
  • Decimal:用于存盤精確的小數

字串

  • VarChar:存盤變長的字串,需要1或2個額外的位元組記錄字串的長度
  • Char:定長,適合存盤固定長度的字串,如MD5值
  • Blob, Text:為了存盤很大的資料而設計的,分別采用二進制和字符的方式

時間型別

  • DateTime:保存大范圍的值,占8個位元組
  • TimeStamp:推薦,與 UNIX 時間戳相同,占4個位元組

優化建議點

  • 盡量使用對應的資料型別,比如,不要用字串型別保存時間,用整型保存IP
  • 選擇更小的資料型別,能用 TinyInt 不用Int
  • 標識列(identifier column),建議使用整型,不推薦字串型別,占用更多空間,而且計算速度比整型慢
  • 不推薦 ORM 系統自動生成的 Schema,通常具有不注重資料型別,例如,使用很大的 VarChar 型別,索引利用不合理等問題
  • 真實場景混用范式和反范式,冗余高查詢效率高,插入更新效率低;冗余低插入更新效率高,查詢效率低
  • 創建完全的獨立的匯總表\快取表,定時生成資料,用于用戶耗時時間長的操作,對于精確度要求高的匯總操作,可以采用 歷史結果+最新記錄的結果 來達到快速查詢的目的
  • 資料遷移,表升級的程序中可以使用影子表的方式,通過修改原表的表名,達到保存歷史資料,同時不影響新表使用的目的

索引

索引包含一個或多個列的值,MySQL 只能高效的利用索引的最左前綴列,索引的優勢:

  • 減少查詢掃描的資料量
  • 避免排序和零時表
  • 將隨機 IO 變為順序 IO (順序IO的效率高于隨機IO)

B-Tree

使用最多的索引型別,采用 B-Tree 資料結構來存盤資料(每個葉子節點都包含指向下一個葉子節點的指標,從而方便葉子節點的遍歷),B-Tree 索引適用于全鍵值,鍵值范圍,鍵前綴查找,支持排序,

B-Tree 索引限制:

  • 如果不是按照索引的最左列開始查詢,則無法使用索引
  • 不能跳過索引中的列,如果使用第一列和第三列索引,則只能使用第一列索引
  • 如果查詢中有個范圍查詢,則其右邊的所有列都無法使用索引優化查詢

哈希索引

只有精確匹配索引的所有列,查詢才有效,存盤引擎會對所有的索引列計算一個哈希碼,哈希索引將所有的哈希碼存盤在索引中,并保存指向每個資料行的指標,

哈希索引限制:

  • 無法用于排序
  • 不支持部分匹配
  • 只支持等值查詢如 =, IN( ),不支持 < >

優化建議點

  • 注意每種索引的適用范圍和適用限制,
  • 索引的列如果是運算式的一部分或者是函式的引數,則失效
  • 針對特別長的字串,可以使用前綴索引,根據索引的選擇性選擇合適的前綴長度
  • 使用多列索引的時候,可以通過 ANDOR 語法連接
  • 重復索引沒必要,如(A,B)和(A)重復
  • 索引在 where 條件查詢和 group by 語法查詢的時候特別有效
  • 將范圍查詢放在條件查詢的最后,防止范圍查詢導致的右邊索引失效的問題
  • 索引最好不要選擇過長的字串,而且索引列也不宜為 null

查詢時優化

三個重要指標

  • 回應時間 (服務時間,排隊時間)
  • 掃描的行
  • 回傳的行

查詢優化點

  • 避免查詢無關的列,如使用 select * 回傳所有的列,
  • 避免查詢無關的行
  • 切分查詢,將一個對服務器壓力較大的任務,分解到一個較長的時間中,并分多次執行,如要洗掉一萬條資料,可以分10次執行,每次執- 行完成后暫停一段時間,再繼續執行,程序中可以釋放服務器資源給其他任務,
  • 分解關聯查詢,將多表關聯查詢的一次查詢,分解成對單表的多次查詢,可以減少鎖競爭,查詢本身的查詢效率也比較高,因為 MySQL 的連接和斷開都是輕量級的操作,不會由于查詢拆分為多次,造成效率問題,
  • 注意 count 的操作只能統計不為 null 的列,所以統計總的行數使用 count(*)
  • group by 按照標識列分組效率高,分組結果不宜出行分組列之外的列
  • 關聯查詢延遲關聯,可以根據查詢條件先縮小各自要查詢的范圍,再關聯
  • union 查詢默認去重,如果不是業務必須,建議使用效率更高的 union all
  • limit 分頁優化,可以根據索引覆寫掃描,再根據索引列關聯自身查詢其他列,如:
SELECT
 id,
 NAME,
 age
WHERE
 student s1
INNER JOIN (
 SELECT
  id
 FROM
  student
 ORDER BY
  age
 LIMIT 50,5
) AS s2 ON s1.id = s2.id

其它優化點

  • 表關聯查詢時務必遵循 小表驅動大表 原則;
  • 使用查詢陳述句 where 條件時,不允許出現 函式,否則索引會失效;
  • 使用單表查詢時,相同欄位盡量不要用 OR,因為可能導致索引失效,比如:SELECT * FROM table WHERE name = '手機' OR name = '電腦',可以使用 UNION 替代;
  • LIKE 陳述句不允許使用 % 開頭,否則索引會失效;
  • 組合索引一定要遵循 從左到右 原則,否則索引會失效;比如:SELECT * FROM table WHERE name = '張三' AND age = 18,那么該組合索引必須是 name,age 形式;
  • 索引不宜過多,根據實際情況決定,盡量不要超過 10 個;
  • 每張表都必須有 主鍵,達到加快查詢效率的目的;
  • 分表,可根據業務欄位尾數中的個位或十位或百位(以此類推)做表名達到分表的目的;
  • 分庫,可根據業務欄位尾數中的個位或十位或百位(以此類推)做庫名達到分庫的目的;
  • 表磁區,類似于硬碟磁區,可以將某個時間段的資料放在磁區里,加快查詢速度,可以配合 分表 + 表磁區 結合使用
  • 文章作者:彭超
  • 本文首發于個人博客:https://antoniopeng.com/2019/12/08/mysql/MySQL%E6%80%A7%E8%83%BD%E4%BC%98%E5%8C%96%E5%B0%8F%E7%BB%93/
  • 著作權宣告:本博客所有文章除特別宣告外,均采用 CC BY-NC-SA 4.0 許可協議,轉載請注明來自 彭超 | Blog!

轉載請註明出處,本文鏈接:https://www.uj5u.com/shujuku/56201.html

標籤:MySQL

上一篇:一文快速入門 MySQL 索引

下一篇:Bug: 洗掉中間某條記錄后/洗掉最后一條記錄再添加 ,auto-increment的自動增長不連續

標籤雲
其他(157675) Python(38076) JavaScript(25376) Java(17977) C(15215) 區塊鏈(8255) C#(7972) AI(7469) 爪哇(7425) MySQL(7132) html(6777) 基礎類(6313) sql(6102) 熊猫(6058) PHP(5869) 数组(5741) R(5409) Linux(5327) 反应(5209) 腳本語言(PerlPython)(5129) 非技術區(4971) Android(4554) 数据框(4311) css(4259) 节点.js(4032) C語言(3288) json(3245) 列表(3129) 扑(3119) C++語言(3117) 安卓(2998) 打字稿(2995) VBA(2789) Java相關(2746) 疑難問題(2699) 细绳(2522) 單片機工控(2479) iOS(2429) ASP.NET(2402) MongoDB(2323) 麻木的(2285) 正则表达式(2254) 字典(2211) 循环(2198) 迅速(2185) 擅长(2169) 镖(2155) 功能(1967) .NET技术(1958) Web開發(1951) python-3.x(1918) HtmlCss(1915) 弹簧靴(1913) C++(1909) xml(1889) PostgreSQL(1872) .NETCore(1853) 谷歌表格(1846) Unity3D(1843) for循环(1842)

熱門瀏覽
  • GPU虛擬機創建時間深度優化

    **?桔妹導讀:**GPU虛擬機實體創建速度慢是公有云面臨的普遍問題,由于通常情況下創建虛擬機屬于低頻操作而未引起業界的重視,實際生產中還是存在對GPU實體創建時間有苛刻要求的業務場景。本文將介紹滴滴云在解決該問題時的思路、方法、并展示最終的優化成果。 從公有云服務商那里購買過虛擬主機的資深用戶,一 ......

    uj5u.com 2020-09-10 06:09:13 more
  • 可編程網卡芯片在滴滴云網路的應用實踐

    **?桔妹導讀:**隨著云規模不斷擴大以及業務層面對延遲、帶寬的要求越來越高,采用DPDK 加速網路報文處理的方式在橫向縱向擴展都出現了局限性。可編程芯片成為業界熱點。本文主要講述了可編程網卡芯片在滴滴云網路中的應用實踐,遇到的問題、帶來的收益以及開源社區貢獻。 #1. 資料中心面臨的問題 隨著滴滴 ......

    uj5u.com 2020-09-10 06:10:21 more
  • 滴滴資料通道服務演進之路

    **?桔妹導讀:**滴滴資料通道引擎承載著全公司的資料同步,為下游實時和離線場景提供了必不可少的源資料。隨著任務量的不斷增加,資料通道的整體架構也隨之發生改變。本文介紹了滴滴資料通道的發展歷程,遇到的問題以及今后的規劃。 #1. 背景 資料,對于任何一家互聯網公司來說都是非常重要的資產,公司的大資料 ......

    uj5u.com 2020-09-10 06:11:05 more
  • 滴滴AI Labs斬獲國際機器翻譯大賽中譯英方向世界第三

    **桔妹導讀:**深耕人工智能領域,致力于探索AI讓出行更美好的滴滴AI Labs再次斬獲國際大獎,這次獲獎的專案是什么呢?一起來看看詳細報道吧! 近日,由國際計算語言學協會ACL(The Association for Computational Linguistics)舉辦的世界最具影響力的機器 ......

    uj5u.com 2020-09-10 06:11:29 more
  • MPP (Massively Parallel Processing)大規模并行處理

    1、什么是mpp? MPP (Massively Parallel Processing),即大規模并行處理,在資料庫非共享集群中,每個節點都有獨立的磁盤存盤系統和記憶體系統,業務資料根據資料庫模型和應用特點劃分到各個節點上,每臺資料節點通過專用網路或者商業通用網路互相連接,彼此協同計算,作為整體提供 ......

    uj5u.com 2020-09-10 06:11:41 more
  • 滴滴資料倉庫指標體系建設實踐

    **桔妹導讀:**指標體系是什么?如何使用OSM模型和AARRR模型搭建指標體系?如何統一流程、規范化、工具化管理指標體系?本文會對建設的方法論結合滴滴資料指標體系建設實踐進行解答分析。 #1. 什么是指標體系 ##1.1 指標體系定義 指標體系是將零散單點的具有相互聯系的指標,系統化的組織起來,通 ......

    uj5u.com 2020-09-10 06:12:52 more
  • 單表千萬行資料庫 LIKE 搜索優化手記

    我們經常在資料庫中使用 LIKE 運算子來完成對資料的模糊搜索,LIKE 運算子用于在 WHERE 子句中搜索列中的指定模式。 如果需要查找客戶表中所有姓氏是“張”的資料,可以使用下面的 SQL 陳述句: SELECT * FROM Customer WHERE Name LIKE '張%' 如果需要 ......

    uj5u.com 2020-09-10 06:13:25 more
  • 滴滴Ceph分布式存盤系統優化之鎖優化

    **桔妹導讀:**Ceph是國際知名的開源分布式存盤系統,在工業界和學術界都有著重要的影響。Ceph的架構和演算法設計發表在國際系統領域頂級會議OSDI、SOSP、SC等上。Ceph社區得到Red Hat、SUSE、Intel等大公司的大力支持。Ceph是國際云計算領域應用最廣泛的開源分布式存盤系統, ......

    uj5u.com 2020-09-10 06:14:51 more
  • es~通過ElasticsearchTemplate進行聚合~嵌套聚合

    之前寫過《es~通過ElasticsearchTemplate進行聚合操作》的文章,這一次主要寫一個嵌套的聚合,例如先對sex集合,再對desc聚合,最后再對age求和,共三層嵌套。 Aggregations的部分特性類似于SQL語言中的group by,avg,sum等函式,Aggregation ......

    uj5u.com 2020-09-10 06:14:59 more
  • 爬蟲日志監控 -- Elastc Stack(ELK)部署

    傻瓜式部署,只需替換IP與用戶 導讀: 現ELK四大組件分別為:Elasticsearch(核心)、logstash(處理)、filebeat(采集)、kibana(可視化) 下載均在https://www.elastic.co/cn/downloads/下tar包,各組件版本最好一致,配合fdm會 ......

    uj5u.com 2020-09-10 06:15:05 more
最新发布
  • day02-2-商鋪查詢快取

    功能02-商鋪查詢快取 3.商鋪詳情快取查詢 3.1什么是快取? 快取就是資料交換的緩沖區(稱作Cache),是存盤資料的臨時地方,一般讀寫性能較高。 快取的作用: 降低后端負載 提高讀寫效率,降低回應時間 快取的成本: 資料一致性成本 代碼維護成本 運維成本 3.2需求說明 如下,當我們點擊商店詳 ......

    uj5u.com 2023-04-20 08:33:24 more
  • MySQL中binlog備份腳本分享

    關于MySQL的二進制日志(binlog),我們都知道二進制日志(binlog)非常重要,尤其當你需要point to point災難恢復的時侯,所以我們要對其進行備份。關于二進制日志(binlog)的備份,可以基于flush logs方式先切換binlog,然后拷貝&壓縮到到遠程服務器或本地服務器 ......

    uj5u.com 2023-04-20 08:28:06 more
  • day02-短信登錄

    功能實作02 2.功能01-短信登錄 2.1基于Session實作登錄 2.1.1思路分析 2.1.2代碼實作 2.1.2.1發送短信驗證碼 發送短信驗證碼: 發送驗證碼的介面為:http://127.0.0.1:8080/api/user/code?phone=xxxxx<手機號> 請求方式:PO ......

    uj5u.com 2023-04-20 08:27:27 more
  • 快取與資料庫雙寫一致性幾種策略分析

    本文將對幾種快取與資料庫保證資料一致性的使用方式進行分析。為保證高并發性能,以下分析場景不考慮執行的原子性及加鎖等強一致性要求的場景,僅追求最終一致性。 ......

    uj5u.com 2023-04-20 08:26:48 more
  • sql陳述句優化

    問題查找及措施 問題查找 需要找到具體的代碼,對其進行一對一優化,而非一直把關注點放在服務器和sql平臺 降低簡化每個事務中處理的問題,盡量不要讓一個事務拖太長的時間 例如檔案上傳時,應將檔案上傳這一步放在事務外面 微軟建議 4.啟動sql定時執行計劃 怎么啟動sqlserver代理服務-百度經驗 ......

    uj5u.com 2023-04-20 08:26:35 more
  • 云時代,MySQL到ClickHouse資料同步產品對比推薦

    ClickHouse 在執行分析查詢時的速度優勢很好的彌補了MySQL的不足,但是對于很多開發者和DBA來說,如何將MySQL穩定、高效、簡單的同步到 ClickHouse 卻很困難。本文對比了 NineData、MaterializeMySQL(ClickHouse自帶)、Bifrost 三款產品... ......

    uj5u.com 2023-04-20 08:26:29 more
  • sql陳述句優化

    問題查找及措施 問題查找 需要找到具體的代碼,對其進行一對一優化,而非一直把關注點放在服務器和sql平臺 降低簡化每個事務中處理的問題,盡量不要讓一個事務拖太長的時間 例如檔案上傳時,應將檔案上傳這一步放在事務外面 微軟建議 4.啟動sql定時執行計劃 怎么啟動sqlserver代理服務-百度經驗 ......

    uj5u.com 2023-04-20 08:25:13 more
  • Redis 報”OutOfDirectMemoryError“(堆外記憶體溢位)

    Redis 報錯“OutOfDirectMemoryError(堆外記憶體溢位) ”問題如下: 一、報錯資訊: 使用 Redis 的業務介面 ,產生 OutOfDirectMemoryError(堆外記憶體溢位),如圖: 格式化后的報錯資訊: { "timestamp": "2023-04-17 22: ......

    uj5u.com 2023-04-20 08:24:54 more
  • day02-2-商鋪查詢快取

    功能02-商鋪查詢快取 3.商鋪詳情快取查詢 3.1什么是快取? 快取就是資料交換的緩沖區(稱作Cache),是存盤資料的臨時地方,一般讀寫性能較高。 快取的作用: 降低后端負載 提高讀寫效率,降低回應時間 快取的成本: 資料一致性成本 代碼維護成本 運維成本 3.2需求說明 如下,當我們點擊商店詳 ......

    uj5u.com 2023-04-20 08:24:03 more
  • day02-短信登錄

    功能實作02 2.功能01-短信登錄 2.1基于Session實作登錄 2.1.1思路分析 2.1.2代碼實作 2.1.2.1發送短信驗證碼 發送短信驗證碼: 發送驗證碼的介面為:http://127.0.0.1:8080/api/user/code?phone=xxxxx<手機號> 請求方式:PO ......

    uj5u.com 2023-04-20 08:23:11 more