主頁 > 資料庫 > MySQL事務ACID原理深度決議

MySQL事務ACID原理深度決議

2022-03-17 07:21:07 資料庫

什么是MySQL事務?


事務是指對資料庫的一組操作的集合,集合中的SQL陳述句要么全部執行成功,要么就全部失敗,如果集合中任一操作出錯,則此集合所有對資料庫的操作全部回滾,

以常見的購物操作舉例,用戶下單后要執行訂單創建、減庫存等一系列操作,這些操作就是一個事務,以原子的方式執行,要么全部成功,要么失敗回滾,避免出現用戶下單了但是庫存沒有扣減的問題,當然真實環境中的業務要比這個復雜的多,在微服務專案中還會涉及到分布式事務問題,

事務的特性


首先來了解下什么是事務的特性,SQL標準中定義了事務應具有 原子性(Atomicity)、一致性(Consistency)、隔離性(Isolation)、持久性(Durability)四個特性,簡稱 ACID

原子性:

指一個事務是一個不可分割的操作集合,其中的操作要么都做,要么都不做;如果其中任意一個SQL執行失敗,則整個事務必須回滾,將資料庫狀態恢復至事務開始之前,

一致性:

指事務執行完成后,資料庫完整性約束沒有被破壞,事務執行前后都是合法的資料狀態,

隔離性:

指不同事務間的操作互相不可見,互不影響,資料庫隔離級別主要涉及的就是事務間的隔離性問題,

持久性:

指事務提交后對資料庫的修改時永久的,接下來的其他操作或故障不應該對其有任何影響,

 

一、原子性


MySQL的日志有很多種,例如Binlog、錯誤日志、慢查詢日志、查詢日志等;MySQL還提供了事務日志:redo log(重做日志)和undo log(回滾日志),undo log就是實作事務原子性的關鍵,

事務執行時對資料庫所做的修改,都會寫入undo log,例如INSERT、UPDATE、DELETE;如果事務執行失敗回滾,則會利用undo log中的資訊回滾,執行相反操作:對于每個insert,回滾時會執行delete;對于每個delete,回滾時會執行insert;對于每個update,回滾時會執行一個相反的update把資料改回去,

例如UPDATE操作:當事務執行UPDATE時,undo log 會記錄被修改行的主鍵,修改的列以及修改前后的資訊,在事務回滾時使用這些資訊回滾,

 

二、持久性


類似于undo log,redo log也屬于事務日志,

首先介紹下redo log存在的背景,

InnoDB引擎的資料是存在磁盤中的,我們都知道磁盤IO的資料是很慢的,如果每次讀寫資料都去做IO,效率會很低,因此,InnoDB采用了快取機制(Buffer Pool),Buffer Pool中有磁盤資料頁的映射,從資料庫中讀資料前會先從Buffer Pool中讀取,如果沒有,則從磁盤中讀取后放入Buffer Pool中;資料寫入時,也是會先寫入Buffer Pool中,再由MySQL定期刷入磁盤中,稱為“刷臟”,

任何新技術的參考總是會帶來新的問題,Buffer Pool機制的使用雖然大幅提升了MySQL的讀寫效率,但是一旦遇到MySQL宕機,但是Buffer Pool中的資料還沒刷入磁盤中,就會導致資料丟失,則破壞了事務的持久性,

綜上所述,redo log就是為了解決這個問題,資料修改前,會先將修改記錄寫入Buffer Pool中,事務提交后,MySQL會將redo log的記錄刷入磁盤中,這樣即使MySQL宕機,也能保證資料不丟失,啟動后根據redo log中的記錄恢復資料即可,

 

 三、隔離性


隔離性是事務中最關鍵的一個特性,我們常說的事務的隔離級別就是面向事務的隔離性來討論的,InnoDB在不同的隔離級別下使用了不同的實作機制,這一節也是本文的重點內容,

首先我們來了解下事務的隔離級別

SQL標準定義了四種事務間的隔離級別,MySQL都支持:

  1. 讀未提交(READ UNCOMMITTED)
  2. 讀已提交(READ COMMITED)
  3. 可重復讀(REPEATABLE READ)
  4. 串行化(SERIALIZABLE)

從1 - 4隔離強度遞增,并發性能遞減,MySQL的InnoDB默認的隔離級別是 可重復讀(REPEATABLE READ),

事務的隔離級別是為了解決事務并發中可能會產生的問題:

臟讀:

指事務的SELECT讀取到了其他事務未提交的資料,如果其他事物回滾,則產生臟讀,

可重復讀:

指在一個事務內,任意時刻讀到的資料都是一致的,例如在同一時刻內,事務A和事務B修改了同一行記錄,但是互相的修改不可見,這就是可重復讀,通常指的是更新(UPDATE)操作

不可重復讀:

與可重復讀相反,任意時刻讀到的資料不一致,也指更新(UPDATE)操作

幻讀:

指事務A中,執行了一次查詢,之后事務B又執行了一次插入(INSERT)操作并提交,下一時刻事務A又執行了一次查詢,查到了事務B插入的資料,好像發生幻覺一樣,就叫做幻讀,

 

事務隔離級別就是為了解決上述問題,不同隔離級別下能解決的程度不同,見下表,

隔離級別 臟讀 不可重復讀 幻讀
讀未提交 × × ×
讀已提交 × ×
可重復讀 ×
串行

 

 

 

 

 

 

讀未提交串行 由于資料一致性與性能的問題,基本不用,所以本文重點探討讀 已提交 和 可重復讀 的實作原理,

 

隔離性探討要分兩個部分來說:

1.事務之間的隔離,這主要是通過鎖機制來實作的,

2.事務之間的隔離,這主要是通過MVCC機制實作的,

 

1、寫與寫的隔離

首先我們來了解下InnoDB解決事務間寫與寫隔離的鎖機制:

事務在修改資料行之前,必須先獲得鎖才可以操作;獲得鎖之后,事務便可以操作資料,在此期間其他需要操作此行資料的事務只能阻塞等待,在事務完成或回滾后即可釋放鎖,讓下一個事務繼續爭奪鎖,

表鎖與行鎖

從鎖粒度的角度來說,鎖分為行鎖與表鎖,行鎖只會鎖定對應行的資料,在此期間其他事物不可修改此行資料;表鎖會鎖定整個表的資料,在此期間其他任何事務的修改操作都會阻塞,性能極差,

但是由于加鎖本身需要消耗資源(獲得鎖、檢查鎖、釋放鎖等),因此在鎖定資料較多情況下使用表鎖可以節省大量資源,

如下陳述句可以查看鎖資訊:

select * from sys.innodb_lock_waits; //8.0之后的陳述句
select * from information_schema.innodb_locks;

 

 舉個例子,以 8.0.18 的MySQL為例:

現有表資訊如下,id列是主鍵欄位:

執行以下陳述句后:

start transaction;
update t set a = 122 where id = 1;

start transaction;
update t set a = 1222 where id = 1;

  可以看到記錄添加了一個排它鎖(x),鎖型別為行鎖(record):

 

間隙鎖(GAP LOCK)與 臨鍵鎖(NEXT-KEY LOCK)

間隙鎖與臨鍵鎖也可以理解為行鎖,只是鎖的資料行多了些,

 注意:間隙鎖與臨鍵鎖只在非唯一索引上有效,

 

 間隙鎖基于 非唯一索引,注意:使用間隙鎖鎖住的是一個區間,而不僅僅是這個區間中的每一條資料,

select * from account where id between 1 and 10 for update;

 

 所有在(1,10)區間內的行都會鎖住,所有id 為 2、3、4、5、6、7、8、9 的資料行的插入會被阻塞,但是 1 和 10 兩條記錄行并不會被鎖住,

 間隙鎖的鎖定范圍為索引上命中或未命中的資料行的左最近一個記錄和右最近的一行記錄的左開右開區間,

例如:

 

 

圖中是一個age索引列上的資料,其中,(1,5)、(5,9)、(10,15) 就是間隙,在一個事務內執行如下陳述句時:

select * from user where age > 5 and age < 9 for update;

 這個時候區間( 5, 9 )是加了間隙鎖的,任何其他事務的修改(insert 、update、delete)都被阻塞,無法進行,直到持有鎖的事務提交或者回滾釋放鎖后,其他事務才能執行操作,

 

臨鍵鎖在使用非唯一索引進行范圍查詢,且命中了記錄的情況下才會使用,相當于記錄鎖 + 間隙鎖,

臨鍵鎖的鎖定范圍為左開右閉區間,目的是為了解決幻讀的問題,

臨鍵鎖有兩種退化的情況:

1. 如果是唯一性索引,等值查詢匹配到一條記錄的時候,退化成記錄鎖,

2. 如果沒有匹配到任何記錄的時候,退化成間隙鎖,

 考慮如下SQL:

select * from user where age > 5 and age < 15;

 

 上面的SQL命中了age = 9的資料,也包含了不存在的記錄的區間,所以(5, 9] 和 (10, 15]區間會被同時鎖定,這期間別的事務插入不了資料,也更新不了資料,

 

以上介紹的行鎖(RECORD LOCK)、間隙鎖(GAP LOCK)、臨鍵鎖(NEXT KEY LOCK)的使用解決了事務間寫與寫的隔離性問題,接下來介紹事務間寫與讀的隔離機制,

 

2. 讀與寫的隔離

InnoDB解決事務間讀寫的隔離采用的是MVCC(Multi-Version Concurrency Control)機制,即多版本并發控制協議,

用一個例子來說明MVCC的特點:

同一時刻,不同事務可以讀到不同版本的資料,在T5時刻,事務A和C可以讀到不同版本的資料,

 

MVCC的優勢在于讀不加鎖,通過對資料行的版本控制實作讀寫的隔離,并發性能優異,下面我們來深度分析一下MVCC的實作原理,

先來了解幾個概念:

1. 隱藏列:InnoDB中每行記錄都有隱藏列,包含本行資料當前事務的事務id、指向undo log的指標等,

2. 基于undo log的版本鏈:隱藏列中包含指向undo log的指標,每條undo log也包含指向前一版本的指標,由此形成了一條版本鏈,

3.ReadView:指事務在某一時刻給整個事務系統(trx_sys)打快照,后續讀操作會將讀取到的資料事務id與快照作比較,借此判斷是否資料是否對當前事務可見,如不可見則遍歷undo log指標到該資料的前一個版本號,

trx_sys中的主要內容如下:

low_limit_id:表示生成ReadView時事務系統即將分配給下一個事務的事務id,事務系統對事務的id分配是順序遞增的,

up_limit_id:表示生成ReadView時事務系統中活躍的事務中最小的事務id,

rw_trx_ids:表示生成ReadView時活躍的事務id串列,

 

判斷可見性的邏輯如下:

1. 如果資料的事務id大于等于low_limit_id,則對該ReadView不可見,

2. 如果資料事務id小于up_limit_id,則對該ReadView可見,

3. 如果資料事務id在low_limit_id和up_limit_id之間,則需要判斷事務id是否在rw_trx_ids中,如果在,表明生成ReadView時該事務仍在活躍,所以該資料對ReadView不可見;如果不在,表明生成ReadView時該事務已經提交了,則可見,

 

前面提到MVCC用于解決事務間寫與讀的隔離性問題,在可重復讀(REPEATABLE Read)級別下,MVCC解決了臟讀、不可重復讀、幻讀的問題,下面一一舉例來說明,

參考以上表格,事務A與B在同時開始,事務A在T3時刻查詢余額,會生成ReadView,此時事務B未提交仍在活躍,因此事務B的id會在rw_trx_ids中,所以事務B的修改對事務A不可見,事務A判斷不可見后會根據隱藏列的undo log指標查詢前一版本

的資料,得到值為100,這樣就避免了讀到事務B未提交的資料,避免了臟讀

 

 

 

參考以上表格,事務A在T2時刻查詢余額,查詢執行前會生成ReadView;事務B在T3時刻修改余額,隨后提交事務,事務A在T5時刻再次查詢了余額,使用首次查詢生成的ReadView來判斷,此時資料的事務id大于ReadView的low_limit_id,事務A

即從undo log的指標查詢前一版本的資料,余額依舊查詢為100,避免了不可重復讀,

 

 

 參考以上表格,事務A在T2時刻查詢資料前會生成一個ReadView;此時事務B在T3時刻插入了一個新用戶,且用戶主鍵在事務的查詢區間中,事務B可以分兩種情況來討論:

1. 一種是如圖中所示,事務已經開始但沒有提交,此時其事務id在ReadView的rw_trx_ids中;

2. 一種是事務B還沒有開始,此時其事務id大于等于ReadView的low_limit_id,

無論哪種情況,事務B的修改都是不可見的,

事務A在T5時刻再次讀取余額時,會根據首次查詢生成的ReadView判斷出事務B的修改是不可見的,因此會根據undo log指標查詢上一版本的資料,發現上一版本沒有資料,不作任何處理,避免了幻讀

 

總結:

前文介紹了InnoDB事務隔離性的大致實作原理,需要注意的是,MVCC在非加鎖讀的情況下生效,如果對select陳述句顯式的執行了 for update或for share關鍵字,InnoDB會采用鎖的形式來控制隔離,

在讀已提交和可重復讀的MVCC實作中對ReadView的生成是有些區別的,讀已提交在每次Select都會重新生成ReadView,從而實作對已提交的事務資料的可見,可重復讀則只會在事務首次Select時生成ReadView,從而保證

事務生命周期中對其他事務的修改的完全隔離,

 

四、一致性


一致性的實作其實是基于前文所提及的原子性、持久性和隔離性,換句話說,只有保證了原子性、持久性與隔離性,才能保證一致性,

此外,應用層面的一致性保證也是需要的,例如常見的轉賬操作,扣減庫存等,需要參考層面的并發控制機制來實作,

 

 

結語:


 

本文是對近期MySQL學習的總結和梳理,受本人水平所限,難免有出入之處,煩請各位讀者不吝賜教,

參考文獻:

https://www.cnblogs.com/kismetv/p/10331633.html

https://segmentfault.com/a/1190000040129107

轉載請註明出處,本文鏈接:https://www.uj5u.com/shujuku/445396.html

標籤:其他

上一篇:關于SQL Server 各種安裝失敗均失敗,報錯“等待資料庫引擎恢復句柄失敗”的經驗分享

下一篇:MySQL優化之索引決議

標籤雲
其他(157675) Python(38076) JavaScript(25376) Java(17977) C(15215) 區塊鏈(8255) C#(7972) AI(7469) 爪哇(7425) MySQL(7132) html(6777) 基礎類(6313) sql(6102) 熊猫(6058) PHP(5869) 数组(5741) R(5409) Linux(5327) 反应(5209) 腳本語言(PerlPython)(5129) 非技術區(4971) Android(4554) 数据框(4311) css(4259) 节点.js(4032) C語言(3288) json(3245) 列表(3129) 扑(3119) C++語言(3117) 安卓(2998) 打字稿(2995) VBA(2789) Java相關(2746) 疑難問題(2699) 细绳(2522) 單片機工控(2479) iOS(2429) ASP.NET(2402) MongoDB(2323) 麻木的(2285) 正则表达式(2254) 字典(2211) 循环(2198) 迅速(2185) 擅长(2169) 镖(2155) 功能(1967) .NET技术(1958) Web開發(1951) python-3.x(1918) HtmlCss(1915) 弹簧靴(1913) C++(1909) xml(1889) PostgreSQL(1872) .NETCore(1853) 谷歌表格(1846) Unity3D(1843) for循环(1842)

熱門瀏覽
  • GPU虛擬機創建時間深度優化

    **?桔妹導讀:**GPU虛擬機實體創建速度慢是公有云面臨的普遍問題,由于通常情況下創建虛擬機屬于低頻操作而未引起業界的重視,實際生產中還是存在對GPU實體創建時間有苛刻要求的業務場景。本文將介紹滴滴云在解決該問題時的思路、方法、并展示最終的優化成果。 從公有云服務商那里購買過虛擬主機的資深用戶,一 ......

    uj5u.com 2020-09-10 06:09:13 more
  • 可編程網卡芯片在滴滴云網路的應用實踐

    **?桔妹導讀:**隨著云規模不斷擴大以及業務層面對延遲、帶寬的要求越來越高,采用DPDK 加速網路報文處理的方式在橫向縱向擴展都出現了局限性。可編程芯片成為業界熱點。本文主要講述了可編程網卡芯片在滴滴云網路中的應用實踐,遇到的問題、帶來的收益以及開源社區貢獻。 #1. 資料中心面臨的問題 隨著滴滴 ......

    uj5u.com 2020-09-10 06:10:21 more
  • 滴滴資料通道服務演進之路

    **?桔妹導讀:**滴滴資料通道引擎承載著全公司的資料同步,為下游實時和離線場景提供了必不可少的源資料。隨著任務量的不斷增加,資料通道的整體架構也隨之發生改變。本文介紹了滴滴資料通道的發展歷程,遇到的問題以及今后的規劃。 #1. 背景 資料,對于任何一家互聯網公司來說都是非常重要的資產,公司的大資料 ......

    uj5u.com 2020-09-10 06:11:05 more
  • 滴滴AI Labs斬獲國際機器翻譯大賽中譯英方向世界第三

    **桔妹導讀:**深耕人工智能領域,致力于探索AI讓出行更美好的滴滴AI Labs再次斬獲國際大獎,這次獲獎的專案是什么呢?一起來看看詳細報道吧! 近日,由國際計算語言學協會ACL(The Association for Computational Linguistics)舉辦的世界最具影響力的機器 ......

    uj5u.com 2020-09-10 06:11:29 more
  • MPP (Massively Parallel Processing)大規模并行處理

    1、什么是mpp? MPP (Massively Parallel Processing),即大規模并行處理,在資料庫非共享集群中,每個節點都有獨立的磁盤存盤系統和記憶體系統,業務資料根據資料庫模型和應用特點劃分到各個節點上,每臺資料節點通過專用網路或者商業通用網路互相連接,彼此協同計算,作為整體提供 ......

    uj5u.com 2020-09-10 06:11:41 more
  • 滴滴資料倉庫指標體系建設實踐

    **桔妹導讀:**指標體系是什么?如何使用OSM模型和AARRR模型搭建指標體系?如何統一流程、規范化、工具化管理指標體系?本文會對建設的方法論結合滴滴資料指標體系建設實踐進行解答分析。 #1. 什么是指標體系 ##1.1 指標體系定義 指標體系是將零散單點的具有相互聯系的指標,系統化的組織起來,通 ......

    uj5u.com 2020-09-10 06:12:52 more
  • 單表千萬行資料庫 LIKE 搜索優化手記

    我們經常在資料庫中使用 LIKE 運算子來完成對資料的模糊搜索,LIKE 運算子用于在 WHERE 子句中搜索列中的指定模式。 如果需要查找客戶表中所有姓氏是“張”的資料,可以使用下面的 SQL 陳述句: SELECT * FROM Customer WHERE Name LIKE '張%' 如果需要 ......

    uj5u.com 2020-09-10 06:13:25 more
  • 滴滴Ceph分布式存盤系統優化之鎖優化

    **桔妹導讀:**Ceph是國際知名的開源分布式存盤系統,在工業界和學術界都有著重要的影響。Ceph的架構和演算法設計發表在國際系統領域頂級會議OSDI、SOSP、SC等上。Ceph社區得到Red Hat、SUSE、Intel等大公司的大力支持。Ceph是國際云計算領域應用最廣泛的開源分布式存盤系統, ......

    uj5u.com 2020-09-10 06:14:51 more
  • es~通過ElasticsearchTemplate進行聚合~嵌套聚合

    之前寫過《es~通過ElasticsearchTemplate進行聚合操作》的文章,這一次主要寫一個嵌套的聚合,例如先對sex集合,再對desc聚合,最后再對age求和,共三層嵌套。 Aggregations的部分特性類似于SQL語言中的group by,avg,sum等函式,Aggregation ......

    uj5u.com 2020-09-10 06:14:59 more
  • 爬蟲日志監控 -- Elastc Stack(ELK)部署

    傻瓜式部署,只需替換IP與用戶 導讀: 現ELK四大組件分別為:Elasticsearch(核心)、logstash(處理)、filebeat(采集)、kibana(可視化) 下載均在https://www.elastic.co/cn/downloads/下tar包,各組件版本最好一致,配合fdm會 ......

    uj5u.com 2020-09-10 06:15:05 more
最新发布
  • day02-2-商鋪查詢快取

    功能02-商鋪查詢快取 3.商鋪詳情快取查詢 3.1什么是快取? 快取就是資料交換的緩沖區(稱作Cache),是存盤資料的臨時地方,一般讀寫性能較高。 快取的作用: 降低后端負載 提高讀寫效率,降低回應時間 快取的成本: 資料一致性成本 代碼維護成本 運維成本 3.2需求說明 如下,當我們點擊商店詳 ......

    uj5u.com 2023-04-20 08:33:24 more
  • MySQL中binlog備份腳本分享

    關于MySQL的二進制日志(binlog),我們都知道二進制日志(binlog)非常重要,尤其當你需要point to point災難恢復的時侯,所以我們要對其進行備份。關于二進制日志(binlog)的備份,可以基于flush logs方式先切換binlog,然后拷貝&壓縮到到遠程服務器或本地服務器 ......

    uj5u.com 2023-04-20 08:28:06 more
  • day02-短信登錄

    功能實作02 2.功能01-短信登錄 2.1基于Session實作登錄 2.1.1思路分析 2.1.2代碼實作 2.1.2.1發送短信驗證碼 發送短信驗證碼: 發送驗證碼的介面為:http://127.0.0.1:8080/api/user/code?phone=xxxxx<手機號> 請求方式:PO ......

    uj5u.com 2023-04-20 08:27:27 more
  • 快取與資料庫雙寫一致性幾種策略分析

    本文將對幾種快取與資料庫保證資料一致性的使用方式進行分析。為保證高并發性能,以下分析場景不考慮執行的原子性及加鎖等強一致性要求的場景,僅追求最終一致性。 ......

    uj5u.com 2023-04-20 08:26:48 more
  • sql陳述句優化

    問題查找及措施 問題查找 需要找到具體的代碼,對其進行一對一優化,而非一直把關注點放在服務器和sql平臺 降低簡化每個事務中處理的問題,盡量不要讓一個事務拖太長的時間 例如檔案上傳時,應將檔案上傳這一步放在事務外面 微軟建議 4.啟動sql定時執行計劃 怎么啟動sqlserver代理服務-百度經驗 ......

    uj5u.com 2023-04-20 08:26:35 more
  • 云時代,MySQL到ClickHouse資料同步產品對比推薦

    ClickHouse 在執行分析查詢時的速度優勢很好的彌補了MySQL的不足,但是對于很多開發者和DBA來說,如何將MySQL穩定、高效、簡單的同步到 ClickHouse 卻很困難。本文對比了 NineData、MaterializeMySQL(ClickHouse自帶)、Bifrost 三款產品... ......

    uj5u.com 2023-04-20 08:26:29 more
  • sql陳述句優化

    問題查找及措施 問題查找 需要找到具體的代碼,對其進行一對一優化,而非一直把關注點放在服務器和sql平臺 降低簡化每個事務中處理的問題,盡量不要讓一個事務拖太長的時間 例如檔案上傳時,應將檔案上傳這一步放在事務外面 微軟建議 4.啟動sql定時執行計劃 怎么啟動sqlserver代理服務-百度經驗 ......

    uj5u.com 2023-04-20 08:25:13 more
  • Redis 報”OutOfDirectMemoryError“(堆外記憶體溢位)

    Redis 報錯“OutOfDirectMemoryError(堆外記憶體溢位) ”問題如下: 一、報錯資訊: 使用 Redis 的業務介面 ,產生 OutOfDirectMemoryError(堆外記憶體溢位),如圖: 格式化后的報錯資訊: { "timestamp": "2023-04-17 22: ......

    uj5u.com 2023-04-20 08:24:54 more
  • day02-2-商鋪查詢快取

    功能02-商鋪查詢快取 3.商鋪詳情快取查詢 3.1什么是快取? 快取就是資料交換的緩沖區(稱作Cache),是存盤資料的臨時地方,一般讀寫性能較高。 快取的作用: 降低后端負載 提高讀寫效率,降低回應時間 快取的成本: 資料一致性成本 代碼維護成本 運維成本 3.2需求說明 如下,當我們點擊商店詳 ......

    uj5u.com 2023-04-20 08:24:03 more
  • day02-短信登錄

    功能實作02 2.功能01-短信登錄 2.1基于Session實作登錄 2.1.1思路分析 2.1.2代碼實作 2.1.2.1發送短信驗證碼 發送短信驗證碼: 發送驗證碼的介面為:http://127.0.0.1:8080/api/user/code?phone=xxxxx<手機號> 請求方式:PO ......

    uj5u.com 2023-04-20 08:23:11 more