主頁 > 資料庫 > 多圖詳解:不停機分庫分表五個步驟

多圖詳解:不停機分庫分表五個步驟

2023-05-18 09:00:25 資料庫


1 理論知識

1.1 分庫分表是否必要

分庫分表確實可以解決單表資料量大這個問題,但是并非首選,因為分庫分表至少引入了三個必須解決的突出問題,

第一是分庫分表方案本身具有的復雜性,第二是本地事務失效問題,原本在同一個資料庫中可以保證強一致性業務邏輯,分庫之后事務失效,第三是難以聚合查詢問題,因為分庫分表后查詢條件中必須帶有shardingKey,所以限制了很多查詢場景,

我們在之前文章《面試官問單表資料量大是否必須分庫分表》介紹過解決單表資料量過大問題,可以按照刪、換、分、拆、異、熱這六個字順序進行處理,而不是一上來就分庫分表,

刪是指洗掉歷史資料并進行歸檔,換是指不要只使用資料庫資源,有些資料可以存盤至其它替代資源,分是指讀寫分離,增加多個讀實體應對讀多寫少的互聯網場景,拆是指分庫分表,將資料分散至不同的庫表中減輕壓力,異指資料異構,將一份資料根據不同業務需求保存多份,熱是指熱點資料,這是一個非常值得注意的問題,


1.2 分庫分表兩大維度

假設有一個電商資料庫存放訂單、商品、支付三張業務表,隨著業務量越來越大,這三張業務資料表也越來越大,查詢性能顯著降低,資料拆分勢在必行,那么資料拆分可以從縱向和橫向兩個維度進行,


1.2.1 縱向拆分

縱向拆分就是按照業務拆分,我們將電商資料庫拆分成三個庫,訂單庫、商品庫,支付庫,訂單表在訂單庫,商品表在商品庫,支付表在支付庫,這樣每個庫只需要存盤本業務資料,物理隔離不會互相影響,


02 縱向分表.jpg


1.2.2 橫向拆分

按照縱向拆分方案,現在我們已經有三個庫了,平穩運行了一段時間,但是隨著業務增長,每個單庫單表的資料量也越來越大,逐漸到達瓶頸,

這時我們就要對資料表進行橫向拆分,所謂橫向拆分就是根據某種規則將單庫單表資料分散到多庫多表,從而減小單庫單表的壓力,

橫向拆分策略有很多方案,最重要的一點是選好ShardingKey,也就是按照哪一列進行拆分,怎么分取決于我們訪問資料的方式,


(1) 范圍分片

如果我們選擇的ShardingKey是訂單創建時間,那么分片策略是拆分四個資料庫,分別存盤每季度資料,每個庫包含三張表,分別存盤每個月資料:


03 橫向分表_范圍分表.jpg


這個方案的優點是對范圍查詢比較友好,例如我們需要統計第一季度的相關資料,查詢條件直接輸入時間范圍即可,這個方案的問題是容易產生熱點資料,例如雙11當天下單量特別大,就會導致11月這張表資料量特別大從而造成訪問壓力,


(2) 查表分片

查表法是根據一張路由表決定ShardingKey路由到哪一張表,每次路由時首先到路由表里查到分片資訊,再到這個分片去取資料,我們分析一個查表法思想應用實際案例,

Redis官方在3.0版本之后提供了集群方案RedisCluster,其中引入了哈希槽(slot)這個概念,一個集群固定有16384個槽,在集群初始化時這些槽會平均分配到Redis集群節點上,每個key請求最終落到哪個槽計算公式是固定的:

SLOT = CRC16(key) mod 16384

一個key請求過來怎么知道去哪臺Redis節點獲取資料?這就要用到查表法思想:

(1) 客戶端連接任意一臺Redis節點,假設隨機訪問到節點A
(2) 節點A根據key計算出slot值
(3) 每個節點都維護著slot和節點映射關系表
(4) 如果節點A查表發現該slot在本節點,直接回傳資料給客戶端
(5) 如果節點A查表發現該slot不在本節點,回傳給客戶端一個重定向命令,告訴客戶端應該去哪個節點請求這個key的資料
(6) 客戶端向正確節點發起連接請求

查表法方案優點是可以靈活制定路由策略,如果我們發現有的分片已經成為熱點則修改路由策略,缺點是多一次查詢路由表操作增加耗時,而且路由表如果是單點也可能會有單點問題,


(3) 哈希分片

現在比較流行的分片方法是哈希分片,相較于范圍分片,哈希分片可以較為均勻將資料分散在資料庫中,我們現在將訂單庫拆分為4個庫編號為[0,3],每個庫包含3張表編號為[0,2],如下圖如所示:


04 橫向分表_哈希分表_1.jpg


我們選擇使用orderId作為ShardingKey,那么orderId=100這個訂單會保存在哪張表?因為是分庫分表,第一步確定路由到哪一個庫,取模計算結果表示庫表序號:

db_index = 100 % 4 = 0

第二步確定路由到哪一張表:

table_index = 100 % 3 = 1

第三步資料路由到0號庫1號表:


04 橫向分表_哈希分表_2.jpg


在實際開發中路由邏輯并不需要我們手動實作,因為有許多開源框架通過配置就可以實作路由功能,例如ShardingSphere、TDDL框架等等,


2 分庫分表準備作業

2.1 計算庫表數量

分幾個庫和幾張表是在分庫分表作業開始前必須要回答的問題,我們首先看看阿里巴巴開發手冊的建議:單表行數超過500萬行或者單表容量超過2GB才推薦進行分庫分表,如果預計3年后資料量根本達不到這個級別,請不要在創建表時就分庫分表,

我們提取出這個建議的兩個關鍵詞500萬、3年作為預估庫表數的基線,假設業務資料日增量60萬,那么應該如何預估需要分多少個庫,多少張表呢?

日增量60萬計算3年后資料總量:

三年資料總量 = 60 * 365 * 3 = 65700

隨著后續業務發展日增量會超過60萬,所以我們要對資料總量進行冗余,冗余指數是多少根據業務情況而定,本文按照3倍冗余:

三年資料總量三倍冗余 = 65700 * 3 = 197100

按照單表500萬并向上取整至2的冪次計算表數量

表數量 = 197100 / 500 = 394.2 向上取整 = 512

所有表放在一個庫并不合適,因為隨著資料量增大,訪問并發量也會呈正相關增大,一個資料庫實體是難以支撐的,本文按照一個資料庫實體包含32張表計算庫數量:

庫數量 = 512 / 32 = 16

2.2 shardingKey

確定shardingKey非常關鍵,因為作為分片指標,當資料拆分至多個庫表之后,代理層只能根據shardingKey進行表路由,假設我們設定了userId作為shardingKey,那么后續DML操作都必須包含userId欄位,但是現在有一種場景只有orderId作為查詢條件,那么我們應該如何處理這種場景呢?

第一種方案是設計orderId包含userId相關特征,這樣即使只有訂單號作為查詢條件,也可以截取userId特征進行分片:

訂單號 = 毫秒數 + 版本號 + userId后六位 + 全域序列號

第二種方案是資料異構,核心思想是以空間換時間,一份資料根據不同維度存盤到多個資料介質,資料異構一般分為如下型別,

資料異構至MySQL:我們可以選擇orderId作為shardingKey存盤至另一個資料庫實體,那么orderId就可以作為條件進行查詢,

資料異構至ES:如果每一個維度都新建一個資料庫實體也是不現實的,所以我們可以將資料同步至ES滿足多維度查詢需求,

資料異構至Hive:MySQL和ES可以滿足實時查詢需求,Hive可以滿足離線分析需求,報表等資料分析作業無需通過主庫,而是可以通過Hive進行,

現在又引出一個新問題,業務不可能每次都將資料寫入多個資料源,這樣會帶來性能問題和資料一致性問題,所以需要一個管道進行各資料源之間同步,阿里開源的canal組件可以解決這個問題,


3 分庫分表實體

在完成準備作業之后,我們可以開始分庫分表作業了,分庫分表方法有很多種,但是說到底都是在處理兩類資料:存量和增量,存量表示舊資料庫已經存在的資料,增量表示不存在于舊資料庫待新增或者變更的資料,根據存量和增量這兩種型別,我們可以將分庫分表方法分為停服拆分和不停服拆分,


3.1 停服拆分

停服是指停止服務,系統不再接收新業務資料,那么舊資料在分庫分表這個時間段內是靜止不變的,資料全部變為了存量資料,停服拆分一般分為三個階段,

第一階段首先撰寫代理層和新DAO,代理層通過開關決定訪問舊表還是新表,此時流量還是全部訪問舊表:


00 停服_階段1.jpg


第二階段停止服務,整個應用都沒有流量,舊表資料已經處于靜止狀態,此時通過腳本將存量資料從舊表遷移至新表:


00 停服_階段2.jpg


第三階段通過代理層訪問新表,如果出現錯誤可以停服排查問題:


00 停服_階段3.jpg


3.2 不停服拆分

停服拆分方案比較簡單,但是在分表這段時間沒有業務流量,對業務是有損的,所以我們一般采用不停服拆分方案,一邊有流量訪問,一邊進行分庫分表,此時資料不僅有存量還有增量,相對而言會復雜一些,

第一階段首先撰寫代理層和新DAO,代理層通過開關決定訪問舊表還是新表,此時流量還是全部訪問舊表:


01 不停服_階段1.jpg


第二階段開啟雙寫,增量資料不僅在舊表新增和修改,也在新表新增和修改,日志或者臨時表記錄下寫入新表ID起始值,舊表中小于這個值的資料就是存量資料:


02 不停服_階段2.jpg


第三階段存量資料遷移,通過腳本將存量資料寫入新表:


03 不停服_階段3.jpg


第四階段停讀舊表改讀新表,此時新表已經承載了所有讀寫業務,但是不要立刻停寫舊表,需要保持雙寫一段時間,

不停寫舊表有兩個原因:第一是因為如果讀新表出現問題,還可以將讀流量切回舊表,第二是因為可以進行資料校對,例如新表和舊表資料都同步至Hive,選取幾天的資料進行校對,從而驗證資料同步的準確性,


04 不停服_階段4.jpg


第五階段當讀寫新表一段時間之后,沒有發生業務問題,可以停寫舊表:


05 不停服_階段5.jpg


3.3 代理層實作

代理層實作了新舊資料源切換,需要盡量減少業務層代碼的侵入性,而配接器模式可以有效減少對業務層的侵入性,我們首先看看舊資料訪問物件和業務服務:

// 訂單資料物件
public class OrderDO {
    private String orderId;
    private Long price;

    public String getOrderId() {
        return orderId;
    }

    public void setOrderId(String orderId) {
        this.orderId = orderId;
    }

    public Long getPrice() {
        return price;
    }

    public void setPrice(Long price) {
        this.price = price;
    }
}

// 舊DAO
public interface OrderDAO {
    public void insert(OrderDO orderDO);
}

// 業務服務
public class OrderServiceImpl implements OrderService {

    @Resource
    private OrderDAO orderDAO;

    @Override
    public String createOrder(Long price) {
        String orderId = "orderId_123";
        OrderDO orderDO = new OrderDO();
        orderDO.setOrderId(orderId);
        orderDO.setPrice(price);
        orderDAO.insert(orderDO);
        return orderId;
    }
}

引入新資料源訪問物件:

// 新資料物件
public class OrderNewDO {
    private String orderId;
    private Long price;
}

// 新DAO
public interface OrderNewDAO {
    public void insert(OrderNewDO orderNewDO);
}

配接器模式減少業務代碼侵入性:

// 代理層
public class OrderDAOProxy implements OrderDAO {
    private OrderDAO orderDAO;
    private OrderNewDAO orderNewDAO;

    public OrderDAOProxy(OrderDAO orderDAO, OrderNewDAO orderNewDAO) {
        this.orderDAO = orderDAO;
        this.orderNewDAO = orderNewDAO;
    }

    @Override
    public void insert(OrderDO orderDO) {
        if(ApolloConfig.routeNewDB) {
            OrderNewDO orderNewDO = new OrderNewDO();
            orderNewDO.setPrice(orderDO.getPrice());
            orderNewDO.setOrderId(orderDO.getOrderId());
            orderNewDAO.insert(orderNewDO);
        } else {
            orderDAO.insert(orderDO);
        }
    }
}


// 業務服務
public class OrderServiceImpl implements OrderService {

    @Resource
    private OrderDAO orderDAO;
    @Resource
    private OrderNewDAO orderNewDAO;

    @Override
    public String createOrder(Long price) {
        String orderId = "orderId_123";
        OrderDO orderDO = new OrderDO();
        orderDO.setOrderId(orderId);
        orderDO.setPrice(price);
        new OrderDAOProxy(orderDAO, orderNewDAO).insert(orderDO);
        return orderId;
    }
}

4 文章總結

分庫分表具有三個必須面對的問題:方案本身復雜性、本地事務失效問題、難以聚合查詢問題,所以分庫分表方案并非解決海量資料問題的首選,

如果必須分庫分表,首先進行容量預估并選擇合適的shardingKey,其次根據實際業務選擇停服或者不停服方案,如果選擇不停服方案,注意保持新表和舊表雙寫一段時間,從而驗證資料準確性,希望本文對大家有所幫助,


5 延伸閱讀

一種簡單可落地的分布式事務方案

面試官問單表資料量大是否必須分庫分表

轉載請註明出處,本文鏈接:https://www.uj5u.com/shujuku/552750.html

標籤:MySQL

上一篇:多表操作

下一篇:返回列表

標籤雲
其他(159240) Python(38148) JavaScript(25433) Java(18055) C(15228) 區塊鏈(8267) C#(7972) AI(7469) 爪哇(7425) MySQL(7197) html(6777) 基礎類(6313) sql(6102) 熊猫(6058) PHP(5871) 数组(5741) R(5409) Linux(5340) 反应(5209) 腳本語言(PerlPython)(5129) 非技術區(4971) Android(4572) 数据框(4311) css(4259) 节点.js(4032) C語言(3288) json(3245) 列表(3129) 扑(3119) C++語言(3117) 安卓(2998) 打字稿(2995) VBA(2789) Java相關(2746) 疑難問題(2699) 细绳(2522) 單片機工控(2479) iOS(2433) ASP.NET(2403) MongoDB(2323) 麻木的(2285) 正则表达式(2254) 字典(2211) 循环(2198) 迅速(2185) 擅长(2169) 镖(2155) .NET技术(1975) 功能(1967) Web開發(1951) HtmlCss(1938) python-3.x(1918) C++(1917) 弹簧靴(1913) xml(1889) PostgreSQL(1878) .NETCore(1861) 谷歌表格(1846) Unity3D(1843) for循环(1842)

熱門瀏覽
  • GPU虛擬機創建時間深度優化

    **?桔妹導讀:**GPU虛擬機實體創建速度慢是公有云面臨的普遍問題,由于通常情況下創建虛擬機屬于低頻操作而未引起業界的重視,實際生產中還是存在對GPU實體創建時間有苛刻要求的業務場景。本文將介紹滴滴云在解決該問題時的思路、方法、并展示最終的優化成果。 從公有云服務商那里購買過虛擬主機的資深用戶,一 ......

    uj5u.com 2020-09-10 06:09:13 more
  • 可編程網卡芯片在滴滴云網路的應用實踐

    **?桔妹導讀:**隨著云規模不斷擴大以及業務層面對延遲、帶寬的要求越來越高,采用DPDK 加速網路報文處理的方式在橫向縱向擴展都出現了局限性。可編程芯片成為業界熱點。本文主要講述了可編程網卡芯片在滴滴云網路中的應用實踐,遇到的問題、帶來的收益以及開源社區貢獻。 #1. 資料中心面臨的問題 隨著滴滴 ......

    uj5u.com 2020-09-10 06:10:21 more
  • 滴滴資料通道服務演進之路

    **?桔妹導讀:**滴滴資料通道引擎承載著全公司的資料同步,為下游實時和離線場景提供了必不可少的源資料。隨著任務量的不斷增加,資料通道的整體架構也隨之發生改變。本文介紹了滴滴資料通道的發展歷程,遇到的問題以及今后的規劃。 #1. 背景 資料,對于任何一家互聯網公司來說都是非常重要的資產,公司的大資料 ......

    uj5u.com 2020-09-10 06:11:05 more
  • 滴滴AI Labs斬獲國際機器翻譯大賽中譯英方向世界第三

    **桔妹導讀:**深耕人工智能領域,致力于探索AI讓出行更美好的滴滴AI Labs再次斬獲國際大獎,這次獲獎的專案是什么呢?一起來看看詳細報道吧! 近日,由國際計算語言學協會ACL(The Association for Computational Linguistics)舉辦的世界最具影響力的機器 ......

    uj5u.com 2020-09-10 06:11:29 more
  • MPP (Massively Parallel Processing)大規模并行處理

    1、什么是mpp? MPP (Massively Parallel Processing),即大規模并行處理,在資料庫非共享集群中,每個節點都有獨立的磁盤存盤系統和記憶體系統,業務資料根據資料庫模型和應用特點劃分到各個節點上,每臺資料節點通過專用網路或者商業通用網路互相連接,彼此協同計算,作為整體提供 ......

    uj5u.com 2020-09-10 06:11:41 more
  • 滴滴資料倉庫指標體系建設實踐

    **桔妹導讀:**指標體系是什么?如何使用OSM模型和AARRR模型搭建指標體系?如何統一流程、規范化、工具化管理指標體系?本文會對建設的方法論結合滴滴資料指標體系建設實踐進行解答分析。 #1. 什么是指標體系 ##1.1 指標體系定義 指標體系是將零散單點的具有相互聯系的指標,系統化的組織起來,通 ......

    uj5u.com 2020-09-10 06:12:52 more
  • 單表千萬行資料庫 LIKE 搜索優化手記

    我們經常在資料庫中使用 LIKE 運算子來完成對資料的模糊搜索,LIKE 運算子用于在 WHERE 子句中搜索列中的指定模式。 如果需要查找客戶表中所有姓氏是“張”的資料,可以使用下面的 SQL 陳述句: SELECT * FROM Customer WHERE Name LIKE '張%' 如果需要 ......

    uj5u.com 2020-09-10 06:13:25 more
  • 滴滴Ceph分布式存盤系統優化之鎖優化

    **桔妹導讀:**Ceph是國際知名的開源分布式存盤系統,在工業界和學術界都有著重要的影響。Ceph的架構和演算法設計發表在國際系統領域頂級會議OSDI、SOSP、SC等上。Ceph社區得到Red Hat、SUSE、Intel等大公司的大力支持。Ceph是國際云計算領域應用最廣泛的開源分布式存盤系統, ......

    uj5u.com 2020-09-10 06:14:51 more
  • es~通過ElasticsearchTemplate進行聚合~嵌套聚合

    之前寫過《es~通過ElasticsearchTemplate進行聚合操作》的文章,這一次主要寫一個嵌套的聚合,例如先對sex集合,再對desc聚合,最后再對age求和,共三層嵌套。 Aggregations的部分特性類似于SQL語言中的group by,avg,sum等函式,Aggregation ......

    uj5u.com 2020-09-10 06:14:59 more
  • 爬蟲日志監控 -- Elastc Stack(ELK)部署

    傻瓜式部署,只需替換IP與用戶 導讀: 現ELK四大組件分別為:Elasticsearch(核心)、logstash(處理)、filebeat(采集)、kibana(可視化) 下載均在https://www.elastic.co/cn/downloads/下tar包,各組件版本最好一致,配合fdm會 ......

    uj5u.com 2020-09-10 06:15:05 more
最新发布
  • 多圖詳解:不停機分庫分表五個步驟

    1 理論知識 1.1 分庫分表是否必要 分庫分表確實可以解決單表資料量大這個問題,但是并非首選。因為分庫分表至少引入了三個必須解決的突出問題。 第一是分庫分表方案本身具有的復雜性。第二是本地事務失效問題,原本在同一個資料庫中可以保證強一致性業務邏輯,分庫之后事務失效。第三是難以聚合查詢問題,因為分庫 ......

    uj5u.com 2023-05-18 09:00:25 more
  • 多表操作

    第一章 外鍵 在實際開發專案中,一個健壯的資料表一定有很好的參照完整性,為保證資料的完整性,需將兩表建立關系。這時可通過外鍵約束來實作 1.1、介紹 什么是外鍵約束? 在另一張表中參考另一張表的主鍵約束或唯一約束。 例如:如下操作創建表 create table grade( id int prim ......

    uj5u.com 2023-05-18 09:00:20 more
  • DQL陳述句(一) -----簡單select查詢

    DQL陳述句 1、格式 select 列名*N from 表名 where 查詢條件1 and/or 查詢條件2 group by 列 Having 分組條件 Order by 排序 2、規則 sql在書寫時除了查詢條件外,大小寫都可以 select * from user where uname=' ......

    uj5u.com 2023-05-18 08:55:07 more
  • [MySQL事務一文搞懂]

    [MySQL事務一文搞懂] 1、什么是事務? 事務(Transaction),顧名思義就是要做的或所做的事情,資料庫事務指的則是作為單個邏輯作業單元執行的一系列操作(SQL陳述句)。這些操作要么全部執行,要么全部不執行。 2、為什么需要事務 把一系列sql放入一個事務中有兩個目的: 為資料庫操作提供了 ......

    uj5u.com 2023-05-18 08:50:01 more
  • 玩轉MYSQL資料庫之--視圖詳解

    前言 從今天開始本系列文章就帶各位小伙伴學習資料庫技術。資料庫技術是Java開發中必不可少的一部分知識內容。也是非常重要的技術。本系列教程由淺入深, 全面講解資料庫體系。 非常適合零基礎的小伙伴來學習。 全文大約 【1297】字,不說廢話,只講可以讓你學到技術、明白原理的純干貨!本文帶有豐富案例及配 ......

    uj5u.com 2023-05-18 08:49:58 more
  • MySQL觸發器Trigger加載以及目前局限

    GreatSQL社區原創內容未經授權不得隨意使用,轉載請聯系小編并注明來源。 GreatSQL是MySQL的國產分支版本,使用上與MySQL一致。 作者: 亮 文章來源:GreatSQL社區原創 概念介紹 首先需要知道MySQL中觸發器特點,以及表table相關觸發器加載方式 MySQL中單個tri ......

    uj5u.com 2023-05-18 08:48:45 more
  • Greenplum資料庫中segment故障檢測

    1.Greenplum資料庫中segment故障檢測 1.1概述 Greenplum資料庫服務器(Postgres)有一個子行程,該子行程為ftsprobe,主要作用是處理故障檢測。 ftsprobe 監視Greenplum資料庫陣列,它以可以配置的間隔連接并掃描所有segment和資料庫行程。 如 ......

    uj5u.com 2023-05-18 08:48:31 more
  • 提高資料的安全性和可控性,數堆疊基于 Ranger 實作的 Spark SQL

    在企業級應用中,資料的安全性和隱私保護是極其重要的。Spark 作為數堆疊底層計算引擎之一,必須確保資料只能被授權的人員訪問,避免出現資料泄露和濫用的情況。為了實作Spark SQL 對資料的精細化管理及提高資料的安全性和可控性,數堆疊基于 Apache Ranger 實作了 Spark SQL 對資料 ......

    uj5u.com 2023-05-18 08:48:21 more
  • 單表查詢

    第一章 簡單查詢 1.1、select陳述句 mysql 中查詢資料的基本陳述句是select陳述句。 語法: select [distinct] 欄位1,欄位2,欄位3..... from 表名 [where 條件運算式] [group by 欄位名] [having 條件運算式] [order by ......

    uj5u.com 2023-05-16 22:26:48 more
  • PostgreSQL一站式插件推薦 -- pg_enterprise_views

    近日發現PG官方插件串列中新收錄了一款插件 pg_enterprise_views,因為官方已經數年未添新的插件了很是新奇,找了臺設備測驗過后果斷上了生產,得空分享給大家。 該插件提供了數十張系統表及一個GUI工具,用以監控從作業系統到資料庫方方面面的性能情況,并支持對任意時段歷史資料的回溯,基本等 ......

    uj5u.com 2023-05-16 22:26:12 more