主頁 > 資料庫 > MySQL備份遷移之mydumper

MySQL備份遷移之mydumper

2022-04-25 07:16:44 資料庫

簡介

mydumper 是一款開源的 MySQL 邏輯備份工具,主要由 C 語言撰寫,與 MySQL 自帶的 mysqldump 類似,但是 mydumper 更快更高效,
mydumper 的一些優點特性:

  • 輕量級C語言開發
  • 支持多執行緒備份資料,備份后按表生成多個備份檔案
  • 支持事務性和非事務性表一致性備份
  • 支持將匯出的檔案壓縮,節約空間
  • 支持多執行緒恢復
  • 支持已守護行程模式作業,定時快照和連續二進制日志
  • 支持按指定大小將備份檔案切割
  • 資料與建表陳述句分離

下載安裝

安裝方式非常多,以下介紹幾種常見的方式,

  • Ubuntu 中自帶了 myloader

sudo apt-get install mydumper

  • 使用 deb 包安裝,以 Ubuntu 為例

apt-get install libatomic1
wget https://github.com/mydumper/mydumper/releases/download/v0.11.5/mydumper_0.11.5-1.$(lsb_release -cs)_amd64.deb dpkg -i mydumper_0.11.5-1.$(lsb_release -cs)_amd64.deb

  • 編譯安裝
  • docker 安裝

根據實際平臺情況,可選擇不同的安裝方式,官方也提供了一些常見的安裝檔案,https://github.com/mydumper/mydumper

引數說明

mydumper 引數說明

-B, --database              要備份的資料庫,不指定則備份所有庫,一般建議備份的時候一個庫一條命令
-T, --tables-list           需要備份的表,名字用逗號隔開
-o, --outputdir             備份檔案輸出的目錄
-s, --statement-size        生成的insert陳述句的位元組數,默認1000000
-r, --rows                  將表按行分塊時,指定的塊行數,指定這個選項會關閉 --chunk-filesize
-F, --chunk-filesize        將表按大小分塊時,指定的塊大小,單位是 MB
-c, --compress              壓縮輸出檔案
-e, --build-empty-files     如果表資料是空,還是產生一個空檔案(默認無資料則只有表結構檔案)
-x, --regex                 是同正則運算式匹配 'db.table'
-i, --ignore-engines        忽略的存盤引擎,用都厚分割
-m, --no-schemas            不備份表結構
-d, --no-data								不備份表資料
-G, --triggers							備份觸發器
-E, --events								備份事件
-R, --routines							備份存盤程序和函式
-W, --no-views							不備份視圖
--where 										只匯出符合條件的資料
-k, --no-locks              不使用臨時共享只讀鎖,使用這個選項會造成資料不一致
--less-locking              減少對InnoDB表的鎖施加時間(這種模式的機制下文詳解)
-l, --long-query-guard      設定阻塞備份的長查詢超時時間,單位是秒,默認是60秒(超時后默認mydumper將會退出)
--kill-long-queries         殺掉長查詢 (不退出)
-b, --binlogs               匯出binlog
-D, --daemon                啟用守護行程模式,守護行程模式以某個間隔不間斷對資料庫進行備份
-I, --snapshot-interval     dump快照間隔時間,默認60s,需要在daemon模式下
-L, --logfile               使用的日志檔案名(mydumper所產生的日志), 默認使用標準輸出
--tz-utc                    跨時區時使用的選項,允許備份timestamp,這樣會導致不同時區的備份還原出問題,默認關閉,
--skip-tz-utc               同上,默認值,
--use-savepoints            使用savepoints來減少采集metadata所造成的鎖時間,需要 SUPER 權限
--success-on-1146           Not increment error count and Warning instead of Critical in case of table doesn't exist
-h, --host                  連接的主機名
-u, --user                  備份所使用的用戶
-p, --password              密碼
-P, --port                  埠
-S, --socket                使用socket通信時的socket檔案
-t, --threads               開啟的備份執行緒數,默認是4
-C, --compress-protocol     壓縮與mysql通信的資料
-V, --version               顯示版本號
-v, --verbose               輸出資訊模式, 0 = silent, 1 = errors, 2 = warnings, 3 = info, 默認為 2

myloader 引數說明

-d, --directory                   備份檔案的檔案夾
-q, --queries-per-transaction     每次事物執行的查詢數量,默認是1000
-o, --overwrite-tables            如果要恢復的表存在,則先drop掉該表,使用該引數,需要備份時候要備份表結構
-B, --database                    還原到的資料庫(目標庫)
-s, --source-db										被還原的資料庫(源資料庫),-s db1 -B db2,表示源庫中的db1資料庫,匯入到db2資料庫中,
-e, --enable-binlog               啟用還原資料的二進制日志
-h, --host                        主機
-u, --user                        還原的用戶
-p, --password                    密碼
-P, --port                        埠
-S, --socket                      socket檔案
-t, --threads                     還原所使用的執行緒數,默認是4
-C, --compress-protocol           壓縮協議
-V, --version                     顯示版本
-v, --verbose                     輸出模式, 0 = silent, 1 = errors, 2 = warnings, 3 = info, 默認為2

常用案例

mydumper 匯出示例

# 個人實際中最常用的備份陳述句
mydumper -B test -o /home/mydumper/data/test -e -G -R -E -D -u root -p 123456 -h 192.168.0.191 -P 3306 -v 3 --long-query-guard 288000 --skip-tz-utc --no-locks --logfile /home/mydumper/log/test

# 備份全部資料庫 
mydumper -u root -p 123456 -o /home/mydumper/data/all/

# 備份全部資料庫,排除系統庫,
mydumper -u root -p 123456 --regex '^(?!(mysql|sys|performance_schema|information_schema))' -o /home/mydumper/data/all/

# 備份全部資料庫,包含觸發器、事件、存盤程序及函式
mydumper -u root -p 123456 -G -R -E -o /home/mydumper/data/all/

# 備份指定庫
mydumper -u root -p 123456 -G -R -E -B db1 -o /home/mydumper/data/db1

# 備份指定表
mydumper -u root -p 123456 -B db1 -T tb1,tb2 -o /home/mydumper/data/db1

# 只備份表結構
mydumper -u root -p 123456 -B db1 -d -o /home/mydumper/data/db1

# 只備份表資料
mydumper -u root -p 123456 -B db1 -m -o /home/mydumper/data/db1

myloader 匯入案例

# 個人實際中最常用的匯入陳述句
myloader -h 192.168.0.192 -P 33306 -u root -p 123456 -t 1 -v 3 -d /home/mydumper/data/test/0/ -B test

# 從備份中恢復指定庫
myloader -u root -p 123456 -s db1 -o -d /home/mydumper/data/all/0/

# 匯入時開啟 binlog
myloader -u root -p 123456 -e -o -d /home/mydumper/data/db1/0/

# 將源庫的 db1 匯入到備庫的 db1_bak 庫中
myloader -u root -p 123456 -B db1_bak -s db1 -o -d /home/mydumper/data/db1/0/

# 匯入特定的某幾張表
## 先將 metadata 檔案和需要單獨匯入的表的結構檔案和資料檔案匯入到單獨的檔案夾中,此處默認庫已建好,否則還需要復制建庫相關陳述句,
cp /home/mydumper/data/db1/0/metadata /backup/db1/0/
cp /home/mydumper/data/db1/0/d1.t1-schema.sql /backup/db1/0/
cp /home/mydumper/data/db1/0/d1.t1.sql /backup/db1/0/
## 從新檔案夾中匯入資料
myloader -u root -p 123456 -B db1 -d /backup/db1/0/
## 以上就可以單獨匯入 db1.t1 表

關于 -e 引數,需要稍微注意下,默認情況下,myloader 是不開啟 binlog 的,這樣可以提高匯入速度,如果匯入實體有從庫,且需要匯入的結果同步到從庫上,則需要使用 -e 打開 binlog 記錄,

匯出之后的目錄如下,以資料庫 d1 ,其中有表 t1 為例:

-d1
 -0
   metadata							記錄備份時間點的Binlog資訊,日志檔案名和寫入位置
   d1-schema-create.sql	建庫陳述句
   d1-schema-post.sql		        存盤程序,函式,事件創建陳述句
   d1.t1-schema.sql			        表結構檔案
   d1.t1.sql						表資料檔案,若使用了分塊引數,大表的資料檔案會出現多個,以數字分開,
 -1

以上為比較常見的匯出后的目錄結構,根據實際情況不同,可能還有會含有觸發器的檔案,含有視圖的檔案等,

常見問題與實踐經驗

  • Error switching to database whilst restoring table

使用 myloader 匯入時會出現這類報錯,可以嘗試的解決方法如下:調大 wait_timeout 引數;調大 max_packet_size 引數;使用一個執行緒匯入, -t 1,

  • (myloader:35671): CRITICAL **: Error restoring test.email_logger from file test.email_logger.sql: Cannot create a JSON value from a string with CHARACTER SET 'binary'.

MySQL 的一個 Bug,可以嘗試手動修改對應的備份檔案,將

/!40101 SET NAMES binary/;

修改為:

/!40101 SET NAMES utf8mb4/;

  • (myloader:34726): CRITICAL **: Error restoring test.(null) from file test-schema-post.sql: Access denied; you need (at least one of) the SUPER privilege(s) for this operation

在匯入 AWS RDS 時部分存盤程序創建失敗,有比較嚴格的權限限制,需要匯入用戶有 SUPER 權限,但是 AWS RDS 用戶無法授予 SUPER 權限,針對這部分存盤程序,可以考慮手動在備份庫上創建,

  • 大表匯出優化

使用 -r-F引數,對匯出的資料檔案進行分片,

  • 備份機器配置盡可能高

備份前先預估大小,避免機器磁盤不足,盡可能選用配置較高的機器,加快備份速度,

  • 非必要資料不備份

備份前對于不用備份的資料可以提前進行一次洗掉,也可在匯出資料時添加正則引數等過濾部分表

  • 備份盡量不跨網路

備份資料時盡量在內網中進行,若需要將資料遷移到外網,可以備份完之后,將備份檔案拷貝到外網服務器上,盡量減少匯出時網路不穩定的干擾,匯入時同理,

  • 加快匯入速度的一些方法

選擇合適的執行緒數,根據實際情況和機器配置,選擇合適的執行緒引數,并非執行緒數越多越快,
匯入時關閉 MySQL 的 binlog 寫入,待匯入完成后再開啟,
在內網或較穩定的環境中進行匯入,

原理與架構

mydumper 作業流程


主要步驟概括

  • 主執行緒 FLUSH TABLES WITH READ LOCK,施加全域只讀鎖,阻止DML陳述句寫入,保證資料的一致性,
  • 讀取當前時間點的二進制日志檔案名和日志寫入的位置并記錄在metadata檔案中,
  • N個dump執行緒 START TRANSACTION WITH CONSISTENT SNAPSHOT,開啟讀一致的事務,
  • dump non-InnoDB tables, 首先匯出非事物引擎的表,
  • 主執行緒 UNLOCK TABLES 非事物引擎備份完后,釋放全域只讀鎖,
  • dump InnoDB tables,基于事物匯出InnoDB表,
  • 事務結束,

myloader 作業原理


更多技術文章,請關注我的個人博客 www.immaxfang.com 和小公眾號 Max的學習札記

轉載請註明出處,本文鏈接:https://www.uj5u.com/shujuku/463552.html

標籤:其他

上一篇:mysql查詢優化

下一篇:錯誤:ISOC 禁止將字串常量轉換為'char*'

標籤雲
其他(157675) Python(38076) JavaScript(25376) Java(17977) C(15215) 區塊鏈(8255) C#(7972) AI(7469) 爪哇(7425) MySQL(7132) html(6777) 基礎類(6313) sql(6102) 熊猫(6058) PHP(5869) 数组(5741) R(5409) Linux(5327) 反应(5209) 腳本語言(PerlPython)(5129) 非技術區(4971) Android(4554) 数据框(4311) css(4259) 节点.js(4032) C語言(3288) json(3245) 列表(3129) 扑(3119) C++語言(3117) 安卓(2998) 打字稿(2995) VBA(2789) Java相關(2746) 疑難問題(2699) 细绳(2522) 單片機工控(2479) iOS(2429) ASP.NET(2402) MongoDB(2323) 麻木的(2285) 正则表达式(2254) 字典(2211) 循环(2198) 迅速(2185) 擅长(2169) 镖(2155) 功能(1967) .NET技术(1958) Web開發(1951) python-3.x(1918) HtmlCss(1915) 弹簧靴(1913) C++(1909) xml(1889) PostgreSQL(1872) .NETCore(1853) 谷歌表格(1846) Unity3D(1843) for循环(1842)

熱門瀏覽
  • GPU虛擬機創建時間深度優化

    **?桔妹導讀:**GPU虛擬機實體創建速度慢是公有云面臨的普遍問題,由于通常情況下創建虛擬機屬于低頻操作而未引起業界的重視,實際生產中還是存在對GPU實體創建時間有苛刻要求的業務場景。本文將介紹滴滴云在解決該問題時的思路、方法、并展示最終的優化成果。 從公有云服務商那里購買過虛擬主機的資深用戶,一 ......

    uj5u.com 2020-09-10 06:09:13 more
  • 可編程網卡芯片在滴滴云網路的應用實踐

    **?桔妹導讀:**隨著云規模不斷擴大以及業務層面對延遲、帶寬的要求越來越高,采用DPDK 加速網路報文處理的方式在橫向縱向擴展都出現了局限性。可編程芯片成為業界熱點。本文主要講述了可編程網卡芯片在滴滴云網路中的應用實踐,遇到的問題、帶來的收益以及開源社區貢獻。 #1. 資料中心面臨的問題 隨著滴滴 ......

    uj5u.com 2020-09-10 06:10:21 more
  • 滴滴資料通道服務演進之路

    **?桔妹導讀:**滴滴資料通道引擎承載著全公司的資料同步,為下游實時和離線場景提供了必不可少的源資料。隨著任務量的不斷增加,資料通道的整體架構也隨之發生改變。本文介紹了滴滴資料通道的發展歷程,遇到的問題以及今后的規劃。 #1. 背景 資料,對于任何一家互聯網公司來說都是非常重要的資產,公司的大資料 ......

    uj5u.com 2020-09-10 06:11:05 more
  • 滴滴AI Labs斬獲國際機器翻譯大賽中譯英方向世界第三

    **桔妹導讀:**深耕人工智能領域,致力于探索AI讓出行更美好的滴滴AI Labs再次斬獲國際大獎,這次獲獎的專案是什么呢?一起來看看詳細報道吧! 近日,由國際計算語言學協會ACL(The Association for Computational Linguistics)舉辦的世界最具影響力的機器 ......

    uj5u.com 2020-09-10 06:11:29 more
  • MPP (Massively Parallel Processing)大規模并行處理

    1、什么是mpp? MPP (Massively Parallel Processing),即大規模并行處理,在資料庫非共享集群中,每個節點都有獨立的磁盤存盤系統和記憶體系統,業務資料根據資料庫模型和應用特點劃分到各個節點上,每臺資料節點通過專用網路或者商業通用網路互相連接,彼此協同計算,作為整體提供 ......

    uj5u.com 2020-09-10 06:11:41 more
  • 滴滴資料倉庫指標體系建設實踐

    **桔妹導讀:**指標體系是什么?如何使用OSM模型和AARRR模型搭建指標體系?如何統一流程、規范化、工具化管理指標體系?本文會對建設的方法論結合滴滴資料指標體系建設實踐進行解答分析。 #1. 什么是指標體系 ##1.1 指標體系定義 指標體系是將零散單點的具有相互聯系的指標,系統化的組織起來,通 ......

    uj5u.com 2020-09-10 06:12:52 more
  • 單表千萬行資料庫 LIKE 搜索優化手記

    我們經常在資料庫中使用 LIKE 運算子來完成對資料的模糊搜索,LIKE 運算子用于在 WHERE 子句中搜索列中的指定模式。 如果需要查找客戶表中所有姓氏是“張”的資料,可以使用下面的 SQL 陳述句: SELECT * FROM Customer WHERE Name LIKE '張%' 如果需要 ......

    uj5u.com 2020-09-10 06:13:25 more
  • 滴滴Ceph分布式存盤系統優化之鎖優化

    **桔妹導讀:**Ceph是國際知名的開源分布式存盤系統,在工業界和學術界都有著重要的影響。Ceph的架構和演算法設計發表在國際系統領域頂級會議OSDI、SOSP、SC等上。Ceph社區得到Red Hat、SUSE、Intel等大公司的大力支持。Ceph是國際云計算領域應用最廣泛的開源分布式存盤系統, ......

    uj5u.com 2020-09-10 06:14:51 more
  • es~通過ElasticsearchTemplate進行聚合~嵌套聚合

    之前寫過《es~通過ElasticsearchTemplate進行聚合操作》的文章,這一次主要寫一個嵌套的聚合,例如先對sex集合,再對desc聚合,最后再對age求和,共三層嵌套。 Aggregations的部分特性類似于SQL語言中的group by,avg,sum等函式,Aggregation ......

    uj5u.com 2020-09-10 06:14:59 more
  • 爬蟲日志監控 -- Elastc Stack(ELK)部署

    傻瓜式部署,只需替換IP與用戶 導讀: 現ELK四大組件分別為:Elasticsearch(核心)、logstash(處理)、filebeat(采集)、kibana(可視化) 下載均在https://www.elastic.co/cn/downloads/下tar包,各組件版本最好一致,配合fdm會 ......

    uj5u.com 2020-09-10 06:15:05 more
最新发布
  • day02-2-商鋪查詢快取

    功能02-商鋪查詢快取 3.商鋪詳情快取查詢 3.1什么是快取? 快取就是資料交換的緩沖區(稱作Cache),是存盤資料的臨時地方,一般讀寫性能較高。 快取的作用: 降低后端負載 提高讀寫效率,降低回應時間 快取的成本: 資料一致性成本 代碼維護成本 運維成本 3.2需求說明 如下,當我們點擊商店詳 ......

    uj5u.com 2023-04-20 08:33:24 more
  • MySQL中binlog備份腳本分享

    關于MySQL的二進制日志(binlog),我們都知道二進制日志(binlog)非常重要,尤其當你需要point to point災難恢復的時侯,所以我們要對其進行備份。關于二進制日志(binlog)的備份,可以基于flush logs方式先切換binlog,然后拷貝&壓縮到到遠程服務器或本地服務器 ......

    uj5u.com 2023-04-20 08:28:06 more
  • day02-短信登錄

    功能實作02 2.功能01-短信登錄 2.1基于Session實作登錄 2.1.1思路分析 2.1.2代碼實作 2.1.2.1發送短信驗證碼 發送短信驗證碼: 發送驗證碼的介面為:http://127.0.0.1:8080/api/user/code?phone=xxxxx<手機號> 請求方式:PO ......

    uj5u.com 2023-04-20 08:27:27 more
  • 快取與資料庫雙寫一致性幾種策略分析

    本文將對幾種快取與資料庫保證資料一致性的使用方式進行分析。為保證高并發性能,以下分析場景不考慮執行的原子性及加鎖等強一致性要求的場景,僅追求最終一致性。 ......

    uj5u.com 2023-04-20 08:26:48 more
  • sql陳述句優化

    問題查找及措施 問題查找 需要找到具體的代碼,對其進行一對一優化,而非一直把關注點放在服務器和sql平臺 降低簡化每個事務中處理的問題,盡量不要讓一個事務拖太長的時間 例如檔案上傳時,應將檔案上傳這一步放在事務外面 微軟建議 4.啟動sql定時執行計劃 怎么啟動sqlserver代理服務-百度經驗 ......

    uj5u.com 2023-04-20 08:26:35 more
  • 云時代,MySQL到ClickHouse資料同步產品對比推薦

    ClickHouse 在執行分析查詢時的速度優勢很好的彌補了MySQL的不足,但是對于很多開發者和DBA來說,如何將MySQL穩定、高效、簡單的同步到 ClickHouse 卻很困難。本文對比了 NineData、MaterializeMySQL(ClickHouse自帶)、Bifrost 三款產品... ......

    uj5u.com 2023-04-20 08:26:29 more
  • sql陳述句優化

    問題查找及措施 問題查找 需要找到具體的代碼,對其進行一對一優化,而非一直把關注點放在服務器和sql平臺 降低簡化每個事務中處理的問題,盡量不要讓一個事務拖太長的時間 例如檔案上傳時,應將檔案上傳這一步放在事務外面 微軟建議 4.啟動sql定時執行計劃 怎么啟動sqlserver代理服務-百度經驗 ......

    uj5u.com 2023-04-20 08:25:13 more
  • Redis 報”OutOfDirectMemoryError“(堆外記憶體溢位)

    Redis 報錯“OutOfDirectMemoryError(堆外記憶體溢位) ”問題如下: 一、報錯資訊: 使用 Redis 的業務介面 ,產生 OutOfDirectMemoryError(堆外記憶體溢位),如圖: 格式化后的報錯資訊: { "timestamp": "2023-04-17 22: ......

    uj5u.com 2023-04-20 08:24:54 more
  • day02-2-商鋪查詢快取

    功能02-商鋪查詢快取 3.商鋪詳情快取查詢 3.1什么是快取? 快取就是資料交換的緩沖區(稱作Cache),是存盤資料的臨時地方,一般讀寫性能較高。 快取的作用: 降低后端負載 提高讀寫效率,降低回應時間 快取的成本: 資料一致性成本 代碼維護成本 運維成本 3.2需求說明 如下,當我們點擊商店詳 ......

    uj5u.com 2023-04-20 08:24:03 more
  • day02-短信登錄

    功能實作02 2.功能01-短信登錄 2.1基于Session實作登錄 2.1.1思路分析 2.1.2代碼實作 2.1.2.1發送短信驗證碼 發送短信驗證碼: 發送驗證碼的介面為:http://127.0.0.1:8080/api/user/code?phone=xxxxx<手機號> 請求方式:PO ......

    uj5u.com 2023-04-20 08:23:11 more