file

在最新一屆國際資料庫頂級會議 ACM SIGMOD 2022 上，來自清華大學的李國良和張超兩位老師發表了一篇論文：《HTAP Database: What is New and What is Next》,并做了 《HTAP Database：A Tutorial 的專項報告，這幾期學術分享會的文章，StoneDB 將系統地梳理一下兩位老師的報告，帶讀者了解 HTAP 的發展現狀和未來趨勢，

在《深度干貨！一篇 Paper 帶您讀懂 HTAP》這期中我們對HTAP產生的背景和現有的HTAP資料庫及其技術堆疊做了比較全面的介紹，

在《爆肝整理 5000 字！HTAP 的關鍵技術有哪些？》這一期，我們對 HTAP 的五大關鍵技術進行了逐個解讀，

本期主要介紹一下主流的幾個的 HTAP 資料庫基準測驗，

編輯：宇亭

頭圖：Yeekin

關于 HTAP 資料庫的基準測驗，我們在學術分享會的第三期也介紹過一個來自慕尼黑工業大學 DB 組的相關作業，感興趣可以了解一下，在這篇報告中，主要介紹兩種：CH-Benchmark 和 HTAPBench，
Overview of HTAP Benchmarks

如圖所示，這兩種基準測驗的核心區別在于，CH-Benchmark 是混合負載測驗，即 OLTP 和 OLAP 一起測；HTAPBench 是先固定統一 OLTP 的標準，然后在這個標準下再去控制測驗 OLAP（當然還多了一個時間視窗的選擇），

這里順便簡單科普一下什么是 TPC-C 和 TPC-H：

先介紹一下 TPC 是啥，TPC（Transaction Processing Performance Council，事務處理性能委員會）是由數十家會員公司創建的非盈利組織，總部設在美國，TPC 的成員主要是計算機軟硬體廠家，而非計算機用戶，其功能是制定商務應用基準程式的標準規范、性能和價格度量，并管理測驗結果的發布，其他更多資訊就可以百度啦，總之這個組織在國際上很有影響力，學術界和工業界也都蠻認可的，

TPC-C: TPC Benchmark C 于1992年7月批準，是一個在線交易處理（OLTP）基準，TPC-C 比以前的 OLTP 基準測驗（如TPC-A）更復雜，因為它具有多種事務型別、更復雜的資料庫和整體執行結構，TPC-C 涉及五個不同型別和復雜度的并發事務的混合，要么在線執行，要么排隊等待延遲執行，資料庫由九種型別的表組成，這些表存盤的記錄多而廣泛，TPC-C 以每分鐘事務數（tpmC）來衡量，雖然基準描述了批發供應商的活動，但 TPC-C 并不局限于任何特定業務部門的活動，而是代表必須管理、銷售或分銷產品或服務的任何行業，官網：https://www.tpc.org/tpcc/default5.asp
TPC-H: TPC-H 是 TPC 組織制定的 OLAP 型資料庫管理系統性能測驗的一個標準，用來模擬真實商業的應用環境，以評估商業分析中決策支持系統（DSS）的性能，TPC-H 模擬真實商業交易資料庫的動態查詢，包含了一整套面向商業的 ad-hoc 查詢和并發資料修改，強調測驗的作業系統、資料庫、和 I/O 性能，關注查詢能力，通過TPC-H 測驗，可以全方位評測系統的整體商業計算綜合能力，具有普遍的商業實用意義，官網：https://www.tpc.org/tpch/

簡單說，TPC-C 是專門測驗 OLTP 的；TPC-H 是專門測驗 OLAP 的，當然，其實還有個 TPC-DS 也比較知名（現在一般用來測數倉的），感興趣也可以了解一下，

雖然以上兩種測驗基準已經非常給力，但是對于測驗 HTAP 卻又都顯得片面了一些，因為 HTAP 資料庫上是同時跑著 OLTP 和 OLAP 作業負載的，單獨只考量 OLTP 或者 OLAP 的性能都是不對的，要測就得綜合評估兩者一起作業時的性能（比如 TP 和 AP 的隔離性），因此，后續有人提出了專門針對 HTAP 資料庫的基準測驗，其中比較知名的就是 CH-Benchmark 和 HTAPBench，

這兩個測驗基準單獨拿出來都能寫一篇文章，但在報告中其實只有兩段話，我這一篇解讀文章先做一個簡單的介紹，后面會出擴充的講解，歡迎大家關注 StoneDB 公眾號，
file

一、CH-Benchmark

CH-Benchmark

在 CH-Benchmark 中結合了 TPC-C 和 TPC-H 兩種基準，它把原來 TPC-C 中的 9 個表和 TPC-H 中的 8 個表修改合并成了 12 個表，并將兩者的伸縮模型也統一起來（Scaling TPC-H by the same factors of TPC-C），

這里小編來解釋一下,TPC-C 和 TPC-H 遵循不同的伸縮模型，TPC-C 遵循連續伸縮模型，倉庫表中的資料隨著系統性能的增加而增加，相反，TPC-H 遵循固定比例因子模型，其中資料庫大小由比例因子設定，而與系統性能無關，在 CH-Benchmark 中要求令 TPC-H 的伸縮模型去與TPC-C的伸縮模型相適應（以TPC-C的伸縮模型為基礎）,也就是要求根據TPC-C規則，去設定各表（Warehouse, Stock, Item, History, Neworder, Orderline, District, Customer, and Order）的規模，

關于查詢陳述句，有三點大的修改：

保留了 TPC-C 中的五個事務：新訂單（New Order）：客戶輸入一筆新的訂貨交易；支付操作（Payment）：更新客戶帳戶余額以反映其支付狀況；發貨（Delivery）：發貨（模擬批處理交易）；訂單狀態查詢（Order Status）：查詢客戶最近交易的狀態；庫存狀態查詢（Stock Level）：查詢倉庫庫存狀況，以便能夠及時補貨，
修改了 TPC-H 的 22 條查詢，修改了 table name 和 join key，并減少了算術運算，
刪掉了重繪函式（refresh functions）

file

1 CH-Benchmark 的執行規則

先僅測驗 OLTP 或 OLAP，然后混合執行(OLTP+OLAP)
控制 OLTP 和 OLAP 并行流的個數（The number of parallel OLTP and OLAP streams）

這里就是需要用到基準引數控制 OLTP 和 OLAP 作業負載的并發執行，

2 CH-Benchmark 評測度量的性能指標

這里提出了一種基于參照系的評測指標，主要是結合每分鐘事務(tpmC，transactions per minute)和每小時已完成查詢(QphH，queries per hour)的指標，

面向 OLAP 的指標（OLAP 占據主導）：

file

面向 OLTP 的指標（OLTP 占據主導）：

file

為了進行這一比較，我們首先從 n 個 OLTP 和 m 個 OLAP 流隔離運行的運行中計算 tpmC 和 QphH 測量值之間的比率，然后，我們將此比率與并行執行 n 個 OLTP 和 m 個 OLAP 流的混合作業負載所產生的比率進行比較，與獨立運行作業負載部分相比，并行執行的比例更高，這意味著資料庫系統在并行執行中為 OLTP 事務提供更好的服務，

舉個栗子：隔離執行為 5.7@5084 tpmC，混合執行為 6.5@5188 tpmC，這表示混合執行增加了 OLTP 吞吐量，

參考論文：Cole R, Funke F, Giakoumakis L, et al. The mixed workload CH-benCHmark[C]//Proceedings of the Fourth International Workshop on Testing Database Systems. 2011: 1-6.
file

二、HTAPBench

1 HTAPBench 的模式和作業負載

這一塊是和 CH-Benchmark（TPC-C + TPC-H）一樣的，不贅述了，

2 HTAPBench 的執行規則

Fixed target tpmC with controllable OLAP workers

固定 OLTP （tpmC）為首要目標，然后動態地控制 OLAP 的 Worker 執行緒，這種方式在執行程序中會根據 OLTP 的實時吞吐量來調整添加 OLAP 作業流，由此測驗出在固定 OLTP 性能下能獲得的最大 OLAP 性能，

Time window for querying newly-inserted data（查詢新插入資料的時間視窗）

優勢是增加了時間視窗的選擇，Time window 這個不知道大家熟不熟悉，所謂時間視窗，就是根據時間劃分視窗，是將指定時間范圍內的所有資料組成一個 window，一次對一個 window 里面的所有資料進行計算，詳細的不展開講了，后續我把這篇論文拿出來解讀一下子，

3 HTAPBench 評測度量的性能指標：

Under a certain TP throughput, the AP throughput per hour per worker（在一定 TP 吞吐量下，每個 Worker 每小時的 AP 吞吐量）
file

參考論文：Coelho F, Paulo J, Vila?a R, et al. Htapbench: Hybrid transactional and analytical processing benchmark[C]//Proceedings of the 8th ACM/SPEC on International Conference on Performance Engineering. 2017: 293-304.

file

三、對比

file
Comparison of HTAP End-to-End Benchmarks

CH-Benchmark：
- 優勢：易用、執行靈活
- 劣勢：資料新鮮度較低
HTAPBench：
- 優勢：資料新鮮度高
- 劣勢：固定了 OLTP 的指標

file

四、其他 HTAP 測驗標準

首先介紹一下端到端（End-to-End）的 HTAP 評測基準，比如：

Swarm64 HTAP benchmark

稍早的有 Swarm64 HTAP benchmark：

結合了 CH-benchmark 和 HTAPBench
采用了 CH-benchmark 中的混合執行規則
采用了 HTAPBench 中的動態時間視窗，

Github地址：https://github.com/swarm64/s64da-benchmark-toolkit

OLxPBench

最近在 ICDE 2022 上 Kang 提出了 OLxPBench，這種基準測驗有三個方法：Su-benchmark（TPC-C）、Fi-Benchmark（small-bank，面向小型銀行）、Tabenchamark（TATP，面向電信行業），

參考論文：Kang G, Wang L, Gao W, et al. OLxPBench: Real-time, Semantically Consistent, and Domain-specific are Essential in Benchmarking, Designing, and Implementing HTAP Systems[J]. arXiv preprint arXiv:2203.16095, 2022.

HATrick

來自威斯康辛大學 Miklai 在 SIGMOD 2022 新提出了一個叫 HATrick Benchmark 的混合基準，這個 HATrcik 融合了兩個新的性能指標：吞吐邊界（Throught frontier）和面向查詢的新鮮度（Query-Driven Freshness），

目前流行的HTAP基準包括 CH-Benchmark、HTAPBench 和 Swarm64，但在測驗中有著以下的限制：無法測量性能隔離；無法測量新鮮度；無法識別設計類別，HATtrick benchmark 作為一個開源專案，補充了吞吐量前沿，整合了新鮮度測量方法，可以有效評測 HTAP 系統，

吞吐量：該概念的引入是為了捕捉事務處理和分析處理的性能，通過在2D圖表中可視化吞吐量邊界，我們可以理解 HTAP 系統的整體性能行為，并識別出問題所在，
file
Throught frontier

如上圖，X 軸就是事務的吞吐，Y 軸就是分析的吞吐，這兩張圖怎么看的呢？簡單來說，就是第一幅圖中綠色曲線靠近紅色對角線，表示系統相對穩定；第二張圖中綠色曲線遠離紅色對角線，表示 AP 和 TP 兩者作業負載受干擾較大，

新鮮度：該指標的設計，是為了捕捉HTAP系統對實時分析的支持程度，松散地說，HTAP系統的新鮮度是對OLAP查詢可見的資料庫更新的延遲度量，
file
參考論文：Milkai E, Chronis Y, Gaffney K P, et al. How Good is My HTAP System?[C]//Proceedings of the 2022 International Conference on Management of Data. 2022: 1810-1824.

Micro-benchmarks

除了端到端（End-to-End）的HTAP基準，還有一些特別針對資料組織（data organization，為啥特別要針對這個？因為資料組織是 HTAP 的五大關鍵技術之一的微型基準測驗（Micro-benchmarks），比如：

ADAPT Benchmark [Arulraj et al, SIGMOD 2016]

file
插入資料后簡單的對一些列資料進行 select 操作，

HAP Benchmark [Athanassoulis et al, VLDB 2019]

file
這個就是在 select 基礎上增加了一些 insert、delete 和 update 操作，

好了，以上就是本期的分享內容，歡迎點贊收藏轉發，咱們下一期再見~

StoneDB 代碼已完全在 Github 開源，歡迎關注：

https://github.com/stoneatom/stonedb

StoneDB 官網：

_https://stonedb.io/

轉載請註明出處，本文鏈接：https://www.uj5u.com/shujuku/518998.html

標籤：其他

上一篇：如何給一個 HTAP 資料庫做基準測驗？StoneDB學術分享會第4期

下一篇：ElasticSearch之Windows中環境安裝