我最新最全的文章都在 南瓜慢說 www.pkslow.com ,歡迎大家來喝茶!
1 簡介
表磁區是解決一些因單表過大參考的性能問題的方式,比如某張表過大就會造成查詢變慢,可能磁區是一種解決方案,一般建議當單表大小超過記憶體就可以考慮表磁區了,PostgreSQL的表磁區有三種方式:
- Range:范圍磁區;
- List:串列磁區;
- Hash:哈希磁區,
本文通過示例講解如何進行這三種方式的磁區,
2 例講三種方式
為方便,我們通過Docker的方式啟動一個PostgreSQL,可參考:《Docker啟動PostgreSQL并推薦幾款連接工具》,我們要選擇較高的版本,否則不支持Hash磁區,命令如下:
docker run -itd \
--name pkslow-postgres \
-e POSTGRES_DB=pkslow \
-e POSTGRES_USER=pkslow \
-e POSTGRES_PASSWORD=pkslow \
-p 5432:5432 \
postgres:13
2.1 Range范圍磁區
先創建一張表帶有年齡,然后我們根據年齡分段來進行磁區,創建表陳述句如下:
CREATE TABLE pkslow_person_r (
age int not null,
city varchar not null
) PARTITION BY RANGE (age);
這個陳述句已經指定了按age欄位來磁區了,接著創建磁區表:
create table pkslow_person_r1 partition of pkslow_person_r for values from (MINVALUE) to (10);
create table pkslow_person_r2 partition of pkslow_person_r for values from (11) to (20);
create table pkslow_person_r3 partition of pkslow_person_r for values from (21) to (30);
create table pkslow_person_r4 partition of pkslow_person_r for values from (31) to (MAXVALUE);
這里創建了四張磁區表,分別對應年齡是0到10歲、11到20歲、21到30歲、30歲以上,
接著我們插入一些資料:
insert into pkslow_person_r(age, city) VALUES (1, 'GZ');
insert into pkslow_person_r(age, city) VALUES (2, 'SZ');
insert into pkslow_person_r(age, city) VALUES (21, 'SZ');
insert into pkslow_person_r(age, city) VALUES (13, 'BJ');
insert into pkslow_person_r(age, city) VALUES (43, 'SH');
insert into pkslow_person_r(age, city) VALUES (28, 'HK');
可以看到這里的表名還是pkslow_person_r,而不是具體的磁區表,說明對于客戶端是無感知的,
我們查詢也一樣的:

但實際上是有磁區表存在的:

而且磁區表與主表的欄位是一致的,
查詢磁區表,就只能查到那個特定磁區的資料了:

2.2 List串列磁區
類似的,串列磁區是按特定的值來磁區,比較某個城市的資料放在一個磁區里,這里不再給出每一步的講解,代碼如下:
-- 創建主表
create table pkslow_person_l (
age int not null,
city varchar not null
) partition by list (city);
-- 創建磁區表
CREATE TABLE pkslow_person_l1 PARTITION OF pkslow_person_l FOR VALUES IN ('GZ');
CREATE TABLE pkslow_person_l2 PARTITION OF pkslow_person_l FOR VALUES IN ('BJ');
CREATE TABLE pkslow_person_l3 PARTITION OF pkslow_person_l DEFAULT;
-- 插入測驗資料
insert into pkslow_person_l(age, city) VALUES (1, 'GZ');
insert into pkslow_person_l(age, city) VALUES (2, 'SZ');
insert into pkslow_person_l(age, city) VALUES (21, 'SZ');
insert into pkslow_person_l(age, city) VALUES (13, 'BJ');
insert into pkslow_person_l(age, city) VALUES (43, 'SH');
insert into pkslow_person_l(age, city) VALUES (28, 'HK');
insert into pkslow_person_l(age, city) VALUES (28, 'GZ');
當我們查詢第一個磁區的時候,只有廣州的資料:

2.3 Hash哈希磁區
哈希磁區是指按欄位取哈希值后再磁區,具體的陳述句如下:
-- 創建主表
create table pkslow_person_h (
age int not null,
city varchar not null
) partition by hash (city);
-- 創建磁區表
create table pkslow_person_h1 partition of pkslow_person_h for values with (modulus 4, remainder 0);
create table pkslow_person_h2 partition of pkslow_person_h for values with (modulus 4, remainder 1);
create table pkslow_person_h3 partition of pkslow_person_h for values with (modulus 4, remainder 2);
create table pkslow_person_h4 partition of pkslow_person_h for values with (modulus 4, remainder 3);
-- 插入測驗資料
insert into pkslow_person_h(age, city) VALUES (1, 'GZ');
insert into pkslow_person_h(age, city) VALUES (2, 'SZ');
insert into pkslow_person_h(age, city) VALUES (21, 'SZ');
insert into pkslow_person_h(age, city) VALUES (13, 'BJ');
insert into pkslow_person_h(age, city) VALUES (43, 'SH');
insert into pkslow_person_h(age, city) VALUES (28, 'HK');
可以看到創建磁區表的時候,我們用了取模的方式,所以如果要創建N個磁區表,就要取N取模,
隨便查詢一張磁區表如下:

可以看到同是SZ的哈希值是一樣的,肯定會分在同一個磁區,而BJ的哈希值取模后也屬于同一個磁區,
3 總結
本文講解了PostgreSQL磁區的三種方式,
代碼請查看:https://github.com/LarryDpk/pkslow-samples
歡迎關注微信公眾號<南瓜慢說>,將持續為你更新...

多讀書,多分享;多寫作,多整理,
轉載請註明出處,本文鏈接:https://www.uj5u.com/houduan/288603.html
標籤:Java
