一、簡介
表分區是解決一些因單表過大引用的性能問題的方式,比如某張表過大就會造成查詢變慢,可能分區是一種解決方案。一般建議當單表大小超過內存就可以考慮表分區了。postgresql的表分區有三種方式:
- range:范圍分區;
- list:列表分區;
- hash:哈希分區。
本文通過示例講解如何進行這三種方式的分區。
二、三種方式
為方便,我們通過docker的方式啟動一個postgresql。我們要選擇較高的版本,否則不支持hash分區,命令如下:
docker run -itd
--name pkslow-postgres
-e postgres_db=pkslow
-e postgres_user=pkslow
-e postgres_password=pkslow
-p 5432:5432
postgres:13
2.1、range范圍分區
先創建一張表帶有年齡,然后我們根據年齡分段來進行分區,創建表語句如下:
1
2
3
4
|
create table pkslow_person_r ( age int not null , city varchar not null ) partition by range (age); |
這個語句已經指定了按age字段來分區了,接著創建分區表:
1
2
3
4
|
create table pkslow_person_r1 partition of pkslow_person_r for values from (minvalue) to (10); create table pkslow_person_r2 partition of pkslow_person_r for values from (11) to (20); create table pkslow_person_r3 partition of pkslow_person_r for values from (21) to (30); create table pkslow_person_r4 partition of pkslow_person_r for values from (31) to (maxvalue); |
這里創建了四張分區表,分別對應年齡是0到10歲、11到20歲、21到30歲、30歲以上。
接著我們插入一些數據:
1
2
3
4
5
6
|
insert into pkslow_person_r(age, city) values (1, 'gz' ); insert into pkslow_person_r(age, city) values (2, 'sz' ); insert into pkslow_person_r(age, city) values (21, 'sz' ); insert into pkslow_person_r(age, city) values (13, 'bj' ); insert into pkslow_person_r(age, city) values (43, 'sh' ); insert into pkslow_person_r(age, city) values (28, 'hk' ); |
可以看到這里的表名還是pkslow_person_r
,而不是具體的分區表,說明對于客戶端是無感知的。
我們查詢也一樣的:
但實際上是有分區表存在的:
而且分區表與主表的字段是一致的。
查詢分區表,就只能查到那個特定分區的數據了:
2.2、list列表分區
類似的,列表分區是按特定的值來分區,比較某個城市的數據放在一個分區里。這里不再給出每一步的講解,代碼如下:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
|
-- 創建主表 create table pkslow_person_l ( age int not null , city varchar not null ) partition by list (city); -- 創建分區表 create table pkslow_person_l1 partition of pkslow_person_l for values in ( 'gz' ); create table pkslow_person_l2 partition of pkslow_person_l for values in ( 'bj' ); create table pkslow_person_l3 partition of pkslow_person_l default ; -- 插入測試數據 insert into pkslow_person_l(age, city) values (1, 'gz' ); insert into pkslow_person_l(age, city) values (2, 'sz' ); insert into pkslow_person_l(age, city) values (21, 'sz' ); insert into pkslow_person_l(age, city) values (13, 'bj' ); insert into pkslow_person_l(age, city) values (43, 'sh' ); insert into pkslow_person_l(age, city) values (28, 'hk' ); insert into pkslow_person_l(age, city) values (28, 'gz' ); |
當我們查詢第一個分區的時候,只有廣州的數據:
2.3、hash哈希分區
哈希分區是指按字段取哈希值后再分區。具體的語句如下:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
|
-- 創建主表 create table pkslow_person_h ( age int not null , city varchar not null ) partition by hash (city); -- 創建分區表 create table pkslow_person_h1 partition of pkslow_person_h for values with (modulus 4, remainder 0); create table pkslow_person_h2 partition of pkslow_person_h for values with (modulus 4, remainder 1); create table pkslow_person_h3 partition of pkslow_person_h for values with (modulus 4, remainder 2); create table pkslow_person_h4 partition of pkslow_person_h for values with (modulus 4, remainder 3); -- 插入測試數據 insert into pkslow_person_h(age, city) values (1, 'gz' ); insert into pkslow_person_h(age, city) values (2, 'sz' ); insert into pkslow_person_h(age, city) values (21, 'sz' ); insert into pkslow_person_h(age, city) values (13, 'bj' ); insert into pkslow_person_h(age, city) values (43, 'sh' ); insert into pkslow_person_h(age, city) values (28, 'hk' ); |
可以看到創建分區表的時候,我們用了取模的方式,所以如果要創建n個分區表,就要取n取模。
隨便查詢一張分區表如下:
可以看到同是sz的哈希值是一樣的,肯定會分在同一個分區,而bj的哈希值取模后也屬于同一個分區。
三、總結
本文講解了postgresql分區的三種方式。
代碼請查看:https://github.com/larrydpk/pkslow-samples
以上就是淺談postgresql表分區的三種方式的詳細內容,更多關于postgresql表分區的資料請關注服務器之家其它相關文章!
原文鏈接:https://www.cnblogs.com/larrydpk/p/14944497.html