最近有個上位機獲取下位機上報數(shù)據(jù)的項目,由于上報頻率比較頻繁且數(shù)據(jù)量大,導致數(shù)據(jù)增長過快,磁盤占用多。
為了節(jié)約成本,定期進行數(shù)據(jù)備份,并通過delete
刪除表記錄。
明明已經(jīng)執(zhí)行了delete
,可表文件的大小卻沒減小,令人費解
項目中使用mysql
作為數(shù)據(jù)庫,對于表來說,一般為表結構和表數(shù)據(jù)。表結構占用空間都是比較小的,一般都是表數(shù)據(jù)占用的空間。
當我們使用 delete
刪除數(shù)據(jù)時,確實刪除了表中的數(shù)據(jù)記錄,但查看表文件大小卻沒什么變化。
1、mysql數(shù)據(jù)結構
凡是使用過mysql
,對b+樹
肯定是有所耳聞的,mysql innodb
中采用了 b+
樹作為存儲數(shù)據(jù)的結構,也就是常說的索引組織表,并且數(shù)據(jù)時按照頁來存儲的。因此在刪除數(shù)據(jù)時,會有兩種情況:
- 刪除數(shù)據(jù)頁中的某些記錄
- 刪除整個數(shù)據(jù)頁的內容
2、表文件大小未更改和mysql設計有關
比如想要刪除 r4 這條記錄:
innodb
直接將 r4
這條記錄標記為刪除,稱為可復用的位置。如果之后要插入 id
在 300
到 700
間的記錄時,就會復用該位置。
由此可見,磁盤文件的大小并不會減少。
通用刪除整頁數(shù)據(jù)也將記錄標記刪除,數(shù)據(jù)就復用用該位置,與刪除默寫記錄不同的是,刪除整頁記錄,當后來插入的數(shù)據(jù)不在原來的范圍時,都可以復用位置,而如果只是刪除默寫記錄,是需要插入數(shù)據(jù)符合刪除記錄位置的時候才能復用。
因此,無論是數(shù)據(jù)行的刪除還是數(shù)據(jù)頁的刪除,都是將其標記為刪除的狀態(tài),用于復用,所以文件并不會減小。
3、那怎么才能讓表大小變小
delete
只是將數(shù)據(jù)標識位刪除,并沒有整理數(shù)據(jù)文件,當插入新數(shù)據(jù)后,會再次使用這些被置為刪除標識的記錄空間,可以使用optimize table
來回收未使用的空間,并整理數(shù)據(jù)文件的碎片。
1
|
optimize table 表名; |
注意:optimize table
只對myisam
, bdb
和innodb
表起作用。
另外,也可以執(zhí)行通過alter table
重建表
1
|
alter table 表名 engine=innodb |
有人會問optimize table
和alter table
有什么區(qū)別?
alter table t engine = innodb
(也就是recreate),而 optimize table t
等于 recreate+analyze
4、online ddl
最后,再說一下online ddl
,dba
的日常工作肯定有一項是ddl變更,ddl變更會鎖表,這個可以說是dba
心中永遠的痛,特別是執(zhí)行ddl
變更,導致庫上大量線程處于“waiting for meta data lock
”狀態(tài)的時候。因此在 5.6 版本后引入了 online ddl
。
online ddl
推出以前,執(zhí)行ddl主要有兩種方式copy
方式和inplace
方式,inplace
方式又稱為(fast index creation
)。相對于copy
方式,inplace
方式不拷貝數(shù)據(jù),因此較快。但是這種方式僅支持添加、刪除索引兩種方式,而且與copy方式一樣需要全程鎖表,實用性不是很強。online
方式與前兩種方式相比,不僅可以讀,還可以支持寫操作。
執(zhí)行online ddl
語句的時候,使用algorithm
和lock
關鍵字,這兩個關鍵字在我們的ddl
語句的最后面,用逗號隔開即可。示例如下:
1
|
alter table tbl_name add column col_name col_type, algorithm=inplace, lock=none; |
algorithm選項
-
inplace:替換:直接在原表上面執(zhí)行
ddl
的操作。 -
copy:復制:使用一種臨時表的方式,克隆出一個臨時表,在臨時表上執(zhí)行
ddl
,然后再把數(shù)據(jù)導入到臨時表中,在重命名等。這期間需要多出一倍的磁盤空間來支撐這樣的 操作。執(zhí)行期間,表不允許dml
的操作。 -
default:默認方式,有
mysql
自己選擇,優(yōu)先使用inplace
的方式。 - lock選項
-
share:共享鎖,執(zhí)行
ddl
的表可以讀,但是不可以寫。 -
none:沒有任何限制,執(zhí)行
ddl
的表可讀可寫。 -
exclusive:排它鎖,執(zhí)行
ddl
的表不可以讀,也不可以寫。 -
default:默認值,也就是在
ddl
語句中不指定lock
子句的時候使用的默認值。如果指定lock
的值為
default
,那就是交給mysql
子句去覺得鎖還是不鎖表。不建議使用,如果你確定你的ddl
語句不會鎖表,你可以不指定lock
或者指定它的值為default
,否則建議指定它的鎖類型。
執(zhí)行ddl
操作時,algorithm
選項可以不指定,這時候mysql
按照instant
、inplace
、copy
的順序自動選擇合適的模式。也可以指定algorithm=default
,也是同樣的效果。如果指定了algorithm
選項,但不支持的話,會直接報錯。
optimize table
和 alter table
表名 engine=innodb
都支持oline ddl
,但依舊建議在業(yè)務訪問量低的時候使用
5、總結
delete
刪除數(shù)據(jù)時,其實對應的數(shù)據(jù)行并不是真正的刪除,僅僅是將其標記成可復用的狀態(tài),所以表空間不會變小。
可以重建表的方式,快速將delete
數(shù)據(jù)后的表變小(optimize table
或alter table
),在 5.6 版本后,創(chuàng)建表已經(jīng)支持 online
的操作,但最好是在業(yè)務低峰時使用
到此這篇關于為什么mysql 刪除表數(shù)據(jù) 磁盤空間還一直被占用的文章就介紹到這了,更多相關mysql
刪除表數(shù)據(jù) 內容請搜索服務器之家以前的文章或繼續(xù)瀏覽下面的相關文章希望大家以后多多支持服務器之家!
原文鏈接:https://www.cnblogs.com/javastack/p/15406930.html