mysql臟頁
由于WAL機制,InnoDB在更新語句的時候,制作了寫日志這一個磁盤操作,就是redo log,在內存寫完redo log后,就返回給客戶端, 即更新成功。
把內存里的數據寫入磁盤的過程,術語就是flush,在flush之前,實際數據和數據庫中的數據是不一致的,因為在redo log基礎上更新了還未寫入,數據庫是老的,當內存數據頁跟磁盤數據頁內容不一致的時候,稱這個內存頁為臟頁,內存寫入后就一致了,稱為干凈頁,
如果mysql偶爾運行速度很慢,很可能是在刷臟頁。引發數據庫flush的過程
- redo log滿了,系統停止所有更新操作,將checkpoint向前推進,騰出空間繼續寫。
- 系統內存不足,需要新的內存頁不夠用,就會淘汰一些數據頁,留給別的數據頁使用,如果淘汰的是臟頁,就會先寫到磁盤。
- mysql空閑的時候。
- 正常關閉mysql的時候
- 在第一種情況下,redo log滿了,這種情況是innodb要避免的,因為整個系統都不能再更新了,這是不能接受的
- 第二種情況,內存滿了,要先寫到磁盤,innodb用緩沖池管理內存,有三種狀態
- 還沒有用的內存頁
- 用了并且是干凈頁
- 用了并且是臟頁(淘汰的時候需要寫入到磁盤)
所以我們有時使用數據庫會發現數據庫性能突然下降,可能就是在處理臟頁。
刷臟頁控制策略
- Innodb_io_capacity參數,這個參數會告訴innodb你的磁盤io能力。(有公式計算)
- innodb刷盤主要兩個因素:臟頁比例和redo log的寫盤速度
- innodb_max_derty_pages_pct是臟頁比例上限,默認是75%,調整好Innodb_io_capacity參數值,使臟頁比例不要超過75%收縮表空間
場景例子:數據庫占用空間太大,把最大的表刪掉了一半數據,表的大小還是沒有變化。
數據刪除流程

加入要刪掉R4,InnoDB引擎只會把R4這個記錄標記為刪除,如果之后再摻入一個ID在300-600之間的記錄時,會復用這個位置,但是磁盤文件的大小并不會縮小。
如果刪掉了一個數據頁上的所有記錄,這個數據頁就可以被復用。
注意:數據頁的復用跟記錄的復用是不同的。
- 比如R4這條記錄被刪除,如果插入一個ID是400的行,直接復用這個空間,但是如果插入ID是800的行,就不能復用這個位置了。
- 但是整個數據頁Page A上的所有記錄刪除之后,pageA標記為可復用,如果插入一條ID=50的記錄需要用新的數據頁的時候,PageA是可以背負用的。
- 如果我們用delete命令把整個表數據刪除,結果是所有的數據頁都會標記為可復用,但是在磁盤上,文件不會變小。
插入數據流程
如果數據按照索引順序插入的,索引是緊湊的,但是如果是隨機插入的,就會造成索引的數據頁分頁。

如果pageA已經滿了,在插入一行數據會怎樣?由于A滿了,在插入一個id是550的數據時,就會申請一個新的頁面pageB來保存數據,分裂完成后pageA的末尾就留下了空洞。
更新索引上的值也是刪除一個舊的值,再插入一個新值,也會造成空洞。
收縮空間
新建一個與表A相同結構的表B,按照主鍵ID遞增的順序,把數據一行一行的從A里讀出來再插入到表B中,表B中無空洞,數據頁的利用率也更高,如果我們把表B作為臨時表,數據從表A導入到B中的操作完成后,用B替換A,從效果上也起到了收縮A的作用。

在整個DDL過程中,表A不能有更新,所以這個DDL不是online的,在5.6之后的版本中,流程做了更改:
建立一個臨時文件,掃描A中的所有數據頁,
用數據頁中A的記錄生成B+樹,存儲在臨時文件中
將所有對A的操作記錄在一個日志文件中
臨時文件生成后,將日志文件的操作應用到臨時文件,得到一個邏輯數據上與表A相同的數據文件
用臨時文件替換表A的數據文件
圖示

可以看到,與圖3過程的不同之處在于,由于日志文件記錄和重放操作這個功能的存在,這個方案在重建表的過程中,允許對表A做增刪改操作。
使用alter table A engine=InnoDB命令來重建表。在MySQL 5.5版本之前,這個命令的執行流程跟我們前面描述的差不多,區別只是這個臨時表B不需要你自己創建,MySQL會自動完成轉存數據、交換表名、刪除舊表的操作。
以上就是本文的全部內容,希望對大家的學習有所幫助,也希望大家多多支持腳本之家。
您可能感興趣的文章:- MySQL的Flush-List和臟頁的落盤機制
- mysql臟頁是什么