好湿?好紧?好多水好爽自慰,久久久噜久噜久久综合,成人做爰A片免费看黄冈,机机对机机30分钟无遮挡

主頁 > 知識庫 > MySQL學習記錄之KEY分區引發的血案

MySQL學習記錄之KEY分區引發的血案

熱門標簽:申請外呼電話線路 南通自動外呼系統軟件 廣東人工電話機器人 湖南人工外呼系統多少錢 信陽穩定外呼系統運營商 百度地圖圖標標注中心 石家莊電商外呼系統 日照旅游地圖標注 芒果電話機器人自動化

需求背景

業務表tb_image部分數據如下所示,其中id唯一,image_no不唯一。image_no表示每個文件的編號,每個文件在業務系統中會生成若干個文件,每個文件的唯一ID就是字段id:

業務表tb_image的一些情況如下:

  • 根據image_no查詢和根據id查詢;
  • 存量數據2kw;
  • 日增長4w左右;
  • 日查詢量20w左右;
  • 非ToC系統,所以并發的天花板可見;

方案選擇

根據上面對業務的分析,分庫分表完全沒有必要。單庫分表的話,由于要根據image_no和id查詢,所以,一種方案是冗余分表(即一份數據以image_no為分片鍵保存,另一份數據以id為分片鍵保存);另一種方案是只以image_no為分片鍵,而基于id的查詢需求,業務層進行結果歸并或者引入第三方中間件。

考慮到單庫分表比較復雜,所以決定使用分區特性,而且容量評估分區表方案128個分區(每個分區數據量kw級別)完全能保證業務至少穩定運行15年(圖中橙色部分是比較貼合自身業務實際增長情況):

另外,由于RANGE, LIST, HASH分區都不支持VARCHAR列,所以決定采用KEY分區,官方介紹它的原理是以MySQL內置hash算法然后對分區數取模。

性能測試

選定分片鍵為image_no,并且決定分區數為128后,就要灌入數據進行可行性和性能測試了。分區數選擇128的原因是:11億/1kw=110≈128,另外程序員情節,喜歡用2的N次方,你懂的。然而, 這個分區數128就是一切噩夢的開始 。

我嘗試先插入10w數據到128個分區中,插入后,讓我驚訝的現象出現了: 所有奇數編號分區(p1, p3, p5, … , p2n-1)中居然沒有一條數據 ,同時,任何一個偶數編號分區卻有很多的數據,而且還不是很均勻。如下圖所示:

說明:奇數編號分區的ibd文件大小都是112k,這是創建分區表時初始化大小,實際并沒有任何數據。我們可以通過SQL: select partition_name, partition_expression, table_rows from information_schema.partitions where table_schema = schema() and table_name='image_subpart' ;驗證,其部分結果如下圖所示:

難道10w條數據還不夠說明問題?平均下來每個分區可是有近800條數據!好吧,來點猛的:我再插入990w條數據,總計1kw數據。結果還是一樣,奇數編號分區沒有數據,偶數編號都有分區。

問題思考

我們再來回想一下KEY分區的原理: 通過MySQL內置hash算法對分片鍵計算hash值后再對分區數取模 。這個原理也可以從MySQL官網找到,請戳鏈接:22.2.5 KEY Partitioning: https://dev.mysql.com/doc/refman/5.7/en/partitioning-key.html,截取原文如下:

Partitioning by key is similar to partitioning by hash, except that where hash partitioning employs a user-defined expression, the hashing function for key partitioning is supplied by the MySQL server. NDB Cluster uses MD5() for this purpose; for tables using other storage engines, the server employs its own internal hashing function which is based on the same algorithm as PASSWORD().

**這個世界上不會有這么渣渣的hash算法吧?**隨便寫個什么算法也不至于這么不均勻吧?這時候我懷疑是否有一些什么配置引起的。但是show variables中并沒有任何與partition相關的變量。

這個時候,一萬匹馬奔騰而過。會不會是文檔和源碼不同步導致的?好吧,看MySQL的源碼,畢竟, 源碼才是最接近真相的地方 。KEY分區相關源碼在文件sql_partition.cc中,筆者截取部分關鍵源碼,如下所示,初略觀察,并沒有什么不妥,先計算分區字段的hash值然后對分區數取模:

/**
 Calculate part_id for (SUB)PARTITION BY KEY
 @param file        Handler to storage engine
 @param field_array     Array of fields for PARTTION KEY
 @param num_parts      Number of KEY partitions
 @param func_value[out]   Returns calculated hash value
 @return Calculated partition id
*/
inline
static uint32 get_part_id_key(handler *file,
               Field **field_array,
               uint num_parts,
               longlong *func_value)
{
 DBUG_ENTER("get_part_id_key");
 // 計算分區字段的hash值
 *func_value= file->calculate_key_hash_value(field_array);
 // 對分區數取模
 DBUG_RETURN((uint32) (*func_value % num_parts));
}

懷著絕望的心情,請出搜索引擎搜索:“KEY分區數據不均勻”,搜索結果中的CSDN論壇( https://bbs.csdn.net/topics/390857704)里有個民間高手華夏小卒回答如下:

一個同事根據password函數,分析并測出,key分區,只能指定分區數目為質數,才能保證每個分區都有數據。我測了下,從11個分區,到17個分區。 只有11,13,17 ,這3個分區的數據是基本平均分布的。

這個時候,又是一萬匹馬奔騰而過。不過 WHAT THE F**K 的同時,心里也是有點小激動,因為可能找到解決辦法了(雖然還不知道MySQL內置hash算法為毛會這樣),最后筆者再次對KEY分區測試并得出總結如下:

  1. 如果設置40,64,128等偶數個分區數(PARTITIONS 64),會導致編號為奇數的分區(p1, p3, p5, p7, … p2n-1)完全插不進數據;
  2. 如果設置63,121(PARTITIONS 63)這種奇數但非質數個分區數,所有分區都會有數據,但是不均勻;
  3. 如果設置137,31這種質數個分區數(PARTITIONS 137),所有分區都會有數據,并且非常均勻;

如下圖所示,是筆者把分區數調整為127并插入100w數據后的情況,通過SQL證明每個分區的數據量幾乎一樣:

總結回顧

MySQL的KEY分區這么大的使用陷阱,居然在官方上沒有任何說明,這讓筆者感到非常震驚。此外還有MySQL bug:Bug #72428 Partition by KEY() results in uneven data distribution

正在看此文并有很強烈興趣的同學,可以嘗試更深入這個問題。筆者接下來也會找個時間,根據MySQL源碼深入挖掘其hash算法的實現為什么對分區數如此敏感。

到此這篇關于MySQL學習記錄之KEY分區引發的血案的文章就介紹到這了,更多相關MySQL KEY分區血案內容請搜索腳本之家以前的文章或繼續瀏覽下面的相關文章希望大家以后多多支持腳本之家!

您可能感興趣的文章:
  • MySQL分庫分表與分區的入門指南
  • python 實現mysql自動增刪分區的方法
  • MySql分表、分庫、分片和分區知識深入詳解
  • Mysql臨時表及分區表區別詳解
  • 詳解MySQL分區表
  • MySQL最佳實踐之分區表基本類型
  • MySQL分區表的最佳實踐指南
  • MySql分表、分庫、分片和分區知識點介紹
  • MySQL分表和分區的具體實現方法
  • MySQL分區表的正確使用方法
  • MySQL高級特性——數據表分區的概念及機制詳解

標簽:合肥 阿里 呼和浩特 公主嶺 沈陽 天津 惠州 牡丹江

巨人網絡通訊聲明:本文標題《MySQL學習記錄之KEY分區引發的血案》,本文關鍵詞  MySQL,學習,記錄,之,KEY,分區,;如發現本文內容存在版權問題,煩請提供相關信息告之我們,我們將及時溝通與處理。本站內容系統采集于網絡,涉及言論、版權與本站無關。
  • 相關文章
  • 下面列出與本文章《MySQL學習記錄之KEY分區引發的血案》相關的同類信息!
  • 本頁收集關于MySQL學習記錄之KEY分區引發的血案的相關信息資訊供網民參考!
  • 推薦文章
    主站蜘蛛池模板: 综合网色| ova催眠性指导无删减动漫| 中国一级特黄特色**毛片| 上英语课我用j插英语课代表| 园产伦精一区二区三区| 在线观看国产精品色花堂| 欧美男男军同性videos| 久久久久久精品亚洲大师码| 污女的qq号| 粗大的内捧猛烈进出在线视频| 青青操免费在线视频| 亚洲AV无码网站推荐| 性网站视频| 年轻人免费观看视频| 国内精品久久久久久中文字幕| 17c一起草永久网名| 中国老太做爰全过| 在线观看操| 爆操丝袜| 翔田千里ひとみ黑人无码| MEYD-493人妻深田咏美| 在线观看网站资源免费播放| 男男无遮挡全彩黄漫漫画| 亚洲视频国产| 近親国产偷子亂伦中文字墓| 小宝探花在线观看免费直播电视剧| 女人下面突然一紧一紧的| 别停用力我要深一点| 女仆影院| 国产成人无码精品久久久露脸| 日本做i爱视频30分钟免费| 强制中出し~大桥未久3| 午夜在线成人| 国产动漫在线观看网站| 国产精品稀缺盗摄盗拍| www.免费视频.com| 亚洲精品国产电影午夜在线观看| 日韩视频区| 狂揉吃奶胸60分钟视频| Juneliu刘玥FreeHDVideo| 在线观看成年人网站|