好湿?好紧?好多水好爽自慰,久久久噜久噜久久综合,成人做爰A片免费看黄冈,机机对机机30分钟无遮挡

主頁 > 知識庫 > 十分鐘看懂時序數(shù)據(jù)庫(III)

十分鐘看懂時序數(shù)據(jù)庫(III)

熱門標(biāo)簽:怎樣在高德地圖標(biāo)注中心 海外急救中心地圖標(biāo)注 正版企業(yè)400電話辦理 地圖標(biāo)注標(biāo)簽店 義烏防封版電銷卡 微云智能電話機器人 地圖標(biāo)注小紅旗圖片 蒂森電梯外呼系統(tǒng) 荊門智能溝通電話機器人源碼
 

物聯(lián)網(wǎng)鄰域近期如火如荼,互聯(lián)網(wǎng)和傳統(tǒng)公司爭相布局物聯(lián)網(wǎng)。作為物聯(lián)網(wǎng)鄰域數(shù)據(jù)存儲的首選時序數(shù)據(jù)庫也越來越多進入人們的視野,而早在 2016 年 7 月,百度云在其天工物聯(lián)網(wǎng)平臺上發(fā)布了國內(nèi)首個多租戶的分布式時序數(shù)據(jù)庫產(chǎn)品TSDB,成為支持其發(fā)展制造,交通,能源,智慧城市等產(chǎn)業(yè)領(lǐng)域的核心產(chǎn)品,同時也成為百度戰(zhàn)略發(fā)展產(chǎn)業(yè)物聯(lián)網(wǎng)的標(biāo)識表記標(biāo)幟性事件。

壓縮對于時序數(shù)據(jù)庫是至關(guān)重要的。因為時序數(shù)據(jù)庫面對的物聯(lián)網(wǎng)場景每天都會產(chǎn)生上億條數(shù)據(jù)。眾所周知,在大數(shù)據(jù)時代的今天數(shù)據(jù)的重要性是不言而喻的,數(shù)據(jù)就是公司的未來。但如果無法對這些時序數(shù)據(jù)進行很好的辦理和壓縮,那將給客戶帶來非常高的成本壓力。

如前文提到的,工業(yè)物聯(lián)網(wǎng)環(huán)境監(jiān)控標(biāo)的目的的客戶,一年產(chǎn)生1P的數(shù)據(jù),如果每臺辦事器10T的硬盤,那么總共需要 100 多臺。根據(jù)每臺辦事器 3 萬來算,一年就需要 300 萬的支出,這還不包孕維護人員的成本。

壓縮是個非常大的話題,本文希望能夠先從大的宏不雅觀角度給出一個輪廓,講述壓縮的素質(zhì),壓縮的可計算性問題。再從時序數(shù)據(jù)壓縮這一個垂直領(lǐng)域,給出無損壓縮和有損壓縮各一個例子進行說明,希望能夠拋磚引玉。

1. 壓縮的故事

先來講個有關(guān)壓縮的故事,外星人造訪地球,看中了大英百科全書,想要把這套書帶回去。但這套書太大,飛船放不下。于是外星人按照飛船的長度,在飛船上畫了一個點。這樣外星人心滿意足的返回了本身的星球,因為這個點就存儲了整個大英百科全書。

這個并不是很嚴謹?shù)墓适拢瑓s道出了壓縮的素質(zhì):用計算時間換取存儲空間。外星人在飛船上畫的點非常有技術(shù)含量,可以說是黑科技,代表一個位數(shù)非常長的不循環(huán)小數(shù)。而這串?dāng)?shù)字正代表了整個大英百科全書的內(nèi)容。

2. 壓縮的兩個問題

再來回答兩個宏不雅觀的問題,幫手我們認識在壓縮這件事上哪些是我們能做的,哪些是不能做的。

第一個問題:是否存在一個通用的壓縮算法(Universal Compression),也就是說某個壓縮算法能夠壓縮任意的數(shù)據(jù)。答案是否定的,并不存在這樣的通用壓縮算法。

用反證法可以做個快速的證明。假設(shè)存在通用的壓縮算法,也就是說有個壓縮算法,對于長度為n的字符串,總能壓縮到長度小于n的字符串。總共有 個長度為n的差別字符串;但卻只有 個長度小于n的字符串。那么肯定存在兩個長度為n的字符串A,B,經(jīng)過壓縮得到同一個字符串。這樣解壓縮算法沒有措施正確的解壓。所以假設(shè)錯誤,并不存在通用的壓縮算法。

第二個問題:是否能寫出一個函數(shù),輸入字符串,可以得到這個字符串最短體現(xiàn)的長度。答案也是否定的,也就是說我們無法證明某個算法是最好的算法。柯爾莫哥洛夫復(fù)雜性的不成計算性解釋的就是這個問題。用的也是反證法,有興趣的伴侶可以自行百度了解(注1)。

這兩個問題的答案,告訴我們?nèi)虑椋?、壓縮算法的選擇需要具體情況具體分析,不成壓縮的字符串總是存在。2、不要妄圖獲得最好的壓縮算法,它是不成計算的。因為總有你想不到的壓縮算法存在。舉個例子,[一百萬個 0 的字符串,以“foo”作為key,經(jīng)過AES加密算法的CBC模式得到的字符串]。這串字符串看起來完全是隨機的,不成壓縮的。但我卻用 43 個中文(中括號之間的內(nèi)容)就體現(xiàn)了出來。3、壓縮是件很難很有技術(shù)含量的事情,需要不停的挖掘,才能將他做到更好。

3. 時序數(shù)據(jù)壓縮

針對差別的數(shù)據(jù),會有差別的壓縮,大致壓縮的對象可以分為文檔、音頻、視頻等。如果直接采用文檔的壓縮算法用于時序數(shù)據(jù),效果并不抱負。下圖是一些常用的壓縮算法的benchmark,可以看到壓縮率那一欄最高也只能夠達到 3 擺布的壓縮率(壓縮率=原始數(shù)據(jù)大小/壓縮后的數(shù)據(jù)大小)。更多壓縮算法可以查看注2。

如果要得到更好的壓縮率,我們需要采取更加適合時序數(shù)據(jù)的壓縮算法。時序數(shù)據(jù)的壓縮可以分為無損壓縮和有損壓縮。

無損壓縮

無損壓縮是說被壓縮的數(shù)據(jù)和解壓后的數(shù)據(jù)完全一樣,不存在精度的損失。對數(shù)據(jù)的壓縮說到底是對數(shù)據(jù)規(guī)律性的總結(jié)。時序數(shù)據(jù)的規(guī)律可以總結(jié)為兩點:1、timestamp不變遞增、2、數(shù)值有規(guī)律性,變革不變。下面來舉個例子。

上圖是一組時序數(shù)據(jù),如果我們一行一行的看感覺壓縮有點困難,但如果我們一列一列的看,壓縮方案就呼之欲出了。

標(biāo)簽:四平 佳木斯 牡丹江 烏蘭察布 保險業(yè)務(wù) 惠州 烏魯木齊 保山

巨人網(wǎng)絡(luò)通訊聲明:本文標(biāo)題《十分鐘看懂時序數(shù)據(jù)庫(III)》,本文關(guān)鍵詞  十分鐘,看懂,時序,數(shù)據(jù)庫,;如發(fā)現(xiàn)本文內(nèi)容存在版權(quán)問題,煩請?zhí)峁┫嚓P(guān)信息告之我們,我們將及時溝通與處理。本站內(nèi)容系統(tǒng)采集于網(wǎng)絡(luò),涉及言論、版權(quán)與本站無關(guān)。
  • 相關(guān)文章
  • 下面列出與本文章《十分鐘看懂時序數(shù)據(jù)庫(III)》相關(guān)的同類信息!
  • 本頁收集關(guān)于十分鐘看懂時序數(shù)據(jù)庫(III)的相關(guān)信息資訊供網(wǎng)民參考!
  • 推薦文章
    主站蜘蛛池模板: 午夜无码人妻AⅤ大片大象传媒| 欧美另类69xxxxx末成年| 天天干天天爽天天操| 80岁老妇xxxxx高清| 口述黄色小说| 人人爽久久爽AV亚洲一牛影视| 欧美不卡二区| 我的yin荡高日记H小说| 在线资源观看| 美女午夜色视频在线观看| 《乳色吐息》樱花免费看| 乱理三级在线看| 亚洲熟女乱综合一区二区 | 久久精品国产亚洲麻豆小说| 91在线无码精品秘?人口竹菊| 久久久无码国产精品| 老外毛片免费视频播放| 一级毛片A穿牛仔裤| 男女爽爽无遮拦午夜视频| 国产精品亚洲欧美日韩一区在线| 国产欧美日产丝袜精品| Gay男同g片黄网站www| 日本人爽p大片免费看| 插入爽| 双性男仆胸大又放荡的h视频| 萍萍的性荡生活第二部| 精品欧美AV无码波多野吉衣蜜臀 | 国产精品成人免费一区二区 | 最新韩国理伦片在线观看 | 汤唯和梁朝伟158分钟无删减版色戒| 成人网18免费软件| 《熟妇荡欲》欧美电影| 国产成a人片在线观看视频下载| 亚洲性受XiaO77| 岳好紧好紧我要进去了电影| 无遮挡边摸边吃奶边做视频| 少妇厨房与子伦厨房的互动方式| 男人的天堂2017Aⅴ| 久久久久久夜精品精品免费啦| a级高清毛片| 朋友的妈妈在线播放|