狼性军长要够了没免费阅读小说 ,漫画生肉,双性文高h

主頁 > 知識庫 > Hadoop 分布式存儲系統 HDFS的實例詳解

Hadoop 分布式存儲系統 HDFS的實例詳解

一、HDFS的優缺點

1.HDFS優點：

　　a.高容錯性

　　　　.數據保存多個副本

　　　　.數據丟的失后自動恢復

　　b.適合批處理

　　　　.移動計算而非移動數據

　　　　.數據位置暴露給計算框架

　　c.適合大數據處理

　　　　.GB、TB、甚至PB級的數據處理

　　　　.百萬規模以上的文件數據

　　　　.10000+的節點

　　d.可構建在廉價的機器上

　　　　.通過多副本存儲，提高可靠性

　　　　.提供了容錯和恢復機制

2.HDFS缺點

　　a.低延遲數據訪問處理較弱

　　　　.毫秒級別的訪問響應較慢

　　　　.低延遲和高吞吐率的請求處理較弱

　　b.大量小文件存取處理較弱

　　　　.會占用大量NameNode的內存

　　　　.尋道時間超過讀取時間

　　c.并發寫入、文件隨機修改

　　　　.一個文件僅有一個寫者

　　　　.僅支持Append寫入

二、HDFS的架構

　　如上圖所示，HDFS也是按照Master和Slave的結構。分NameNode、SecondaryNameNode、DataNode這幾個角色。

　　NameNode：是Master節點，是大領導。管理數據塊映射；處理客戶端的讀寫請求；配置副本策略；管理HDFS的名稱空間；

　　SecondaryNameNode：是一個小弟，分擔大哥namenode的一部分工作量；是NameNode的冷備份；合并fsimage和fsedits然后再發給namenode。

　　DataNode：Slave節點，奴隸，干活的。負責存儲client發來的數據塊block；執行數據塊的讀寫操作。

　　熱備份：b是a的熱備份，如果a壞掉。那么b馬上運行代替a的工作。

　　冷備份：b是a的冷備份，如果a壞掉。那么b不能馬上代替a工作。但是b上存儲a的一些信息，減少a壞掉之后的損失。

　　fsimage:元數據鏡像文件（文件系統的目錄樹。）

　　edits：元數據的操作日志（針對文件系統做的修改操作記錄）

　　namenode內存中存儲的是=fsimage+edits。

　　SecondaryNameNode負責定時默認1小時，從namenode上，獲取fsimage和edits來進行合并，然后再發送給namenode。減少namenode的工作量。

三、HDFS數據存儲單元（block）

1.文件被切割成固大小的數據塊

　　a.默認數據塊大小是64MB，數據塊大小可配置

　　b.若數據塊大小不到64MB，則單獨成一個數據塊

2.一個文件存儲方式

　　a.按大小切割成若干個block，存儲在不同的節點上

　　b.每個block默認存三個副本

　　block大小和副本數由Client上傳文件的時候設置，文件上傳成功以后，副本數可以變更，但是Block 大小不可變。

四、HDFS設計思想

　　一個50G的文件上傳到HDFS上，首先該文件被切割成了若干個64MB的block，block1在node1,node2,node3上存儲了3（默認3個，可以設置）個副本，block2在node2,node3,node4上存儲了3個副本block3....直到所有的block都存儲3個副本；

五、NameNode（NN）、 SencondryNameNode （SNN）、DataNode（DN）

1.NameNode (NN) 的工作

　　a.接受客戶端的讀寫服務

　　b.保存metadata的信息，包括：文件的owership和permissions、文件包含哪些block、block保存在哪些DataNode節點上（在啟動時由DataNode上報）

　　c.NameNode 的metadata信息會在啟動后加載到內存中

　　　　.metadata信息在磁盤上存儲的文件為“fsimage”

　　　　.Block的位置信息不保存在fsimage中（由DataNode上報）

　　　　.edits中保存對metadata的操作日志

2.SecondryNameNode(SNN) 的工作

　　a.它不是NN的備份（但可以做NN的部分備份的工作），它的主要工作是幫助NN合并edits log 減少NN的啟動時間

　　b.SNN合并時機

　　　　.根據配置文件設置的時間間隔fs.checkpoint.period 默認3600秒

　　　　.根據配置文件設置的edits log的大小 fs.checpoint.size 默認的edits log 大小為64MB

　　c.SNN合并流程

　　　　1>NN 創建一個新的edits log 來接替老的 edits 的工作

　　　　2>NN 將fsimage 和舊的edits 拷備到 SNN上

　　　　3>SNN上進行合并操作，產生一個新的fsimage

　　　　4>將新的fsimage 復制一份到NN上

　　　　5>使用新的fsimage 和新的edits log

3.DataNode （DN）

　　a.存儲數塊（block）

　　b.啟動DN線程時，DN會自動向NN匯報Block的信息

　　c.NN向DN發送心跳檢測，與其DN保持聯系（3秒一次）如果NN 連續10分鐘沒有收到DN的心跳，則認為該DN已經lost,并從其他DN中備份一份該DN上的所有block

　　d.block的放置策略

　　　　.第一個副本，放置在上傳文件的DN上，如果是集群外提交，則隨便選擇一臺磁盤、內存、CPU不太忙的節點存儲

　　　　.第二個副本，放置在與第一個副本不同機架上的節點上

　　　　.第三個副本，放置在與第二個副本相同機架上的相鄰的節點上

　　　　.更多副本隨機放置

六、HDFS的寫流程和讀流程

1.HDFS寫流程

　　　　例：

　　有一個文件FileA，100M大小。Client將FileA寫入到HDFS上。

　　HDFS按默認配置。

　　HDFS分布在三個機架上Rack1，Rack2，Rack3。

　　a.Client將FileA按64M分塊。分成兩塊，block1和Block2;

　　b.Client向nameNode發送寫數據請求，如圖藍色虛線①------>。

　　c.NameNode節點，記錄block信息。并返回可用的DataNode，如粉色虛線②--------->。

　　Block1: host2,host1,host3

　　Block2: host7,host8,host4

原理：

NameNode具有RackAware機架感知功能，這個可以配置。

若client為DataNode節點，那存儲block時，規則為：副本1，同client的節點上；副本2，不同機架節點上；副本3，同第二個副本機架的另一個節點上；其他副本隨機挑選。

若client不為DataNode節點，那存儲block時，規則為：副本1，隨機選擇一個節點上；副本2，不同副本1，機架上；副本3，同副本2相同的另一個節點上；其他副本隨機挑選。

　　d.client向DataNode發送block1；發送過程是以流式寫入。

　　　　1>將64M的block1按64k的package劃分;

　　　　2>然后將第一個package發送給host2;

　　　　3>host2接收完后，將第一個package發送給host1，同時client想host2發送第二個package；

　　　　4>host1接收完第一個package后，發送給host3，同時接收host2發來的第二個package。

　　　　5>以此類推，如圖紅線實線所示，直到將block1發送完畢。

　　　　6>host2,host1,host3向NameNode，host2向Client發送通知，說“消息發送完了”。如圖粉紅顏色實線所示。

　　　　7>client收到host2發來的消息后，向namenode發送消息，說我寫完了。這樣就真完成了。如圖黃色粗實線

　　　　8>發送完block1后，再向host7，host8，host4發送block2，如圖藍色實線所示。

　　　　9>發送完block2后，host7,host8,host4向NameNode，host7向Client發送通知，如圖淺綠色實線所示。

　　　　10>client向NameNode發送消息，說我寫完了，如圖黃色粗實線。。。這樣就完畢了。

　　分析，通過寫過程，我們可以了解到：

　　　　①寫1T文件，我們需要3T的存儲，3T的網絡流量貸款。

　　　　②在執行讀或寫的過程中，NameNode和DataNode通過HeartBeat進行保存通信，確定DataNode活著。如果發現DataNode死掉了，就將死掉的DataNode上的數據，放到其他節點去。讀取時，要讀其他節點去。

　　　　③掛掉一個節點，沒關系，還有其他節點可以備份；甚至，掛掉某一個機架，也沒關系；其他機架上，也有備份。

2.讀流程

　　　　例：

　　　讀操作就簡單一些了，如圖所示，client要從datanode上，讀取FileA。而FileA由block1和block2組成。

　　那么，讀操作流程為：

　　　　a.client向namenode發送讀請求。

　　　　b.namenode查看Metadata信息，返回fileA的block的位置。

　　　　 block1:host2,host1,host3

　　　　block2:host7,host8,host4

　　　　c.block的位置是有先后順序的，先讀block1，再讀block2。而且block1去host2上讀取；然后block2，去host7上讀取；

七、HDFS文件權限

　　1.與linux系統文件權限類似

　　　　r:read w:write x:execute 權限x對于文件忽略，對于文件夾表示是否允許訪問

　　2.如果linux系統用戶zhangsan使用hadoop命令創建一個文件，那么該文件在HDFS中的所有者就是zhangsan。

　　3.HDFS權限的目：阻止好人做錯事，而不是阻止壞人做壞事；例：只要是zhangsan上傳的文件，那HDFS就認為這個文件屬于張三，當下次過來操作的還是zhangsan那就可以操作，而不需要密碼驗證之類的操作。

八、安全模式

在NameNode啟動以后會一段時間是處于安全模式，在安全模式下只可查看不能修進行其他操作，因為在安全模式下NN和DN需要做很多工作；

　　1.NN 啟動的時候首先需要將fsimage 載入內存，并執行編輯日志中的各項操作。

　　2.一旦在文件系統中建立了一個新的元數據的映射，則創建一個新的fsimage 文件（與SNN配合）和一個空的edits文件

　　3.安全模式下的NameNode，對客戶端是只讀的（顯示文件目錄、內容等，其他的刪除、修改、重命名操作都會失敗）

　　4.在安全模式下，NameNode會收集來自DataNode匯報的block的信息，如果DN匯報的block的最副本數大于設置的最小副本數，則會認為是“安全”的。

　　　如果有block的副本數沒有達到設置的最小副本數，則該block會被復制直到達到設置的最小副本數為止。

總結

以上所述是小編給大家介紹的Hadoop 分布式存儲系統 HDFS的實例詳解，希望對大家有所幫助，如果大家有任何疑問歡迎給我留言，小編會及時回復大家的！

您可能感興趣的文章:

Hadoop源碼分析三啟動及腳本剖析
Hadoop源碼分析二安裝配置過程詳解
Python API 操作Hadoop hdfs詳解
Hadoop源碼分析五hdfs架構原理剖析

標簽：景德鎮南昌鹽城宣城文山黔南桂林東莞

巨人網絡通訊聲明：本文標題《Hadoop 分布式存儲系統 HDFS的實例詳解》，本文關鍵詞 Hadoop,分布式,存儲,系統,；如發現本文內容存在版權問題，煩請提供相關信息告之我們，我們將及時溝通與處理。本站內容系統采集于網絡，涉及言論、版權與本站無關。

下面列出與本文章《Hadoop 分布式存儲系統 HDFS的實例詳解》相關的同類信息！

Hadoop 分布式存儲系統 HDFS的實例詳解

目錄一、HDFS的優缺點 1.HDFS優點： 2.HDFS缺點二、HDFS的架構三、HDFS數據存儲單元（block）四、HDFS設計思想五、NameNode（NN）、 SencondryNameNode （SNN）、DataNode（DN） 1.NameNode (NN) 的工作...

10-18

濟源打電話機器人（濟源打電話機器人怎么收費）

本文目錄一覽： 1、濟源年代機器人科技有限公司怎樣樣？2、電話機器人多少錢？貴嘛？3、電話機器人價格是多少，值嗎？...

11-28

市場擴張,品牌的永恒話題

市場擴張,就像是商業戰場上的“政城掠地”,企業總是希望通過擴張市場版圖,來建立龐大的品牌王國。而關于市場擴張的報道...

10-23

南京不標記雙向回撥線路收費-看這里！

南京不標記雙向回撥線路收費為、財稅等企業客戶提供電話銷售客服功能，在降低人工成本的同時，提高了電話外呼次數。智...

01-16

長春人工外呼系統有效果嗎（長春外呼系統加盟）

本篇文章給我們談談長春人工外呼體系有作用嗎，以及長春外呼體系加盟對應的知識點，希望對各位有所協助，不要忘了保藏...

05-17

青島語音電銷機器人線路（電銷機器人電話機器人）

今天給各位分享青島語音電銷機器人線路的知識，其中也會對電銷機器人電話機器人進行解釋，如果能碰巧解決你現在面臨的...

02-06

南寧語音電銷機器人供應商（南寧少兒機器人）

本篇文章給大家談談南寧語音電銷機器人供應商，以及南寧少兒機器人對應的知識點，希望對各位有所幫助，不要忘了收藏本...

04-07

記錄集內隨機取記錄的代碼

% ' Moving to random record - Steven Jones' Extension If Not(記錄集名稱.bof and 記錄集名稱.eof) Then ' reset the cursor to the beginning If (記錄集名...

10-18

重慶高頻外呼系統怎么安裝（高頻外呼防封系統）

今天給各位分享重慶高頻外呼系統怎么安裝的知識，其中也會對高頻外呼防封系統進行解釋，如果能碰巧解決你現在面臨的問...

05-16

公司申請400電話都有哪些環節呢

很多公司在申請400電話時，感覺流程復雜，辦理起來很麻煩，那是因為對400電話申請沒有一個整體的了解，實際上在了解40...

05-09

海北州電話機器人（西寧電話機器人）

本文目錄一覽：1、智能語音機器人是不是就是打電話的?2、電話智能機器人值得使用嗎?五個具體操作步驟分享3、人工智能電...

07-19

臺山電話機器人（電話機器人多少錢?）

本文目錄一覽：1、想請問一下智能語音機器人一天可以打多少電話?2、電銷機器人一般多少錢?3、有誰用過電銷機器人?效果怎...

07-15

天津財稅電話銷售線路辦理商家,群呼系統-注意!

天津財稅電話銷售線路辦理商家,群呼系統電話營銷外呼系統有什么特點?電話營銷外呼系統座席電話能夠隨意設定，正確引導...

12-17

天津聯通呼叫中心軟件辦理價格,電銷機器人辦理-優質服務

天津聯通呼叫中心軟件辦理價格,電銷機器人辦理3.話術錄音方式(是否支持自定義音色音量或上傳實時錄音)。4.自定義變量拼...

12-17

融營通信電話銷售外呼軟件（融營通信電話銷售外呼軟件怎么樣）

本篇文章給大家談談融營通信電話銷售外呼軟件，以及融營通信電話銷售外呼軟件怎么樣對應的知識點，希望對各位有所幫助...

08-28

外呼系統運營商（網絡電話外呼系統排名）

今天給各位分享外呼系統運營商的知識，其中也會對網絡電話外呼系統排名進行解釋，如果能碰巧解決你現在面臨的問題，別...

02-22

如何留住網站訪問者？什么樣的網站才有未來？

現如今大到網站，小到媒體平臺，大家都在考慮如何留住訪問者這個問題，因為做到這點，我們才能獲得長足的發展，可以說...

10-19

力保信息安全大好大財務部鎖定外包郵

在黑客橫行、木馬泛濫的今天，電子信息的安全比任何時候都顯得重要，無論是企業商務還是個人私密，都存在著不可預知的...

10-22

易到今日14時起車主可通過APP提現可“秒到賬”

騰訊科技訊6 月 30 日，易到今日通過官方公眾號頒布頒發，今日 14 時起，所有易到平臺車主均可通過車主端APP完成提現。據...

10-16

文山電話機器人廠家電話銷售系統匯港通科技

匯港通科技團隊組建于2018年，是一家專注于中小企業精準營銷和企業管理服務解決方案的提供商。匯港通自主研發基于大數...

10-31

技術創新促進服務提升-訪威瑞特公司亞太區副總裁NigelHewett

Nigel Hewett檔案：Nigel Hewett是Verint公司亞洲地區副總裁。他主要負責整個亞太地區與Witness Actionable Solutions 的業務運作，具體負...

10-22

VMware 虛擬機(linux)增加根目錄磁盤空間的方法

一、關閉你的虛擬機系統，找到如下內容：選擇Edit Virtual mache settings 點擊Expand 擴大虛擬機的空間為40G(根據個人需要填寫空間...

10-20

上海智能電銷機器人怎么樣（上海智能電銷機器人怎么樣知乎）

本文目錄一覽： 1、有誰用過電銷板滯人？成就怎樣樣？ 2、電銷板滯人怎樣樣 3、電銷板滯人成就怎樣樣必修必修必修 4、電...

11-26

使用SQL查詢DB2 9中的XML數據

正在看的db2教程是:使用SQL查詢DB2 9中的XML數據。雖然 DB2 的混合體系結構與之前的版本有很大的不同，但是要利用它的新 X...

10-18

企業電銷外呼系統（電銷外呼軟件代理）

本文目次一覽： 1、電銷企業為什么需求德律風外呼零碎？該怎樣去抉擇？ 2、電銷外呼零碎幾何錢一個月？ 3、電銷客外呼零...

11-25

網站優化中搜索框如何設計?網站建設搜索框設計技巧和功能

網站建設包括很多重要內容：導航設計，整體布局，搜索功能設計和底部設計再加上網頁設計。網站設計美觀在整體設計在用...

10-19

企業名稱的作用

1.特指個體的稱呼企業名稱是企業參加民事活動時的稱呼。企業參與民事活動，出現在書面上，是一個文字形式的標記;出現...

10-23

尷尬！FB聲稱的美國廣告受眾竟比人口普查數據還高

騰訊科技訊據外媒報道，一位投資分析師周三體現，Facebook向廣告主聲稱的潛在受眾數據與美國的人口普查數據存在出入，這...

10-16

華勝天成聯絡中心咨詢服務解決方案（1）

概述北京華勝天成科技股份有限公司集合了一批具有多年呼叫中心建設與運營管理經驗的專家，組成了咨詢團隊；同時借助...

10-22

漯河百應外呼系統聯系方式的簡單介紹

本篇文章給大家談談漯河百應外呼系統聯系方式，以及對應的知識點，希望對各位有所幫助，不要忘了收藏本站喔。本文目...

11-06

珠海crm外呼系統廠家（珠海crm外呼系統廠家排名）

今天給各位分享珠海crm外呼系統廠家的知識，其中也會對珠海crm外呼系統廠家排名進行解釋，如果能碰巧解決你現在面臨的問...

05-16

如何在騰訊地圖上標記地點？如何在騰訊地圖上標記多個地點？

如何在地圖上標記多個地點？多企業為了直觀的了解市場動態進行數據可視化的方法，但是現在很多工作人員對于在地圖上...

10-08

阿里云盒子OS系統全面升級，終于不怕刪軟件了！

近期很多使用阿里云系統電視盒子的用戶都發現盒子系統都收到了系統升級的提示，其中包孕，，天敏、開博爾、憶典、靈云...

10-16

臺州餐飲加盟群呼線路服務商,外呼線路服務商-信譽保證

臺州餐飲加盟群呼線路服務商,外呼線路服務商針對這個問題，系統的解決方法是，在系統收取聲響后。先對原始信號進行處...

12-17

常州防封電話營銷線路哪里有,電話系統-服務周到!

常州防封電話營銷線路哪里有,電話系統提高人工客服的時間利用率。信息收集：電銷機器人在跟客戶的初步溝通中，可以自...

12-17

電銷卡從哪購買（電銷卡在哪里購買）

本文目錄一覽：1、海口電銷手機卡哪里買2、成都電銷卡去哪里購買3、電銷卡在哪里辦理4、哪里有已實名電銷卡購買平臺5、...

07-10

呼叫中心解決方案及服務提供商合力億捷上半年營收7952萬 --凈利1371萬

8月9日，合力億捷(833629)披露2018年半年報，公司2018上半年實現營收7952.34萬元，同比增長15.33%；歸母凈利潤為1370.78萬元，同比...

10-19

科大訊飛電話機器人使用（科大訊飛語音機器人）

本文目錄一覽： 1、那么多電話機器人,我們怎么測試誰家的好？2、電話機器人效果怎么樣_好不好用？3、什么是AI智能電話機...

11-27

企業400電話申請有什么好處

假如你沒有過創業，也許不會感覺到400電話申請為企業帶來的好處，但作為消費者，對400電話是否有種無言的信賴，感覺擁有...

05-09

鄭州將申建國家服務外包示范城

本報訊（記者李娜實習生李玲張雅靜）記者昨日獲悉，省政府印發了《關于加快轉變外貿發展方式促進對外貿易跨越式發展...

10-22

石家莊銷售智能電話機器人（石家莊銷售智能電話機器人公司）

本文目次一覽： 1、人工智能德律風營銷呆板人終究能做什么？ 2、ai智能德律風發售呆板人哪家的靠譜？ 3、智能德律風發售...

11-25

Access 導入到SQL Server 2005的方法小結

方法一: 名稱：DTS（這個在MSSQL2000里邊也有）操作：在命令提示符窗口中運行 DTSWizard.exe SQL Server 導入和導出向導提供了生成...

10-18

呼叫中心如何從電子商務時代獲利？

民航資源網2014年6月6日消息：電子商務飛速發展是否真讓傳統的呼叫中心無所適從呢？網絡和移動平臺機器客服是否會真能...

10-20

哈爾濱申請400電話條件（黑龍江400電話申請）

【哈爾濱申請400電話條件】哈爾濱400電話的市場權威性已經得到肯定，因此很多企業愿意為了消費者的信任度而將哈爾濱...

11-07

濟南crm外呼系統哪家好（濟南crm外呼系統哪家好用）

本文目錄一覽： 1、哪些電話電話外呼系統比較好，功能完善呢？2、網絡電話外呼系統哪個好？3、有知道的么外呼系統哪家...

11-27

專利保護的意義

專利制度通過給發明創造者以發明創造專利權和排他獨占權，使專利權人在一定時期內獨家占領市場，這不僅能使其收回研究...

10-23

Optus加深了思科與新Webex呼叫中心的聯系

老秦夜譯 CTI論壇(ctiforum.com)6月1日消息（編譯/老秦）:Optus已啟動區域性Webex聯絡中心以支持其Cisco產品。該產品可容納20，0...

10-19

如何進行客戶管理？

在銷售行業來說，你或許會經常聽到“開發十個新客戶，不如維護好一個老客戶”這樣一句話。雖然說這句話有點夸大，但是...

12-18

無錫電銷機器人廠家

匯港通科技組裝于2018年，是一家潛心于大中小企業精準經營銷售和企業管理效勞處置計劃的供給商。“構造框架結構扁平化...

10-31

長沙自動電銷機器人線路（長沙智能電銷機器人）

本篇文章給咱們談談長沙主動電銷機器人線路，以及長沙智能電銷機器人對應的常識點，期望對各位有所協助，不要忘了保藏...

05-18

一份Mac OS 圖形界面發展簡史：從荒蠻走向現代

火星文：Mac OS 是運行在蘋果電腦上的操作系統，它是第一個在商用領域取得成功的圖形用戶界面，下面這個讓我們一覽從 ...

10-20

Hadoop 分布式存儲系統 HDFS的實例詳解

10-18

本頁收集關于Hadoop 分布式存儲系統 HDFS的實例詳解的相關信息資訊供網民參考！

推薦文章

上一篇：Hadoop文件的存儲格式實例詳解

下一篇：hadoop遷移數據應用實例詳解

一起分享吧

好湿?好紧?好多水好爽自慰,久久久噜久噜久久综合,成人做爰A片免费看黄冈,机机对机机30分钟无遮挡

Hadoop 分布式存儲系統 HDFS的實例詳解

目錄

一、HDFS的優缺點

1.HDFS優點：

2.HDFS缺點

二、HDFS的架構

三、HDFS數據存儲單元（block）

四、HDFS設計思想

五、NameNode（NN）、 SencondryNameNode （SNN）、DataNode（DN）

1.NameNode (NN) 的工作

2.SecondryNameNode(SNN) 的工作

3.DataNode （DN）

六、HDFS的寫流程和讀流程

1.HDFS寫流程

七、HDFS文件權限

八、安全模式