我正試圖了解HDFS將檔案分割成塊所帶來的好處。
我本以為通過對多個塊的并行讀取,可以提高讀取性能。 然而,我一直在讀論文,說從 HDFS 讀/寫的速度實際上比本地檔案系統上的單個檔案要慢。
HDFS將檔案分割成塊的做法能帶來哪些性能上的好處?
uj5u.com熱心網友回復:
我一直在讀論文,說從/到HDFS的讀/寫實際上比本地檔案系統上的單個檔案更慢。
如果你能在一臺機器上讀取一個檔案,那么你就不需要Hadoop。Hadoop是一個針對巨大資料集的分布式處理框架。
HDFS 將檔案分割成塊,因為它被設計用來處理那些大到無法在一臺機器上處理的檔案。它不是為了提高小檔案的處理速度,而是為了給你提供一種處理你在一臺機器上無法處理的檔案的方法。
uj5u.com熱心網友回復:
除此之外,區塊很適合與復制提供容錯和可用性。HDFS將每個區塊復制到少數物理上獨立的機器上;在發生故障時,只有這些區塊需要從它們的替代位置重新復制到其他活的機器上。
轉載請註明出處,本文鏈接:https://www.uj5u.com/qiye/318970.html
標籤:
