分布式資料存盤三要素

什么是分布式資料存盤系統？

分布式存盤系統的核心邏輯，就是將用戶需要存盤的資料根據某種規則存盤到不同的機器上，當用戶想要獲取指定資料時，再按照規則到存盤資料的機器中獲取，

分布式存盤系統的三要素：

資料生產者生產資料，將資料存盤到分布式資料存盤系統中，資料消費者是從分布式資料存盤系統中獲取資料進行消費；資料索引將訪問資料的請求轉發到資料所在的存盤節點；存盤設備用來存盤資料，

分布式系統中存在大量不同型別的資料，根據資料的特征，我們可以將其分為三類：

資料分片技術，是指分布式存盤系統按照一定的規則，將資料存盤到相應的存盤節點中，或者到相應的存盤節點中獲取想要的資料，這種技術一方面可以降低單個存盤節點的存盤和訪問壓力，另一方面可以通過規定好的規則快速找到資料所在的存盤節點，從而大大降低搜索延遲，提高用戶體驗，

資料分片可以采取不同的方式，包括：

資料復制是指將資料進行備份，使得多個節點存盤該資料，它可以通過主備方式存盤的方式，提高分布式系統的可用性和可靠性，

在實際的分布式存盤系統中，資料分片和資料復制通常是共存的：

根據上述三種不同的資料型別，常采用的資料存盤選型方案如下：

分布式資料庫，通過表格來存盤結構化資料，方便查找，常見的方案包括：MySQL Sharding、Microsoft SQL Azure、Google Spanner、Alibaba OceanBase等，
分布式鍵值系統，通過兼職對來存盤半結構化資料，常見的方案包括：Redis、Memcache等，
分布式存盤系統，通過檔案、塊、物件等來存盤非結構化資料，常見的方案包括：Ceph、GFS、HDFS、Swift等，

詳細的分布式資料庫比較如下，

詳細的分布式存盤系統比較如下，

　　　　作者：李潘　　　　出處：http://wing011203.cnblogs.com/ 　　　　本文著作權歸作者和博客園共有，歡迎轉載，但未經作者同意必須保留此段宣告，且在文章頁面明顯位置給出原文連接，否則保留追究法律責任的權利，

轉載請註明出處，本文鏈接：https://www.uj5u.com/houduan/544935.html

標籤：其他