題目:請設計一個類似于百度網盤的分布式云盤系統BPan,給出設計方案,包括:
1.說明BPan滿足CAP中的哪幾個,并說明原因,
2.列出BPan可能出現的故障及對應的解決方法,
3.說明BPan采用的資料分布與副本策略、及采用的原因,
4.給出BPan系統采用的共識演算法,并說明采用該演算法的原因,
1.知識點:
CAP分別指:一致性(Consistence)、可用性(Availability)、磁區容錯性(Partition Tolerance)
一致性:副本一致性,這里特指強一致性,強調的是資料正確,
可用性:指在系統出現錯誤之前已經可用的功能,強調的是不出錯,
磁區容錯性:指系統可以對網路磁區這種例外現象進行容錯處理,強調的是不掛掉,
沒有任意一種協議可以同時滿足CAP,
CAP原則的精髓就是要么AP,要么CP,要么AC,但是不存在CAP,如果在某個分布式系統中資料無副本, 那么系統必然滿足強一致性條件, 因為只有獨一資料,不會出現資料不一致的情況,此時C和P兩要素具備,但是如果系統發生了網路磁區狀況或者宕機,必然導致某些資料不可以訪問,此時可用性條件就不能被滿足,即在此情況下獲得了CP系統,但是CAP不可同時滿足,
consistency(一致性): 每次read,要么能獲取到最新的資料,要么獲取失敗(錯誤或超時)
availability(可用性): 每次請求肯定會有正確的資料(但不保證資料是最新)
partition tolerance(磁區容忍性): 盡管有部分訊息在節點間丟失,但是系統還可以正常運行
參考答案:BPan滿足CAP中的A、P,可用性和磁區容錯性,每次請求肯定會有正確的資料(但不保證資料是最新)、盡管有部分訊息在節點間丟失,但是系統還可以正常運行,
2.知識點:
分布式常見的例外
(1)機器宕機
引起機器宕機的原因可能是停電、記憶體錯誤等,發生機器宕機時,節點無法進入可用狀態,機器需要重啟,但是記憶體會被清空,一些節點需要讀取本地儲存設備當中的資訊或其他節點的資訊來恢復記憶體資訊,還有一些“無狀態”節點無需讀取任何資訊即可進入可用狀態,
(2)網路例外
網路例外可能會造成資訊丟失、資訊亂序、資料錯誤的后果,還有一些特殊的例外“網路磁區”(即集群被劃分成幾個磁區,磁區域磁區之間無法通信,只能磁區內部通信)
(3)磁盤故障
磁盤故障分為兩種情況:磁盤損壞和磁盤資料錯誤
磁盤損壞會使資料全部丟失,因此我們考慮將磁盤資料保存到多個服務器上來保障即使某一臺服務器磁盤損壞,其他服務器上還能保留它的資料
磁盤資料丟失既可以通過作業系統層面來恢復也可以通過上層分布式系統來恢復,
參考答案:可能出現資料丟失,當資料丟失時,通過讀取副本恢復,
3.知識點:
資料范圍分布
將資料按特征值的值域范圍劃分為不同的區間, 使得集群中每臺(組)服務器處理不同區間的資料
副本策略:資料段副本
以資料段( segment,fragment,chunk,partition )為單位作為副本,實踐中,常常使得每個資料段的大小盡量相等且控制在一定的大小以內,資料段的選擇與資料分布方式直接相關,
某系統中的資料有 3 個資料段 o、p、q,每個資料段都有三個副本,系統中有4臺機器,第一臺機器上有資料段 o、p、q,第二臺機器上有資料段 o、p,第三臺機器上有資料段 p、q, 第四臺機器上有資料段 q、o,
參考答案:采用資料范圍分布,將資料按特征值的值域范圍劃分為不同的區間, 使得集群中每臺(組)服務器處理不同區間的資料;采用副本策略為資料段副本,使得每個資料段的大小盡量相等且控制在一定的大小以內,
4.知識點:
RAFT,一致性共識演算法
Raft選舉演算法選舉程序
Raft協議中有三種狀態:follower、candidate、leader
follower一段時間未收到leader的“心跳”,則認定沒有leader(leader為選出或者上一個leader掛了)的, 此時follower會切換到candidate狀態進行選舉,他們會發出request vote并等待投票結果(自己也可以給自己投票),收到最多數選票的成為leader,
Leader只能有一個,當candidate發現已經有leader時停止選舉,計算機為了防止平票情況的出現會盡可能設定奇數個follower,
規定先到先得,一個節點只能投一票,如果follower A 向follower C發送request vote 并且follower C給 A投票了,B再向follower C發送請求則得不到回復,
Leader出現后會發送通知廣而告知已經出現leader,其他candidate停止選舉,Election結束后會進入一段時間的平穩作業期,Leader向follower發出要求,例如將“A”寫入日志,其他follower將“A”寫入磁盤后向leader發出Committed OK,在下一個“心跳”中leader會讓follower更新Committed專案,
參考答案:采用Raft選舉演算法,強調合法leader的唯一性協議,它們直接從leader的?度描述協議的流程,也從leader的角度出發論證正確性,
轉載請註明出處,本文鏈接:https://www.uj5u.com/qita/242855.html
標籤:其他
