從分布式一致性演算法到區塊鏈共識演算法（一）-有解無憂

從分布式一致性演算法到區塊鏈共識演算法（一）

本文主要參考書籍：區塊鏈原理、設計與應用第二版

一致性問題

一致性問題是分布式領域最為基礎也是最重要的問題， 如果分布式系統能實作“一致”，對外就可以呈現為一個完美的、可擴展的“虛擬節點”，相對物理節點具備更優越性能和穩定性，這也是分布式系統希望能實作的最終目標，

一致性要求

可終止性（ termination ）：一致的結果在有限時間內能完成；
約同性（ agreement）：不同節點最終完成決策的結果是相同的；
合法性（ validity）：決策的結果必須是某個節點提出的提案，

帶約束的一致性

要實作絕對理想的嚴格一致性（ strict consistency）代價很大，除非系統不發生任何故障，而且所有節點之間的通信無需任何時間，這個時候整個系統其實就等價于一臺機器了，
實際上，越強的一致性要求往往會造成越弱的處理性能，以及越差的可擴展性，

一般來講，強一致性（ strong consistency）主要包括下面兩類：

順序一致性（ sequential consistency) : Leslie Lamport 在 1979 年的經典論文《 How toMake a Multiprocessor Computer That Correctly Executes
Multiprocess Programs 》中提出，是一種比較強的約束，保證所有行程看到的全域執行順序（ total order ）
一致，并且每個行程看自身的執行順序（ local order）跟實際發生順序一致，例如，某行程第 4 重分布式系統核心問題令 37先執行
A ，后執行 B ，則實際得到的全域結果中就應該為 A 在 B 前面，而不能反過來，同時所有其他行程在全域上也應該看到這個順序，
順序一致性實際上限制了各行程內指令的偏序關系，但不在行程間按照物理時間進行全域排序；
線性一致性（ linearizability consistency) : Maurice P. Herlihy 與 Jeannette M. Wing 在1990 年的經典論文《 Linearizability: A Correctness
Condition for Concurrent Objects
中共同提出，在順序一致性前提下加強了行程間的操作排序，形成唯一的全域順序（系統等價于是順序執行，所有行程看到的所有操作的序列順序都一致，并且跟實際發生順序一致），是很強的原子性保證，
但是比較難實作，目前基本上要么依賴于全局的時鐘或鎖，要么通過一些復雜演算法實作，性能往往不高，

由于強一致性的系統往往比較難實作，而且很多時候，實際需求并沒有那么嚴格需要強一致性，因此，可以適當地放寬對一致性的要求，從而降低系統實作的難度，例如在一定約束下實作所謂最終一致性（ eventual
consistency），即總會存在一個時刻（而不是立刻），讓系統達到一致的狀態，大部分 Web 系統實作的都是最終一致性，
相對強一致性，這一類在某些方面榷訓的一致性都籠統稱為弱一致性（weak consistency ），

FLP不可能定理

定義

FLP 不可能原理：在網路可靠，但允許節點失效（即便只有一個）的最小化異步模型系統中，不存在一個可以解決一致性問題的確定性共識演算法（ No completely asynchronous consensus
protocol can tolerate even a single unannounced process death ），

FLP 不可能原理實際上告訴人們，不要浪費時間，去為異步分布式系統設計在任意場景下都能實作共識的演算法，

正確理解

FLP不可能定理的最大適用前提是異步網路模型，何為同步、異步模型呢？

所謂異步模型，是說從一個節點到另一個節點的訊息延遲是有限的，但可能是無界的（finite but can be unbounded），這就意味著如果一個節點沒有收到訊息，它無法判斷訊息到底是丟失了，還是只是延遲了，也就是說，我們無法通過超時時間來判斷某個節點是否故障，
所謂同步模型，是說訊息傳遞的延遲是有限的，且是有界的，這就意味著我們可以通過經驗或采樣精確估算訊息的最大可能延遲，從而可以通過超時時間來確定訊息是否丟失、節點是否故障，
綜上所述，在分布式系統中，同步和異步這兩個術語存在特殊的含義，同步是指系統中的各個節點的時鐘誤差存在上限；并且訊息傳遞必須在一定時間
內完成，否則認為失敗；同時各個節點完成處理訊息的時間是一定的，對于同步系統，可以很容易地判斷訊息是否丟失，
異步是指系統中各個節點可能存在較大的時鐘差異，同時訊息傳輸時間是任意長的，各節點對訊息進行處理的時間也可能是任意長的，這就造成無法判斷某個訊息遲遲沒有被回應是哪里出了問題（節點故障還是傳輸故障？）
，

如何規避“FLP不可能定理”

研究者們通過調整問題模型來規避“FLP 不可能定理”從而尋找工程上可行的共識演算法, 比如位元幣系統中通過假定網路為弱同步性, 即網路節點間可以快速同步,以及礦工在一個區塊上投入有限的時間等來規避“FLP
不可能定理”，通過調整問題模型規避“FLP 不可能定理”, 使得共識演算法存在“工程解”，

CAP定理

定義

分布式系統無法同時滿足一致性 (Consistency)、可用性(Availability)和磁區容忍性(Partition Tolerance), 最多只能同時滿足其中兩個特性, 如下圖所示，

一致性是指分布式系統中所有節點在同一時刻持有同樣的資料資訊，而且任何操作應該都是原子的，發生在后面的事件能看到前面事件發生導致的結果，注意這里指的是強一致性；
可用性是指系統處于服務狀態, 當客戶端發出請求, 服務端能在有效的時間內回傳結果；
磁區容忍性是指允許網路中部分節點不與其他節點通信,即允許網路發生磁區(不同區域之間的節點不能建立通信)，

應用場景

榷訓一致性
對結果一致性不敏感的應用，可以允許在新版本上線后過一段時間才最終更新成功，期間不保證一致性，例如網站靜態頁面內容、實時性較弱的查詢類資料庫等，簡單分布式同步協議如 Gossip ，以及 CouchDB 、 Cassandra 資料庫等，都是為此設計的，
榷訓可用性
對結果一致性很敏感的應用，例如銀行取款機，當系統故障時候會拒絕服務， MongoDB 、 Redis 、MapReduce 等是為此設計的， Paxos 、 Raft 等共識演算法，主要處理這種情況，在 Paxos
類演算法中，可能存在著無法提供可用結果的情形，同時允許少數節點離線，
榷訓磁區容忍性
現實中，網路磁區出現概率較小，但較難完全避免，兩階段的提交演算法，某些關系型資料庫及 ZooKeeper 主要考慮了這種設計，實踐中，網路可以通過雙通道等機制增強可靠性，達到高穩定的網路通信，

轉載請註明出處，本文鏈接：https://www.uj5u.com/qukuanlian/278134.html

標籤：區塊鏈

上一篇：對稱加密和非對稱加密

下一篇：從零基礎部署自己的數字貨幣機器人（初稿）