星際檔案系統(IPFS)會是將來一個非常重要的技術,IPFS的全稱是Interplanetary File System,是一種p2p的檔案分享系統,目的是要改變資訊分發的方式,它在通信協議和分布式系統方面都有幾項創新,我們先來看一下它背后的科技突破,這些突破讓IPFS的目的成為可能,

首先看一下通訊協議和分布式系統,如果兩個人要交流資訊,這兩個人需要共同的一套標準,以便確定資訊在何時以及如何傳遞,這些標準就是通常說的通訊協議,通訊協議就像語言一樣,如果我們去某個國家但是不說該國語言,我們就不具備和當地人交流的“通訊協議”,計算機也是這樣,起初計算機是彼此獨立的計算設備,一直到20世紀80年代,出現了通訊協議,才得以相互通訊,
在計算機中,通訊協議一般都是協議套件的形式,包含幾層,比如網路協議套件包含4層,每一層都有相應的功能,除了網路協議,我們還知道計算機之間相互交流的基本結構叫做系統架構,有很多種架構,不過和我們目前討論的相關的有客戶端-服務器端架構和點對點網路(p2p),
目前的互聯網主要是客戶端-服務器端的形式,這種形式正是基于互聯網協議套件,而其中HTTP則是資訊交流的基礎,
現在網路上的資料是存盤在集中的服務器上,人們在訪問網路上某個資料時,是通過地址來進行尋找的,如需查看一張圖片,并不是通過圖片內容來尋找圖片,而是通過哪臺服務器上有這張圖片,就去訪問這個服務器的方式實作的,這種方式可以讓資料更容易發布和管理,更容易保護資料,可以讓服務器和客戶端的容量更大,但是在安全性、私密性和效率方面有很大的缺陷,有權限控制服務器的一方即有權限控制所有資料,也就是說,你的資料可以被任何有權限訪問服務器的人查看和修改,或是洗掉,使用基于地址尋找資料的方式時,資料是由其地址而非其內容確定的,也就是,即便我們附近的網路里就有我們需要的內容,我們也得訪問遠程服務器來獲得想要獲取的內容,而且我們也沒有辦法識別資訊是否被修改,因為客戶端只知道資料存放的地址,而不知道資料的內容,
不過,在互聯網起始以來,客戶端-服務器模型以及HTTP就一直在使用當中,而且表現也很不錯,這是因為使用HTTP的網路傳輸文本和圖片之類的小檔案很高效,在網路發展的20年,一個普通頁面的大小僅僅從2KB增長到了2MB,

HTTP對于加載網頁來說很方便,但是它在設計之初就不是用于傳輸大檔案的,(像是音頻或者是視頻之類,)HTTP的這些限制也催生了如BitTorrent的下載方式,可用來下載電影等大檔案,
到了2018年,大資料以及網路高清點播視頻已經很普及了,我們所生產和消費的資料也在不斷增多,同時我們也在開發更強有力的計算機來處理這些資料,云計算等技術可緩解這一問題,但是分發資料的基礎架構還是和以前基本一樣,
現在就是星際檔案系統(IPFS)登場的時刻了,IPFS想要通過一種全新的p2p檔案分享系統來解決客戶端-服務器端和HTTP網路的不足,IPFS基于幾種新技術以及幾種現存的技術,是由Protocol Labs創建的開源專案,Protocol Labs是一個研究網路協議的實驗室,之前還是Y Combinator投資的一個初創專案,此外,Protocol Labs還開發了IPLD以及Filecoin,作為補充的系統,IPFS的組成很龐大,其主要結構如下:
分布式哈希表
哈希表是一種資料結構,把資料以鍵值對的形式保存,在分布式哈希表中,資料分散存盤在計算機網路中,我們可以方便地查詢并訪問相關的節點,
分布式哈希表的主要優點是去中心化、容錯和可擴展,節點不需要中心的協調,即使節點出錯或者不再存在于網路之中,系統仍然可以可靠地運行,分布式哈希表可以拓展到容納數百萬的節點,如此一來,就比客戶端-服務器端結構更有彈性,
塊交換
檔案共享軟體Bittorrent通過創新的資料交換協議,能夠成功協調數百萬節點之間的資料傳輸,不過僅限于種子生態系統,IPFS實作了這一協議的通用版本,稱為BitSwap,可以作為任何型別資料的市場,這個市場是Filecoin的基礎:Filecoin是一個建立在IPFS上的p2p存盤市場,

Merkle DAG
Merkle DAG即默克爾有向無環圖,是默克爾樹和有向無環圖的一種組合,默克爾樹保證在p2p網路上進行過交換的資料塊正確無誤、完好無損且未經修改,這樣的校驗是通過加密哈希函式實作的,函式接受一個輸入值,通過計算輸出一個獨一無二的由數字和字母組成的字符序列,即哈希值,可以校驗一個輸入值經過計算之后得出的哈希值和現有的哈希值是否吻合,但是很難通過哈希值反推出輸入值,
每一個獨立的資料塊叫做“葉子節點”,這些葉子節點計算了哈希值之后,得出“非葉子節點”,這些非葉子節點可以相互組合和計算哈希值,一直到所有資料塊可以用一個單獨的根哈希值表示,
下圖形象地展現了該程序:

有向無環圖用于對沒有環的資料做出拓撲序列模型,有向無環圖的最簡單例子是家族樹,默克爾有向無環圖是一種資料結構,其中哈希值被用來參考有向無環圖中的資料塊和物件,這樣就有了幾個非常有用的特性:IPFS上所有內容都可被獨一無二地確立,因為每一個資料塊都有獨一無二的哈希值,而且資料可以防止被篡改,因為如果修改了哈希值也就改變,如圖:

IPFS的中心思想是把所有資料都建立在默克爾有向無環圖上,這樣可以使得安全性獲得極大的提升,
版本控制系統
默克爾有向無環圖的另一個強有力的特性是,可以讓我們建立分布式的版本控制系統,比如Github就是一個例子,開發者可以同時協作開發專案,Github上面的檔案就是通過默克爾有向無環圖存盤并分版本的,開發者可以單獨復制和編輯檔案的多個版本,保存這些版本,之后再把修改的內容和原檔案合并,
IPFS對于資料物件使用的是相同的模型,只要物件對應于原來的資料,并且新的版本可訪問,則整個檔案的歷史版本都是可獲取的,如果資料塊在網路中是保存在本地的,而且可以無限快取,那么就表示IPFS物件可以永久保存,
而且,IPFS不依賴互聯網協議,資料可以直接分布在覆寫網路上,這也是很重要的特性,
自認證檔案系統
最后一個IPFS的重要特性是自認證檔案系統(SFS),它是分布式檔案系統,不需要特殊權限就可以交換資料,
IPFS通過SFS這一概念實作了星際檔案空間(IPNS),IPNS是使用公鑰來自認證用戶在網路上發布的物件的SFS,上文提到,所有IPFS上的物件都可被獨一無二地確定,節點也是這樣,每個節點都有一套公鑰和私鑰,以及一個由其公鑰經過哈希生成的節點ID,節點因此可以使用他們的私鑰來簽證其發布的任何資料物件,且資料的真實性可使用發送者的公鑰來驗證,
https://hackernoon.com/a-beginners-guide-to-ipfs-20673fedd3f
https://hackernoon.com/merkle-trees-181cb4bc30b4
https://docs.ipfs.io/
https://docs.ipld.io/#the-data-model
轉載請註明出處,本文鏈接:https://www.uj5u.com/qukuanlian/242432.html
標籤:區塊鏈
