智能合約場景下的模糊測驗——智能合約基本介紹
- 前言
- 一 基本概念
- 1.1 智能合約
- 1.2 圖靈完全
- 二 智能合約特性
- 2.1 運行環境
- 2.2 生命周期
- 1)開發
- 2)編譯
- 3)部署
- 4)呼叫
- 5)銷毀
- 2.3 程式特性
- 1)Gas機制
- 2)例外傳遞機制
- 3)委托呼叫
- 4)合約代碼無法修改
- 三 智能合約安全威脅
- 3.1 高級語言層面
- 1)變數覆寫
- 2)整數溢位
- 3)未校驗回傳值
- 4)任意地址寫入
- 5)拒絕服務
- 6)資產凍結
- 7)未初始化變數
- 8)影子變數
- 3.2 虛擬機層面
- 9)重入
- 10)代碼注入
- 11)短地址攻擊
- 12)不一致性攻擊
- 3.3 區塊鏈層面
- 13)時間戳依賴
- 14)條件競爭
- 15)隨機性不足
前言
模糊測驗和區塊鏈的相關概念在此不再贅述,網路上有很多成熟的檔案可以自行查閱,本人是在模糊測驗領域有一年研究基礎的CS研究生,應老板專案要求將模糊測驗應用于區塊鏈的智能合約場景并做一些新的嘗試,奈何本人在區塊鏈方向也是個小白,所以借此文對智能合約的相關概念作一個大致的了解并在此做一個總結,留作之后回顧,
本篇文章總結自注腳1中的綜述,如若感興趣可自行閱讀原文,
如果內容有問題或者有歧義歡迎大家留言建議和交流,
一 基本概念
1.1 智能合約
智能合約是一種基于區塊鏈平臺運行,為締約的多方提供安全可信賴能力的去中心化應用程式1,類似于一份不需要可信第三方監督或者參與的自動化合同,由技術手段來強制保證,在滿足條件后能夠自動履行承諾,
并且智能合約在部署到區塊鏈平臺之后是不能修改的,這也是把模糊測驗應用到這個場景的主要動機,合約上線之前需要進行充分的測驗,而模糊測驗是一種非常有效的測驗手段,
1.2 圖靈完全
2當一個資料操作規則(一門編程語言、或者一個指令集)能夠實作圖靈機模型里的全部功能時,就稱它具有圖靈完備性,其中被稱為區塊鏈2.0的以太坊,其最大的特點就是支持運行圖靈完全的智能合約運行,
二 智能合約特性
2.1 運行環境
以太坊虛擬機(Ethereum Virtual Machine, EVM)

EVM是一個無暫存器,基于堆疊式運行的虛擬機,其為智能合約提供了三種不同的存盤空間,分別為堆疊(Stack)、臨時記憶體(Memory)和永久存盤(Storage),前兩者是臨時的,僅在智能合約被呼叫時使用,Storage的存盤結果則是永久生效的;Stack用于保存各種臨時資料,以32位元組為訪問粒度;Momory用于保存陣列字串等較大的臨時資料,以單位元組為訪問粒度,
2.2 生命周期
1)開發
智能合約的開發語言包括Solidity、Vyper、idris等,其中Solidity是使用人數最多也是最活躍的,
2)編譯
所有語言開發的智能合約代碼都需要被編譯成統一的智能合約位元組碼(bytecode),才能在EVM上運行,被編譯后還會生成相應的合約呼叫介面(Application Binary Interface, ABI).
3)部署
合約的部署由一筆合約部署交易來完成,其中交易的資料(data),欄位被設定為合約部署位元組碼,而交易的接收方被設定為空,礦工在進行交易打包時,將會按照交易發送者的地址(address)和交易序列號(nonce)資訊來生成一個新的地址,并把合約的位元組碼部署到該地址,這個地址就是合約地址,也是合約的唯一標識,
4)呼叫
區塊鏈上的用戶可以通過合約地址對合約進行呼叫,有兩種呼叫方式:
一種是由普通地址發起一筆合約呼叫交易,這被成為交易呼叫(Transaction Call),會在區塊資料中留下呼叫資訊;
另一種是由某個合約發起的對另一個合約中函式的呼叫,稱為訊息呼叫(Message Call),不會留下呼叫引數資訊,
5)銷毀
以太坊允許合約進行自我銷毀,但是需要開發者在合約撰寫時加入這個功能,“銷毀”只是意味著合約在當前的區塊狀態(state)中被標記為洗掉,且不能被后續呼叫,但其合約代碼和Storage存盤還是可以被恢復和查看,
2.3 程式特性
1)Gas機制
對合約的任何操作都需要申請固定額度的Gas,如果合約程式的執行開銷超過了這個閾值,以太坊虛擬機就被拋出Out-Of-Gas例外來停止合約執行,Gas機制保障了合約程式的可終止性,但也會被利用以發起Dos攻擊,
2)例外傳遞機制
智能合約中的函式呼叫分為兩種:
對本合約或父合約中函式的內部函式呼叫
對指定地址的外部合約函式的外部函式呼叫
內部呼叫只需要指令跳轉,外部呼叫需要使用CALL命令向外部合約發送訊息,后者如果在執行中發生錯誤,則例外不會延呼叫堆疊進行傳遞,而是直接用bool型別的回傳值來標識呼叫是否完成,這也引發了很多安全問題,
3)委托呼叫
DELEGATECALL會改變函式呼叫者的背景關系資訊,所以一旦呼叫的目標地址被攻擊者可控,攻擊者就能在當前合約上執行任意代碼…
4)合約代碼無法修改
見1.1節
三 智能合約安全威脅
智能合約由很多區別于普通程式的特性,也因此帶來了新的安全威脅,我按照注腳1綜述中的順序對智能合約中高級語言、虛擬機和區塊鏈三個層面的安全漏洞作一個大體的概括,
3.1 高級語言層面
1)變數覆寫
solidity中沒有特殊宣告的變數應為Memory型別,但在某些版本的solidity中默認宣告的陣列或結構體會被誤用為Storage型別的變數,而Storage中的變數一般為重要資訊或者管理員資訊,攻擊者可以利用這個漏洞對關鍵資訊進行惡意纂改,
2)整數溢位
各種計算機語言中常見的一種錯誤,需要加安全性檢測,
3)未校驗回傳值
本文2.3.2的例外傳遞機制中說過,對外部合約呼叫的回傳值只是簡單的bool,因此開發者需要對這些回傳值進行提前的預校驗而不是交給合約的使用者自己處理,這容易造成合約內部控制流狀態混亂,
4)任意地址寫入
合約中包含用戶可控的對任意Storage地址寫入資料的漏洞,
5)拒絕服務
不安全的代碼撰寫規范導致合約易受Dos攻擊,
6)資產凍結
智能合約的一個重要作用是管理區塊鏈平臺上的數字資產,開發者如果在開發合約時只有接受ETH的功能而沒有任何允許ETH轉出的操作,則合約接受到的ETH資產將被永久凍結= =,一定程度上也因為合約部署之后無法被修改,
7)未初始化變數
沒有被初始化的Storage變數可能會指向位置的Storage存盤內容,對這些變數的讀取會導致未知事件,
8)影子變數
各種情況下的全域變數和區域變數重名引起的邏輯問題,
3.2 虛擬機層面
特指EVM
9)重入
理應是原子性事務的“修改Storage變數并轉賬”這個操作采用了先轉賬再修改Storage變數的順序,轉賬操作被惡意利用反復遞回執行,從而破壞操作的原子性,進而重復獲得轉賬收益,
10)代碼注入
智能合約中的DELEGATECALL會使用呼叫目標的背景關系資訊,如果外部合約的地址是由攻擊者可以控制的,攻擊者就可以任意修改這個地址在當前合約中執行任何想要執行的代碼,
11)短地址攻擊
攻擊者通過構造末尾為零的地址進行合約呼叫,并在呼叫引數中故意將地址末尾的零社區,從而利用虛擬機對于資料的自動補全機制將第二個引數進行移位放大,如果合約沒有對用戶輸入長度進行校驗,就會因為這個漏洞使得實際轉賬金額被擴大若干倍,
12)不一致性攻擊
指智能合約因虛擬機實作不一致從而導致的智能合約狀態混亂,
3.3 區塊鏈層面
13)時間戳依賴
指智能合約在代碼中使用嚴格的時間戳來進行重要的控制流決策,從而引入的安全漏洞,區塊時間戳看似具有偶然性,但卻是可以被礦工在一定的取值范圍內操控的,
14)條件競爭
指智能合約中僅通過交易順序來作為決策條件的程式邏輯所引起的漏洞,原因在于交易在由用戶發起后,便可以被網路中的部分節點觀測到,但此時離交易被打包尚有一段時間,且礦工通常先打包手續費更高的交易,因此攻擊者可以快速發起同樣的交易并通過提高手續費的方式讓自己的交易被優先打包,條件競爭漏洞的根源在于區塊鏈的交易打包和手續費機制,
15)隨機性不足
指智能合約中誤用了很多與區塊鏈有關的變數作為隨機源,但這樣的做法將導致亂數可被預測,
倪遠東, 張超與殷婷婷, 智能合約安全漏洞研究綜述. 資訊安全學報, 2020. 5(03): 第78-99頁. ??
什么是圖靈完備?https://www.zhihu.com/question/20115374 ??
轉載請註明出處,本文鏈接:https://www.uj5u.com/houduan/304089.html
標籤:java
下一篇:區塊鏈科普系列之1—區塊鏈的由來
