iOS逆向之深入決議函式本質·函式呼叫堆疊與相關指令-有解無憂

一、堆疊與暫存器

① 堆疊

堆疊：是一種具有特殊的訪問方式的存盤空間（即先進后出 Last In First Out， LIFO）：

在這里插入圖片描述

高地址往低地址存資料（存：高–>低）；
堆疊空間開辟：往低地址開辟（開辟：高–>低），

② SP 和 FP 暫存器

SP 暫存器：在任意時刻會保存堆疊頂的地址；
FP 暫存器（也稱為 x29 暫存器）：屬于通用暫存器，但是在某些時刻（例如函式嵌套呼叫時）可以利用它保存堆疊底的地址；
arm64 開始，取消了 32 位的 LDM、STM、PUSH、POP 指令，取而代之的是 ldr/ldp、str/stp（r 和 p 的區別在于處理的暫存器個數，r 表示處理 1 個暫存器，p 表示處理兩個暫存器）；
arm64 中，對堆疊的操作是 16 位元組對齊，
arm64 之前和 arm64 之后堆疊的對比：
- 在 arm64 之前，堆疊頂指標是壓堆疊時一個資料移動一個單元；
- 在 arm64 開始，首先是從高地址往低地址開辟一段堆疊空間（由編譯器決定），然后再放入資料，所以不存在 push、pop 操作，這種情況可以通過記憶體讀寫指令（ldr/ldp、str/stp）對其進行操作，

在這里插入圖片描述

③ x30 暫存器

x30 暫存器存放的是函式的回傳地址，當 ret 指令執行時刻，會尋找 x30 暫存器保存的地址值；
在函式嵌套呼叫時，需要將 x30 入堆疊；
lr 是 x30 的別名；
sp 堆疊里面的操作必須是 16 位元組對齊，

二、函式呼叫堆疊

常見的函式呼叫開辟（sub）以及恢復堆疊空間（add）的匯編代碼：

	// 開辟堆疊空間
	sub    sp, sp, #0x40             ; 拉伸0x40（64位元組）空間
	stp    x29, x30, [sp, #0x30]     ; x29\x30 暫存器入堆疊保護
	add    x29, sp, #0x30            ; x29指向堆疊幀的底部
	... 
	ldp    x29, x30, [sp, #0x30]     ; 恢復x29/x30 暫存器的值
	// 恢復堆疊空間
	add    sp, sp, #0x40             ; 堆疊平衡
	ret

① 記憶體讀寫指令

str（store register）指令（能和記憶體和暫存器互動的專門的指令）：將資料從暫存器中讀出來，存到記憶體中 (即一個暫存器是 8 位元組 - 64 位）；
ldr（load register）指令：將資料從記憶體中讀出來，存到暫存器中；
ldr 和 str 的變種 ldp 和 stp 還可以操作 2 個暫存器（即 128 位 - 16 位元組），
注意：
- 讀/寫資料都是往高地址讀/寫；
- 寫資料：先拉伸堆疊空間，再拿 sp 進行寫資料，即先申請空間再寫資料，
使用 32 個位元組空間作為如下程式的堆疊空間，然后利用堆疊將 x0 和 x1 的值進行交換：

	sub sp, sp, #0x20       ;拉伸堆疊空間32個位元組
	stp x0, x1, [sp, #0x10] ;sp往上加16個位元組，存放x0和x1
	ldp x1, x0, [sp, #0x10] ;將sp偏移16個位元組的值取出來，放入x1和x0，記憶體是temp（暫存器里面的值進行交換）
	add sp, sp, #0x20       ;堆疊平衡
	ret                     ;回傳

堆疊的操作如下圖所示：

在這里插入圖片描述

② 除錯查看堆疊

重寫 x0、x1 的值：

在這里插入圖片描述

然后單步往下執行，發現 x0、x1 已經變成寫入的值：

	int A();
	int B();
	
	int test() {
	    int cTemp = 0x1FFFFFFFF;
	    return cTemp;
	}
	
	- (void)viewDidLoad {
	    [super viewDidLoad];
	    printf("A");
	    A();
	    printf("B");
	}

查看記憶體變化，發現 sp 拉伸了 32 位元組：

在這里插入圖片描述

stp x0, x1, [sp, #0x10]：將 x0、x1 寫入 fp 偏移 0x10 的位置，繼續往下執行一步：

在這里插入圖片描述

此時 sp 的值并沒有變化，還是指向 40：

在這里插入圖片描述

ldp x1, x0, [sp, #0x10]：讀取 x0，x1 的資料并交換，繼續往下執行一步，此時記憶體并沒有變化：

在這里插入圖片描述

再來看 sp 是否有變化？從結果來看，也沒有變化，因此這里只是讀出來進行的交換，并不會導致記憶體變化：

在這里插入圖片描述

add sp, sp, #0x20：繼續執行一步，走到堆疊平衡，即 sp 恢復，此時的 a 和 b 仍然在記憶體中，等待著下一輪堆疊拉伸后資料的寫入覆寫，如果此時讀取，讀取到的是垃圾資料：

在這里插入圖片描述

堆疊空間不斷開辟，死回圈，會不會崩潰？通過一個匯編代碼來演示：

	// asm.s
	.text
	.global _B
	
	_B:
	    sub sp,sp,#0x20
	    stp x0,x1,[sp,#0x10]
	    ldp x1,x0,[sp,#0x10];暫存器里面的值進行交換
	    bl _B
	    add sp,sp,#0x20
	    ret
	    
	// 呼叫
	int B();
	
	int main(int argc, char * argv[]) {
	    B();
	}

運行可以發現：死回圈會崩潰，會導致堆疊溢位：

在這里插入圖片描述

堆疊溢位是說堆區和堆疊區的溢位，二者同屬于緩沖區溢位，一旦程式確定，堆疊記憶體空間的大小就是固定的，當資料已經把堆疊的空間占滿時，再往里面存放資料就會超出容量，發生上溢；當堆疊中的已經沒有資料時，再取資料就無法取到了，發生下溢，需要注意的是，堆疊分為順序堆疊和鏈堆疊，鏈堆疊不會發生溢位，順序堆疊會發生溢位，

在這里插入圖片描述

這樣，就解決了iOS逆向之初識匯編的基礎理論最后遺留問題的原因分析，

三、bl 與 ret 指令

① 概念

bl 標號：
- 將下一條指令的地址放入 lr（x30）暫存器（lr 保存的是回家的路）（即l）；
- 轉到標號處執行指令（即 b），
ret：
- 默認使用 lr（x30）暫存器的值，通過底層指令提示 CPU 此處作為下條指令地址；
- arm64 平臺的特色指令，它面向硬體做了優化處理，

② 實戰演練

現有如下的 bl、ret 相關的匯編指令：

	.text
	.global _A, _B
	
	_A:
	    mov x0. #0xaaaa
	    bl _B
	    mov x0, #0xaaaa
	    ret
	
	_B:
	    mov x0, #0xbbbb
	    ret

斷點執行：

	int A();
	int B();
	
	int test() {
	    int cTemp = 0x1FFFFFFFF;
	    return cTemp;
	}
	
	- (void)viewDidLoad {
	    [super viewDidLoad];
	    printf("A");
	    A();
	    printf("B");
	}

可以看到，A() 和 print 之間還有幾個匯編操作，這是什么意思呢？

在這里插入圖片描述

執行 mov x0. #0xaaaa：x0 變成 aaaa，此時此刻 lr 暫存器保存的是 5f34：

在這里插入圖片描述

驗證 lr 是否保存的是 5f34，通過查看暫存器，可以發現結果與預期是一致的：

在這里插入圖片描述

繼續執行 bl _B，跳轉到 B，此時的 lr 會變成 A 中 bl 的下一條指令的地址 5eb8：

在這里插入圖片描述

執行完 B 中的 mov x0, #0xbbbb，x0 變成 bbbb：

在這里插入圖片描述

執行 B 中的 ret，會回到 A 中 5eb8：

在這里插入圖片描述

繼續執行 A 中的 ret，會再次回到 5eb8：

在這里插入圖片描述

執行到這里，發現死回圈了，主要是因為 lr 一直是 5eb8，ret 只會看 lr，其中 pc 是指接下來要執行的記憶體地址，ret 是指讓 CPU 將 lr 作為接下來執行的地址（相當于將 lr 賦值給 pc）：

在這里插入圖片描述

此時 B 回到 A 沒問題，那么 A 回到 viewDidload 該怎么處理呢？這就需要在 A 的 bl 之前保存 lr 暫存器，但是不可以保存到其他暫存器上，這是因為不安全，不確定這個暫存器會在什么時候被別人使用，正常應該保存到堆疊區域，
系統中函式嵌套是如何回傳？來看下系統是如何操作的，例如：d -> c -> viewDidLoad：

	void d() {
	}
	void c() {
	    d();
	    return;
	}
	- (void)viewDidLoad {
	    [super viewDidLoad];
	    printf("A");
	    c();
	    printf("B");
	}

查看匯編，斷點斷在 c 函式：

在這里插入圖片描述

進入 c 函式的匯編：
- stp x29,x30,[sp,#-0x10]!：邊開辟堆疊，邊寫入，其中 x29 就是 fp，x30 是 lr，! 表示將這里算出來的結果，賦值給 sp；
- lsp x29,x30,[sp],#0x10：讀取 sp 指向地址的資料，放入 x29、x30，然后 #0x10 表示將 sp+0x10，賦值給 sp，

在這里插入圖片描述

當有函式嵌套呼叫時，將上一個函式的地址通過 x30（即 lr）放在堆疊中保存，保證可以找到回家的路，如下圖所示：

在這里插入圖片描述

自定義匯編代碼完善：_A中保存“回家的路”，根據系統的函式嵌套操作，最終在 _A 中增加了如下匯編代碼，用于保存“回家的路”：

	// 導致死回圈的匯編代碼
	_A:
	    mov x0. #0xaaaa
	    bl _B
	    mov x0, #0xaaaa
	    ret
	    
	// 增加lr保存：可以找到回家的路
	_A:
	    sub sp, sp, #0x10  // 拉伸
	    str x30, [sp]      // 存
	    mov x0, #0xaaaa
	    // 保護lr暫存器，存盤到堆疊區域
	    bl _B
	    mov x0, #0xaaa
	    ldr x30, [sp]      // 修改lr，用于A找到回家的路
	    add sp, sp, #0x10  // 堆疊平衡
	    ret

修改 _A、_B：改成簡寫形式，其中 lr 是 x30 的一個別名：

	_A:
	    sub sp, sp, #0x10  // 拉伸
	    str x30, [sp]      // 存
	    mov x0, #0xaaaa
	    // 保護lr暫存器，存盤到堆疊區域
	    bl _B
	    mov x0, #0xaaa
	    ldr x30, [sp]      // 修改lr，用于A找到回家的路
	    add sp, sp, #0x10  // 堆疊平衡
	    ret
	
	_B:
	    mov x0, #0xbbbb
	    ret
	    
	// 改成簡寫形式
	_A:
	    //sub sp, sp, #0x10  // 拉伸
	    //str x30, [sp]      // 存
	    str x30, [sp, #-0x10]
	    mov x0, #0xaaaa
	    // 保護lr暫存器，存盤到堆疊區域
	    bl _B
	    mov x0, #0xaaa
	    // ldr x30, [sp]      // 修改lr，用于A找到回家的路
	    // add sp, sp, #0x10  // 堆疊平衡
	    ldr x30, [sp], #0x10  // 將sp的值讀取出來，給到x30，然后sp += 0x10
	    ret
	
	_B:
	    mov x0, #0xbbbb
	    ret