這是一個傷心的故事,有多少小伙伴在寫C語言代碼時遇到過的情景!
提問:C語言中,未初始化的區域變數到底是多少?
答案往往是:
? 與編譯器有關;
? 可能但不保證初始化為0;
? 未確定,
總之,全部都是些一本正經的形而上答案,這很令人討厭,
但凡一些人給你滔滔不絕地扯編譯器,C庫,處理器體系結構卻給不出一個實際場景復現問題的時候,這人大概率在扯淡,
其實,這個問題本身就是錯誤的問法,說全了能講10萬字,我們只要能在特定場景下確定其特定行為就OK了,當然,這就需要設計一個比較OK的實驗,
在演示一個實際代碼行為之前,先給出一個知識,CPU不認識變數,更無法識別變數的名字,CPU只會從特定的記憶體位置取值或者將值存到特定的記憶體位置,因此當問一個變數的值是多少的時候,必須要知道這個變數對應的值被保存在什么地方,
來看下面的代碼:
#include <stdio.h> void func1() { int a; printf("func1:%d\n", a); a = 12345; } void func2() { int b; printf("func2:%d\n", b); } void func4() { int d; printf("func3:%d\n", d); } void func3() { int c; printf("func3:%d\n", c); c = 54321; func4(); } void test_call() { func3(); } int main(int argc, char **argv) { func1(); func2(); test_call(); }
——————————
我們有func1~func4一共4個函式,其內部均有一個未初始化的區域變數,它們的值到底是多少呢?
對于這種區域變數,它們的值取決于:
? 變數在堆疊中的位置,
? 變數對應的堆疊位置在 之前 有沒有被store過,
可以看到,上述第一點標記了一個記憶體位置,第二點則是代碼的行為,也就是說,只要有代碼去store對應的位置, 且后續的代碼沒有reset該位置的值的話,該位置就會保留著原先被store后的值,
驗證非常簡單,試一下就知道了:
[root@localhost test]# ./a.out
func1:0
func2:12345
func3:0
func3:0
————————————
按照函式呼叫堆疊幀的變化,func1的區域變數a和func2的區域變數b顯然是位于同一個位置的,在func1被呼叫時,這是一塊新的記憶體(可能在進入main之前有堆疊幀到達過這個位置),a的值取決于調入記憶體該位置的頁面對應偏移的初始值,這取決于作業系統:
? 作業系統在分配給程式頁面時可能會將頁面clear為零頁,
堆疊的分配不會涉及C庫,這里顯然并不涉及C庫的行為,但類似malloc分配的記憶體則涉及C庫了,
列印結果,a的值為0,我們認為作業系統回傳給了應用程式零頁,接下來在func1中將其賦值12345之后函式回傳,接下來呼叫func2的時候,在之前func1已經退出的堆疊幀位置重建堆疊幀,對應位置依然還是12345,
我沒有看到func1的ret操作后面有stack清0的代碼指令,效率考慮,也不該有這樣的指令,
再看test_call函式,很明顯,func3和func4呼叫使用的并不是同一個堆疊幀,因此即便是在func3中對c賦值了54321,也不會影響在其堆疊幀之上的func4的堆疊幀對應位置的值d,因此c和d的初始值均保持為0,
那么,初始化一個區域變數和不初始化一個區域變數,在指令層面上,區別在哪里呢?
很簡單,親眼看一下就知道,先看未初始化區域變數的func1:
// int a;
00000000004005ad <func1>:
4005ad: 55 push %rbp
4005ae: 48 89 e5 mov %rsp,%rbp
4005b1: 48 83 ec 10 sub $0x10,%rsp
4005b5: 8b 45 fc mov -0x4(%rbp),%eax
4005b8: 89 c6 mov %eax,%esi
4005ba: bf 90 07 40 00 mov $0x400790,%edi
4005bf: b8 00 00 00 00 mov $0x0,%eax
4005c4: e8 b7 fe ff ff callq 400480 <printf@plt>
4005c9: c7 45 fc 39 30 00 00 movl $0x3039,-0x4(%rbp)
4005d0: c9 leaveq
4005d1: c3 retq
————————————
再看初始化區域變數a為2222的版本:
// int a = 2222;
00000000004005ad <func1>:
4005ad: 55 push %rbp
4005ae: 48 89 e5 mov %rsp,%rbp
4005b1: 48 83 ec 10 sub $0x10,%rsp
4005b5: c7 45 fc 00 00 00 00 movl $0x0,-0x4(%rbp)
4005bc: 8b 45 fc mov -0x4(%rbp),%eax
4005bf: 89 c6 mov %eax,%esi
4005c1: bf 90 07 40 00 mov $0x400790,%edi
4005c6: b8 00 00 00 00 mov $0x0,%eax
4005cb: e8 b0 fe ff ff callq 400480 <printf@plt>
4005d0: c7 45 fc 39 30 00 00 movl $0x3039,-0x4(%rbp)
4005d7: c9 leaveq
4005d8: c3 retq
————————————
僅僅差了一條指令:
4005b5: c7 45 fc 00 00 00 00 movl $0x0,-0x4(%rbp)
————————————
初始化的操作是依靠實實在在的指令完成的,
總結一句:
函式回傳在pop出當前堆疊幀的時候,并不會清理它遺留在堆疊幀里的資料,下個函式呼叫再次重用到該堆疊幀的記憶體時,未初始化的區域變數將會被遺留資料影響,從而變得不確定!
所以,記得初始化你的區域變數,
————————————
看到這里你是不是對編程語言又有了一點新的認知呢~
如果你喜歡這篇文章的話,動動小指,點個贊再走~
如果你想學編程,小編推薦一個C語言/C++編程學習基地【下圖進入】!

一個活躍、高逼格、高層次的編程學習殿堂;編程入門只是順帶,思維的提高才有價值!
涉及:編程入門、游戲編程、網路編程、Windows編程、Linux編程、Qt界面開發、黑客等等......
轉載請註明出處,本文鏈接:https://www.uj5u.com/houduan/134883.html
標籤:其他
上一篇:爬取拉勾網資料并進行資料可視化
