一個由C/C++編譯的程式占用的記憶體分為以下幾個部分:
1、堆疊區(stack)— 由編譯器自動分配釋放 ,存放為運行函式而分配的區域變數、函式引數、回傳資料、回傳地址等,
其操作方式類似于資料結構中的堆疊,(記憶體分配時,與堆相向而生,因此申請記憶體是有限的,運用不當,會出現堆疊溢位)
2、堆區(heap) — 一般由程式員分配釋放, 若程式員不釋放,程式結束時可能由OS回收 ,分配方式類似于鏈表,
3、全域區(靜態區)(static)—存放全域變數、靜態資料、常量,程式結束后由系統釋放,4、文字常量區 —常量字串就是放在這里的, 程式結束后由系統釋放,
5、程式代碼區—存放函式體(類成員函式和全域函式)的二進制代碼,
記憶體分配有以下三種方式:
1.從靜態存盤區域分配
記憶體在程式編譯的時候就已經分配好,這塊記憶體在程式的整個運行期間都存在,例如全域變數,static變數,
2.在堆疊上創建(地址從大到小)
在執行函式時,函式內區域變數的存盤單元都可以在堆疊上創建,函式執行結束時這些存盤單元自動被釋放,堆疊記憶體分配運算內置于處理器的指令集中,效率很高,但是分配的記憶體容量有限,(堆疊上的變數都具有臨時變數的特性)
3.從堆上分配(地址從小到大)
亦稱動態記憶體分配,程式在運行的時候用malloc或new申請任意多少的記憶體,程式員自己負責在何時用free或delete釋放記憶體,
動態記憶體的生存期由程式員決定,使用非常靈活,但如果在堆上分配了空間,就有責任回收它,否則運行的程式會出現記憶體泄漏,
頻繁地分配和釋放不同大小的堆空間將會產生堆記憶體碎塊,(在程式關閉(運行結束)后,記憶體泄漏消失)
我們都知道C語言基本的內置型別:
char //字符資料型別
short //短整型
int //整形
long //長整型
long long //更長的整形
float //單精度浮點數
double //雙精度浮點數
需要注意的是,C語言沒有字串型別!
那么,不同的型別決定了他們所占存盤空間的大小的不同,這也是型別的意義之一,
型別的基本歸類
整形家族
char
unsigned char
signed char
short
unsigned short [int]
signed short [int]
int
unsigned int
signed int
long
unsigned long [int]
signed long [int]
浮點數家族
float
double
構造型別
> 陣列型別 arr[]
> 結構體型別 struct
> 列舉型別 enum
> 聯合型別 union
指標型別
int *pi;
char *pc;
float* pf;
void* pv;
空型別
void 表示空型別(無型別)
通常應用于函式的回傳型別、函式的引數、指標型別,
上面我們詳細介紹了C語言的各種資料型別,而我們知道一個變數的創建是要在記憶體中開辟空間的,空間的大小是根據不同的型別而決定的,
那么,資料在所開辟記憶體中到底是如何存盤的?
下面我們首先來看整形在記憶體中到底是如何存盤的
整形在記憶體中的存盤
比如:
int a = 20;
int b = -10;
我們知道要為 a 分配四個位元組的空間, 那如何存盤呢?
要搞清楚整形在記憶體中的存盤,就必須先了解下面一組概念:
原碼、反碼、補碼
計算機中的有符號數有三種表示方法,即原碼、反碼和補碼,
三種表示方法均有符號位和數值位兩部分,符號位都是用0表示“正”,用1表示“負”,而數值位三種表示方法各不相同,
原碼
直接將資料按照正負數的形式翻譯成對應的二進制序列,
反碼
原碼的符號位不變,其他位依次按位取反,
補碼
反碼 1就得到補碼,
正數(無符號數)的原、反、補碼都相同,
相信學過計算機組成原理這門課的讀者對于這一概念并不陌生,
對于整形來說:資料存放在記憶體中其實存放的是補碼,
為什么呢?
在計算機系統中,數值一律用補碼來表示和存盤,原因在于,使用補碼,可以將符號位和數值域統一處理; 同時,加法和減法也可以統一處理(CPU只有加法器)此外,補碼與原碼相互轉換,其運算程序是相同的,不需要額外的硬體電路,
我們通過除錯代碼來進一步驗證一下:
從圖中我們可以看出,由于a是正數,原反補相同,所以記憶體中存的就是20的二進制序列,編譯器以16進制顯示即為14,很好理解;但是b為什么會是f6呢?(后邊全f即為全1)
其實,當我們知道整形在記憶體中的存盤方式之后,也就很好理解了,
我們分別把-10的原反補碼寫出來:
//-10的二進制序列以及其原反補
//1000 0000 0000 0000 0000 0000 0000 1010(原)
//1111 1111 1111 1111 1111 1111 1111 0101(反)
//1111 1111 1111 1111 1111 1111 1111 0110(補)
由于整形在記憶體中是以補碼形式存盤的,所以補碼形式的 1111 0110轉換成16進制不就是f6了嗎?
通過這個例子,我們似乎明白了整形在記憶體當中的確是以補碼形式存盤的,但細心的讀者可能看出來了,存放的順序是不是有點不對勁啊,這又是為什么呢?
為了解決這個疑問,我們就需要介紹下面另一個概念了:
大小端位元組序介紹及判斷
什么是大端小端
大端(存盤)模式,是指資料的低位保存在記憶體的高地址中,而資料的高位,保存在記憶體的低地址中;
小端(存盤)模式,是指資料的低位保存在記憶體的低地址中,而資料的高位,,保存在記憶體的高地址中,
為什么有大端小端
為什么會有大小端模式之分呢?這是因為在計算機系統中,我們是以位元組為單位的,每個地址單元都對應著一
個位元組,一個位元組為8bit,但是在C語言中除了8bit的char之外,還有16bit的short型,32bit的long型(要看具
體的編譯器),另外,對于位數大于8位的處理器,例如16位或者32位的處理器,由于暫存器寬度大于一個字
節,那么必然存在著一個如果將多個位元組安排的問題,因此就導致了大端存盤模式和小端存盤模式,
例如一個 16bit 的 short 型 x ,在記憶體中的地址為 0x0010 , x 的值為 0x1122 ,那么 0x11 為高位元組, 0x22
為低位元組,對于大端模式,就將 0x11 放在低地址中,即 0x0010 中, 0x22 放在高地址中,即 0x0011 中,小
端模式,剛好相反,我們常用的 X86 結構是小端模式,而 KEIL C51 則為大端模式,很多的ARM,DSP都為小
端模式,有些ARM處理器還可以由硬體來選擇是大端模式還是小端模式,
基于對大小端的了解,我們至此就能回答上面的問題了,由于我的電腦所使用的的是小端存盤模式,所以在記憶體中的存盤順序就會顯示為以上形式,
浮點型在記憶體中的存盤決議
上面我們了解了整形在記憶體當中的存盤方式,最后我們來談一談浮點數在記憶體中的存盤,同樣,我們也通過一個例子來展開:
int main()
{
int n = 9;
float* p = (float*)&n;
printf("n的值:%d\n", n);
printf("*p的值:%f\n", *p);
*p = 9.0;
printf("n的值:%d\n", n);
printf("*p的值:%f\n", *p);
return 0;
}
輸出的結果是什么呢?
有讀者可能會說,這還不簡單?第一個n=9.0,定義的指標pFloat指向n,但由于是浮點數指標,所以解參考應該是*p=9.0;而之后通過指標修改n的值,所以后面倆個的值也應該是9.0,
真的是這樣嗎?我們先直接看結果:
讀者如果不知道浮點數在記憶體當中的存盤規則,那么對于這個結果一定會很驚訝,尤其是中間倆個資料的值,n和 pFloat 在記憶體中明明是同一個數,為什么浮點數和整數的解讀結果會差別這么大?
要理解這個結果,就需要搞懂浮點數在計算機內部的表示方法,
詳細解讀:
根據國際標準IEEE(電氣和電子工程協會) 754,任意一個二進制浮點數V可以表示成下面的形式:
(-1)^S * M * 2^E
(-1)^s表示符號位,當s=0,V為正數;當s=1,V為負數,
M表示有效數字,大于等于1,小于2,
2^E表示指數位,
舉例來說: 十進制的5.0,寫成二進制是 101.0 ,相當于 1.01×2^2 , 那么,按照上面V的格式,可以得出s=0,
M=1.01,E=2,
十進制的-5.0,寫成二進制是 -101.0 ,相當于 -1.01×2^2 ,那么,s=1,M=1.01,E=2,
IEEE 754規定: 對于32位的浮點數,最高的1位是符號位s,接著的8位是指數E,剩下的23位為有效數字M,
對于64位的浮點數,最高的1位是符號位S,接著的11位是指數E,剩下的52位為有效數字M,
IEEE 754對有效數字M和指數E,還有一些特別規定, 前面說過, 1≤M<2 ,也就是說,M可以寫成 1.xxxxxx 的形式,其中xxxxxx表示小數部分,
IEEE 754規定,在計算機內部保存M時,默認這個數的第一位總是1,因此可以被舍去,只保存后面的xxxxxx部分,比如保存1.01的時候,只保存01,等到讀取的時候,再把第一位的1加上去,這樣做的目的,是節省1位有效數字,以32位浮點數為例,留給M只有23位,將第一位的1舍去以后,等于可以保存24位有效數字,
至于指數E,情況就比較復雜,
首先,E為一個無符號整數(unsigned int) 這意味著,如果E為8位,它的取值范圍為0255;如果E為11位,它的取值范圍為02047,但是,我們知道,科學計數法中的E是可以出現負數的,所以IEEE 754規定,存入記憶體時E的真實值必須再加上一個中間數,對于8位的E,這個中間數是127;對于11位的E,這個中間數是1023,比如,2^10的E是10,所以保存成32位浮點數時,必須保存成10 127=137,即10001001,
然后,指數E從記憶體中取出還可以再分成三種情況:
E不全為0或不全為1
這時,浮點數就采用下面的規則表示,即指數E的計算值減去127(或1023),得到真實值,再將有效數字M前加上第一位的1, 比如: 0.5(1/2)的二進制形式為0.1,由于規定正數部分必須為1,即將小數點右移1位,則為1.02^(-1),其階碼為-1 127=126,表示為01111110,而尾數1.0去掉整數部分為0,補齊0到23位00000000000000000000000,則其二進制表示形式為:
0 01111110 00000000000000000000000
E全為0
這時,浮點數的指數E等于1-127(或者1-1023)即為真實值, 有效數字M不再加上第一位的1,而是還原為0.xxxxxx的小數,這樣做是為了表示±0,以及接近于0的很小的數字,
E全為1
這時,如果有效數字M全為0,表示±無窮大(正負取決于符號位s);
好了,關于浮點數的表示規則,就說到這里,如果大家看懂了,我們就可以解釋上面的例題了:
讓我們回到一開始的問題:為什么 9 還原成浮點數,就成了 0.000000 ? 首先,將 9的二進制序列拆分,得到第一位符號位s=0,后面8位的指數E=00000000 ,最后23位的有效數字M=000 0000 0000 0000 0000 1001,
9的二進制序列:0000 0000 0000 0000 0000 0000 0000 1001
由于指數E全為0,所以符合上述的第二種情況,E為全0.因此,浮點數V就寫成: V=(-1)^0 ×0.00000000000000000001001×2(-126)=1.001×2(-146) ,顯然,V是一個很小的接近于0的正數,所以用十進制小數表示就是0.000000,
也可以理解為,當指數E為全0時,我們就認為這個浮點數為0,
從這里我們又了解到一個資訊,浮點數的“0”其實是一個范圍,并不一定是確確實實的0值,也就是說,當一個浮點數小到一個特點的范圍的時候(E為全0時),我們就認為這個浮點數的值為0(0.000000),
再看例題的第二部分, 請問浮點數9.0,如何用二進制表示?還原成十進制又是多少? 首先,浮點數9.0等于二進制的1001.0,即1.001×2^3,
9.0 -> 1001.0 ->(-1)^01.0012^3 -> s=0, M=1.001,E=3 127=130
那么,第一位的符號位S=0,有效數字M等于001后面再加20個0,湊滿23位,指數E等于3 127=130,即10000010, 所以,寫成二進制形式,應該是S E M,即
0 10000010 001 0000 0000 0000 0000 0000
我們打開計算器,輸入這一串二進制序列,就可以看到這個32位的二進制數,還原成十進制,正是 1091567616 ,
轉載請註明出處,本文鏈接:https://www.uj5u.com/qita/379476.html
標籤:其他
上一篇:兩款數學工具的介紹
