文章目錄
- 前言
- 正文開始
- 型別的基本歸類
- 整形在記憶體中的存盤
- 大端小端
- 做題目鞏固
- 第一題:
- 第二題:
- 第三題:
- 補充(char的取值范圍)
- 第四題:
- 第五題
- 第六題
前言
資料在記憶體中到底是怎么存盤的呢?相信看完這篇文章你的內功又會增加一點,
本文重點:
1. 資料型別詳細介紹
2. 整形在記憶體中的存盤:原碼、反碼、補碼
3. 大小端位元組序介紹及判斷
4. 浮點型在記憶體中的存盤決議
正文開始
我們大家最容易接觸的內置型別:
char //字符資料型別
short //短整型
int //整形
long //長整型
long long //更長的整形
float //單精度浮點數
double //雙精度浮點數
那么這些型別有什么意義呢?
- 確認這些型別在記憶體開辟的空間大小,比如 int型別 4位元組
- 看待記憶體的視角,int型別是整形,float型別是浮點型
型別的基本歸類
- 整形家族:
char
unsigned char
signed char
short
unsigned short [int]
signed short [int]
int
unsigned int
signed int
long
unsigned long [int]
signed long [int]
為什么char型別放在整形里面?
其實字符型別在底層存盤,存的是ASCII碼值,ASCII碼值也是整數
unsigne(無符號)
未來你要創建一個變數,變數只會存正數,沒有可能有負數的情況,那么你可以創建一個unsigne的型別
signed (有符號)
有符號位,也就是有正負之分
- 浮點型別家族:
float
double
- 構造型別家族(自定義型別):
結構體型別 struct
列舉型別 enum
聯合型別 union
陣列型別
為什么陣列型別也是自定義型別?
定義一個陣列 int arr [10] ,我們知道陣列去掉它的陣列名剩下的就是型別了, int [10] <— 這個就是我們自定義的型別
定義int arr [ 5 ],去掉陣列名int [5],可以看見他們都是int型別,但是int [10]和int[5] 不一樣,所以說陣列型別也屬于自定義型別
- 指標型別:
float*p
char*p
void*p
int*p
- 空型別:
void 表示空型別(無型別)
通常應用于函式的回傳型別、函式的引數、指標型別,
整形在記憶體中的存盤
我們之前講過一個變數的創建是要在記憶體中開辟空間的,空間的大小是根據不同的型別而決定的,
那接下來我們談談資料在所開辟記憶體中到底是如何存盤的?
int a = -10;
問題一:看了上面的代碼我們知道 a 是int型別占4個位元組,那在如何存盤的呢?
首先我們要來了解下面的概念:
資料在記憶體中以二進制的形式存盤
計算機中的有符號數有三種表示方法,即原碼、反碼和補碼,
三種方法都有符號位和數值位
- 符號位 : 符號位都是用0表示“正”,用1表示“負”
- 數值位 : 數值位三種表示方法各不相同
對于整數來說:
整數的二進制有3種表示形式:原碼,反碼,補碼
正整數: 原碼,反碼,補碼相同
負整數: 原碼,反碼,補碼要進行計算
-
原碼:按照數值直接寫出來的二進制序列就是原碼
-
反碼:原碼的符號位不變,其他位按位取反,得到的就是反碼
-
補碼:反碼加1,就是補碼
好了,知道以上的一些概念,讓我們回到問題一看看我們的int a在記憶體是怎么存盤的
-
先編譯器取A的地址
輸入&a 得到 f6 ff ff ff

為什么是 f6 ff ff ff 呢?讓我們來按照上面的步驟來探究一下: -
獲取a的原碼
-10
原碼:10000000 00000000 00000000 00001010

-
獲取a反碼
反碼:11111111 11111111 11111111 11110101

-
獲取a的補碼
反碼: 111111111 111111111 111111111 11110110
上面說到為什么是f6 ff ff ff
對于整形來說:資料存放記憶體中其實存放的是補碼,怎么證明呢?

可以看見把剛剛計算出來的補碼放在計算器里面得到的就是一個16進制的FFFFFFF6 ,只是順序有點倒過來了,不過的確可以證明對于整形來說:資料存放記憶體中其實存放的是補碼
問題二: 為什么要存補碼呢?為什么不存原碼呢?
在計算機系統中,數值一律用補碼來表示和存盤,原因在于,使用補碼,可以將符號位和數值域統一處理; 同
時,加法和減法也可以統一處理(CPU只有加法器)此外,補碼與原碼相互轉換,其運算程序是相同的,不需
要額外的硬體電路,
其實就是說補碼補碼相加才可以得到一個準確的數值,看不懂上面的?沒事
來個代碼:1-1 因為CPU只有加法器 , 所以就是1+(-1)
1-1
1+(-1) (CPU只有加法器)
我們試一下 錯誤的:原碼相加會等到正確的值嗎?
1 的原反補相同:00000000 000000000 00000000 000000001
-1的原碼 : 10000000 000000000 00000000 000000001
二進制原碼相加:
00000000 00000000 00000000 00000001
10000000 00000000 00000000 00000001
得到下面這個數:
10000000 00000000 00000000 00000010
認為這個是正確的數,那我們讀出來就是 -2 了,1 - 1 = 0,最后是-2肯定是錯誤的,
我們試一下 正確的:補碼相加會等到正確的值嗎?
1的原反補相同:00000000 000000000 00000000 000000001
來算一下負1的補碼:
-1的原碼:10000000 00000000 00000000 00000001
-1的反碼:1111 1111 1111 1111 1111 1111 1111 1110
-1的補碼:1111 1111 1111 1111 1111 1111 1111 1111
二個數的補碼相加:

得到 :10000000 00000000 00000000 000000000
32個0,一個1 ,我們實際上只可以放32個二進制數,那個進1的那位要丟掉,所以最后得到全0,而 1-1 的 正確結果也是 0.

這就是為什么要補碼相加,而不是原碼,或者反碼相加的原因,
補碼與原碼相互轉換,其運算程序是相同的,不需要額外的硬體電路
這句話怎么理解呢?看下面的案列:

-1的補碼要是想得到原碼,可以反過來計算,補碼-1,然后按位取反就可以得到,
那其實還有一種方法可以驗證我們上面參考的話:
我們把補碼當原碼,在過一次計算一次依然可以得到我們的原碼.

是不是和上面的原碼一樣了,這就解釋了上面所說的話了,
大端小端
為什么要有大端小端:
為什么會有大小端模式之分呢?這是因為在計算機系統中,我們是以位元組為單位的,每個地址單元都對應著一
個位元組,一個位元組為8bit,但是在C語言中除了8bit的char之外,還有16bit的short型,32bit的long型(要看具
體的編譯器),另外,對于位數大于8位的處理器,例如16位或者32位的處理器,由于暫存器寬度大于一個字
節,那么必然存在著一個如果將多個位元組安排的問題,因此就導致了大端存盤模式和小端存盤模式,
例如一個 16bit 的 short 型 x ,在記憶體中的地址為 0x0010 , x 的值為 0x1122 ,那么 0x11 為高位元組, 0x22
為低位元組,對于大端模式,就將 0x11 放在低地址中,即 0x0010 中, 0x22 放在高地址中,即 0x0011 中,小
端模式,剛好相反,我們常用的 X86 結構是小端模式,而 KEIL C51 則為大端模式,很多的ARM,DSP都為小
端模式,有些ARM處理器還可以由硬體來選擇是大端模式還是小端模式
啊這,太官方話了,,,, 簡單說就是你的數值大于一個位元組,就會有位元組存盤順序,所以要安排怎么把這些位元組按照什么順序放進去
什么是大端小端:
大端(存盤)模式:是指資料的低位保存在記憶體的高地址中,而資料的高位,保存在記憶體的低地址中;
小端(存盤)模式:是指資料的低位保存在記憶體的低地址中,而資料的高位,,保存在記憶體的高地址中,
來個代碼案列:
定義了一個變數:

來看一下這個a在本機是什么存盤模式,是大端存盤模式,還是小端存盤模式
我們畫個圖,模擬一下這個變數在記憶體中是怎么樣存盤的,

為什么說上面的是大端存盤模式,下面是小端存盤模式呢?
可以看見0x11223344 最后面的44是低位,然后在大端存盤模式下44是放在記憶體的高地址位,根據上面的概念可以得出,大端模式,低位在記憶體的高地址存盤就是大端模式,
為什么下面是小端存盤模式:
0x11223344 44是放在記憶體的低地址處,根據上面的概念可以得出,小端模式,低位在記憶體的低地址存盤就是小端模式,
那么我們當前的電腦上使用的是什么存盤模式呢?來讓我們一起看看

誒!!!大家可以看見原來在本機上使用的是小端存盤!

還記得這個FFFF FFF6嗎,也是小端存盤模式,所以說為什么有時候看記憶體是倒著的,就是因為這個大小端原因,
來做一道百度2015年的筆試題:
請簡述大端位元組序和小端位元組序的概念,設計一個小程式來判斷當前機器的位元組序,(10分)
答案:簡述的概念我們就不講了,來看一下小程式吧
思路:我們只要判斷第一個位元組是小端應該出現的位元組就是小端,是大端應該出現的位元組就是大端,
我們先看一下1在小端記憶體是怎么表示的:

可以看見第一個位元組是01 也就是1 所以我們代碼看一下寫成這樣判斷
int main()
{
//寫代碼判斷當前位元組序
int a = 1; //在小端應該是這樣的存盤 01 00 00 00
char* b =(char*) &a; //取出第一個位元組的內容
if (*b==1) {
printf("小端");
}
else {
printf("大端");
}
return 0;
}
也可以寫成函式的那樣:
int check_sys()
{
int a = 1;
return (*(char*)&a); //因為回傳的是1 或者0 也是&a的內容 所以可以直接rerunt
}
int main()
{
int ret = check_sys();
if (ret == 1 )
{
printf("小端");
}
else
{
printf("大端");
}
return 0;
}
做題目鞏固
第一題:
1.
//輸出什么?
#include <stdio.h>
int main()
{
char a= -1;
signed char b=-1;
unsigned char c=-1;
printf("a=%d,b=%d,c=%d",a,b,c);
return 0;
}
答案:-1 , -1 ,255
決議:(a)-1的由來
-1在記憶體中存的是補碼
-1的原碼:10000000000000000000000000000001
-1的反碼:11111111111111111111111111111110
-1的補碼:11111111111111111111111111111111
因為a是char型別只可以放8個bit為所以a里面應該存的是 8個1
再因為輸入列印是以%d型別列印的所以要發生整形提升,有符號位發生提升前面全補1
11111111變成11111111111111111111111111111111 —這個是補碼
還要變成原碼的方式輸出出去:
a的補碼11111111111111111111111111111
a的反碼11111111111111111111111111110
a的原碼10000000000000000000000000000001
最后列印的是原碼:-1
b其實也是一樣的有符號的-1
決議(c)255的由來
因為c是unsigned char型別只可以放8個bit為所以a里面應該存的是 8個1,
再因為輸入列印是以%d型別列印的所以要發生整形提升,無符號位發生提升前面全補0,
11111111變成00000000000000000000000011111111 —這個是補碼
看符號位是0,判斷它是一個正數,所以正數的原反補相同,最后已原碼列印出來的是8個1 也就是255

補充:char 到底是signed char 還是unsigned char ?
答:C語言標準并沒有規定,取決于編譯器
int 是 signed int
第二題:
2.
#include <stdio.h>
int main()
{
char a = -128;
printf("%u\n",a);
return 0;
}
答案是:4294967168
決議:
a的原碼:10000000000000000000000010000000
a的反碼:11111111111111111111111101111111
a的補碼:11111111111111111111111110000000
因為a是char型別,所以a里面存放的應該是8個bit位: 10000000
以%u形式輸出出來,要發生整形提升,看見a是char型別是有符號的,高位補1,得到:11111111111111111111111110000000,最后發現是以%u的型別列印出來,可%u是無符號型別,就意味著,這是個正數,正數的原反補相同,所以是168結尾的大數字

第三題:
#include <stdio.h>
int main()
{
char a = 128;
printf("%u\n",a);
return 0;
}
答案:4294967168
決議:和上面一樣
注意:char a =128, 其實a不可能放一個128,127后就是-128了
補充(char的取值范圍)
char取值范圍是:-128 ~ 127
為什么?
畫圖解釋一下:
char是8個bit位,所以在記憶體應該是這樣的:

因為01111111已經是最大的正數了,在加1最高位變成1的話,那就變成負數了,01111111 == 127,

如果01111111加1那么就變成了10000000,當然這個數并不是0,而是-128,遇見一個1,七個0都是-128,因為這里的二進制數不可以計算原反補碼了,但是其他的就不一樣,(負數是要進行原反補的)

補碼:11111110通過原反補的計算得到 -2
反碼:11111101 補碼減1得反碼
原碼:1000010 == -2 反碼取反得原碼
第四題:
int i= -20;
unsigned int j = 10;
printf("%d\n", i+j);
答案:-10
決議:求出-20 和 10的補碼相加 然后%d列印認為是有符號,還要計算出原碼列印出來,
i的原碼:10000000000000000000000000010100
i的反碼:11111111111111111111111111101011
i的補碼:11111111111111111111111111101100
j的補碼:00000000000000000000000000001010

因為%d列印的所以還要取出原碼

最終是-10
第五題
unsigned int i;
for(i = 9; i >= 0; i--)
{
printf("%u\n",i);
}
答案:死回圈
決議: 因為i是一個無符號數字,對于一個無符號數字 最小是0,判斷條件剛好是大于等于0,所以恒成立“,所以死回圈
第六題
int main()
{
char a[1000];
int i;
for(i=0; i<1000; i++)
{
a[i] = -1-i;
}
printf("%d",strlen(a));
return 0;
}
答案 :255
決議:strlen找到 \0 停止, 從-1 到 127 因為char的范圍是-128~127 所以128+127 = 255

第七題
#include <stdio.h>
unsigned char i = 0;
int main()
{
for(i = 0;i<=255;i++)
{
printf("hello world\n");
}
return 0;
}
答案: 死回圈
決議:無符號的char 取值符號是255 沒有正反區分,條件剛好是大于等于255 ,所以死回圈

本文結束,感謝大家的觀看!!!感覺對你有用的話,不妨點個大拇指
轉載請註明出處,本文鏈接:https://www.uj5u.com/qita/286294.html
標籤:其他
