在 C 中,當您使用 char 指標定義字串時(從技術上講,您正在定義一個指標變數),它會在記憶體的只讀段中創建一個字符陣列,然后回傳一個指向它的指標。這意味著您不應該修改它,因為它是一個常量。如果你想修改它,你應該使用 char 陣列或使用 malloc。
但是由于某種原因,我實際上能夠更改字串,這怎么可能呢?
#include <stdio.h>
int main() {
// The string "Hello" is a read-only literal (formally its type is const char[5])
char * msg = "Hello";
msg = "New string"; // why / how does this work?
printf("%s \n", msg); // New string
}
但同時這不起作用(這是有道理的)
#include <stdio.h>
int main() {
char * msg = "Hello";
*(msg 1) = 'a'; // Error: segmentation fault
*(msg 1) = "a"; // Error: segmentation fault
printf("%s \n", msg);
}
uj5u.com熱心網友回復:
"Hello"并且"New string"是存盤在記憶體中某處的字串文字。
char * msg = "Hello";
msg用字串文字的第一個字符的參考(地址)分配指標。
msg = "New string";
替換msg先前分配的指標值。它不修改先前分配的字串文字 - 只修改指標msg。
第二個例子
*(msg 1) = 'a';
修改字串文字 - 在 C 語言中它是未定義的行為。
uj5u.com熱心網友回復:
您的“編輯”解釋是錯誤的。或者不準確。
char * msg = "Hello";
正如您所說,在堆疊中保留一個指標位置(實際上,4 或 8 個位元組,具體取決于體系結構),并且在記憶體區域中為常量保留 6 個位元組(5 個字母 h , e, l, l, o 和另一個用于終端 '\0')。
msg可以更改其值的變數(經典的讀/寫變數)也是如此。并且"hello"是一個常量指標。而且,正如您所說,首先,值msg是常量指標"hello",它指向包含字母 h、e、l、l、o、'\0' 的常量區域。
msg = "New string";
根本不分配任何東西。我的意思是,不是在運行時。在編譯時,在代碼中某處提到“新字串”這一簡單事實,創建了另一個包含字母 N、e、w 的常量(在程式運行后立即存在,而不是在遇到這行代碼時存在) ,' ',s,t,r,i,n,g,'\0'。
“新字串”只是一個常數。就像 12 一樣。一個常量指標。指向記憶體的一個常量區域(所以常量指標指向常量字符)。
所以你所做的一切
msg = "New string";
只是將變數的值更改為另一個常量。它會像x=12.
請注意,文字"foo"在技術上是常量指標。完全一樣
char hello[6]="hello";
是
(這是陣列和指標之間的區別:這里,hello不是變數。它是一個常量。就像 12 一樣。或者原樣"hello"。一個常量,其值由編譯器計算,這就是它的作業。)
另請注意,我說過這"hello"是一個指向常量字符的常量指標。這也不準確。"hello"從語言的角度來看,所指向的字符不是恒定的。它們是左值,就像我的陣列的字符一樣hello。
如果你嘗試編譯
char hello[6]="hello";
hello="foo";
"hello"="bar";
12=13;
它根本不會編譯。即使有警告,它也不能。從編譯器的角度來看,這 3 行是完全一樣的廢話。您不能將常數用作 L 值。編譯器根本不知道您想在哪里存盤正確的值。
另一方面,如果您嘗試此代碼
#include <stdio.h>
int main(){
printf("Hello\n");
"Hello\n"[1]='a';
printf("Hello\n");
}
您不會收到編譯錯誤。當然,你會從編譯器那里得到一個公平的警告,意思是“好的,我編譯它,因為從我的角度來看它是合法的。但是如果你嘗試運行它會崩潰”。但是在這里,正如hello陣列是一個常量,但hello[1]仍然可以修改(這就是陣列的全部觀點),"hello"陣列也是一個常量,但從"hello"[1]語言的角度來看不是,并且可以修改。
現在,由于"hello"指向不應在運行時修改的記憶體段,因此您會遇到分段錯誤。
這幾乎是最近的事情。當我教 C 時(大約 10 到 15 年前),這段代碼運行良好(它第一次列印“Hello”,然后第二次列印“Hallo”。你可以從代碼易讀性中看到為什么這是一個糟糕的想法:常量"hello"是指向包含字母的區域的指標hallo)。我正在使用這種示例(以及許多我們永遠不應該做的事情)來說明什么是真正的字串文字。10-15 年前似乎是很久以前的事了。但這不像是在段發明之前,以及段錯誤。那時記憶已經被分割了。只是,不是為了那個。
所以,很明顯,我根本不想在這里教你技巧。但只是為了了解什么是字串文字。只是一個指向 char 的常量指標的名稱。就像陣列一樣。
uj5u.com熱心網友回復:
首先,雖然字串文字應該是不可變的,但它們不必存盤在只讀段中。已經(并且仍然是)將字串文字存盤在可寫段中的實作。
嘗試修改字串文字內容的行為是未定義的- 它可能按預期作業,它可能根本沒有效果,它可能導致運行時錯誤。
字串文字的存盤通常在程式最初加載時分配(它們通常是程式映像的一部分)并且在整個程式中可見。IOW,當你寫的時候
msg = "New string";
"New string"在運行時的那個時候沒有分配存盤空間- 它是在程式第一次啟動時分配的。您只是設定msg指向已分配的記憶體。
對于指向文字的指標,宣告它們通常是一個好習慣const:
const char *msg = "Hello";
您仍然可以更改msg為指向不同的字串文字:
msg = "New string";
但是如果您嘗試修改字串本身的內容,您將在編譯期間獲得診斷:
*msg = 'n'; // *msg is const, compiler will yak
uj5u.com熱心網友回復:
(從技術上講,您正在定義一個指標變數)
如果使用“技術上”這個詞,你真的提高了對技術準確性的期望。
這個:
char *msg
是一個指標宣告。
這個:
char *msg = "Hello";
是一個宣告,其中包含一個初始運算式為字串文字的初始值設定項。
字串文字的型別是char[6](它是一個包含終止符的 6 個字符的陣列)。請注意,盡管型別是非常量,
字串文字不可修改(...)。如果程式試圖修改由字串文字形成的靜態陣列,則行為未定義。
還要注意
...在翻譯階段 7,一個終止的空字符被添加到每個字串文字,然后每個文字初始化一個未命名的陣列,其靜態存盤持續時間和長度剛好足以包含字串文字的內容加上一個空終止符。
(以上鏈接均參考)。
那是,
- 你真的不能移植地修改一個字串文字(盡管 UB 允許它作為一個平臺特性作業,依賴這個是不明智的),并且
- 存盤空間是在編譯時分配的,并且陣列的存在時間與程式一樣長。在運行時執行初始化時肯定不會分配它。
那么,如何用陣列初始化指標呢?因為陣列很容易衰減為指標(指向第一個元素)。所以,msg只包含第一個字符的地址,'H'.
msg = "New string"; // why / how does this work?
它之所以有效,是因為它msg是一個可變指標,因此您可以對其進行變異以指向其他地方。記憶體中其他地方的靜態陣列char[6] { 'H', 'e', 'l', 'l', 'o', 0 )完全不受影響。
uj5u.com熱心網友回復:
在第一種情況下,您只是更改指標指向的值。
第二,你試圖訪問一個受限的記憶體區域,所以你得到了分段錯誤。
這就是指標的作業原理。
轉載請註明出處,本文鏈接:https://www.uj5u.com/ruanti/519682.html
標籤:C指针
下一篇:類指標不命名型別
