我是一個 C 初學者,所以我試圖破解這些東西。
我閱讀stdio.h并找到了這一行:
extern int printf (const char *__restrict __format, ...);
所以我寫了這段代碼,但我不知道它為什么會起作用。
代碼:
extern int printf (const char *__restrict __format, ...);
main()
{
printf("Hello, World!\n");
}
輸出:
sh-5.1$ ./a.out
Hello, World!
sh-5.1$
哪里GCC找的功能printf?它也適用于其他編譯器。我是 C 的初學者,我覺得這很奇怪。
uj5u.com熱心網友回復:
默認情況下,gcc 會將您的程式與libc實作的 c 庫鏈接printf:
$ ldd ./a.out
linux-vdso.so.1 (0x00007ffd5d7d3000)
libc.so.6 => /lib/x86_64-linux-gnu/libc.so.6 (0x00007fdf2d307000)
/lib64/ld-linux-x86-64.so.2 (0x00007fdf2d4f0000)
$ nm -D /lib/x86_64-linux-gnu/libc.so.6 | grep ' printf' | head -1
0000000000056cf0 T printf@@GLIBC_2.2.5
如果您使用自己構建程式,-nolibc則必須自己滿足一些符號(請參閱
Compiling without libc):
$ gcc -nolibc ./1.c
/usr/bin/ld: /usr/lib/gcc/x86_64-linux-gnu/10/../../../x86_64-linux-gnu/Scrt1.o: in function `_start':
(.text 0x12): undefined reference to `__libc_csu_fini'
/usr/bin/ld: (.text 0x19): undefined reference to `__libc_csu_init'
/usr/bin/ld: (.text 0x26): undefined reference to `__libc_start_main'
/usr/bin/ld: /tmp/user/1000/ccCFGFhf.o: in function `main':
1.c:(.text 0xc): undefined reference to `puts'
collect2: error: ld returned 1 exit status
uj5u.com熱心網友回復:
您需要了解程式編譯的編譯和鏈接階段之間的區別。
在編譯階段,您向編譯器描述您打算呼叫的可能在此檔案、其他檔案或庫中的各種內容。這是使用函式宣告完成的。
int woodle(char*);
例如。這就是頭檔案充滿的東西。
如果函式在同一個檔案中,那么編譯器將在編譯該檔案時確定如何呼叫它。但是對于其他功能,它會在生成的代碼中留下一條注釋,上面寫著
please wire up the woodle function here so I can call it.
通常稱為 animport并且您可以使用一些工具來查看目標檔案中的匯入 - 名稱取決于平臺和工具集
聯結器的作業是找到這些匯入并解決它們。它將查看在命令列上傳遞的物件檔案、命令列中包含的庫以及 c 標準所說的所有程式都應該使用的標準庫。
在您的printf情況下,聯結器printf在聯結器自動包含的 c 標準庫中找到。
順便說一句 - 聯結器從物件和庫中查找“匯出”,也有工具可以查看這些。聯結器的作業是將每個“匯入”與“匯出”匹配
uj5u.com熱心網友回復:
您的程式在沒有頭檔案的情況下編譯意味著編譯器設定是寬松的。不過,您仍然應該收到警告。您的程式鏈接的原因是包含函式代碼的 C 標準庫printf是自動鏈接的。幾乎每個 C 程式都需要它,因為輸入和輸出,或者通常與該庫處理的外圍設備的互動,是生成“副作用”的一般手段,即程式外部的效果。相反的情況是如此罕見,以至于人們必須明確表示不想與之聯系。
那么,為什么您的編譯器會接受對尚未宣告的函式的呼叫呢?
C 出現在程式更小,軟體開發作為一門工程學科還沒有正式存在的時候:
四年后[即 1978 年],作為一名初級教員,我試圖讓我的同事 [...] 創建一個計算機科學本科學位。一位面目猙獰的高級機械工程師肯定不是嗤之以鼻:哈佛從來沒有提供過汽車科學的學位,我們為什么要開設計算機科學的學位?我等到獲得終身教職后,才在 1982年再次嘗試(并取得了成功) 。—— Harry R. Lewis
那是在 Denis Ritchie 開始開發這種多功能的新編程語言(B 的繼任者)之后大約 10 年。當時創建和維護大型程式所涉及的問題根本不像現在那么緊迫,也沒有那么容易理解,也許, 今天。
在今天幫助我們的許多事情中,至少在大多數編譯語言中,強型別是強型別。我們使用的每個識別符號都用靜態型別宣告。但其重要性和好處在 1970 年代并不那么明顯,早期的 C 允許隨意混合和匹配整數和指標。都是數字,對吧?而函式只是跳轉地址的名稱,對吧?用戶將知道將什么放入堆疊,并且該函式將從堆疊中讀取它——我真的不認為這里有問題;-)。這種態度給我們帶來了類似的功能printf()。
在這個階段設定之后,我們正在慢慢進入重點。因為函式只是一個跳轉地址,所以不需要函式宣告來呼叫它。 假定的引數是您提供的,假定的回傳型別默認為 int,這通常是正確的,或者至少沒有受到傷害。并且很長一段時間 C 保持這種向后兼容性。我認為 C99 標準禁止使用未宣告的識別符號,C11 和 C21 的標準草案都說:
識別符號是主要運算式,前提是它已被宣告為指定一個物件(在這種情況下它是一個左值)或一個函式(在這種情況下它是一個函式指示符)91
腳注 91 說“因此,未宣告的識別符號違反了語法。” (我所有的重點。)
我嘗試過的所有編譯器都編譯它(帶有警告),也許是因為一些仍然經常編譯的古老代碼依賴于它。
uj5u.com熱心網友回復:
首先,了解gcc程式是什么。從技術上講,它不是編譯器,而是編譯器驅動程式。編譯器驅動程式負責驅動執行編譯相關任務的各種其他工具。一些工具位于 中PATH,而其他工具位于內部編譯器目錄中。
有多種方法可以檢查驅動程式在做什么。我不會詳細介紹我是如何制作這篇文章的其余部分的,但簡要介紹一下:
strace -f -e %process gcc是一種特定于 Linux 的顯示所有已執行程式的方式(在此答案的其他地方,我在指定詳細資訊時假設使用 Linux,但這并不重要)gcc -v將轉儲各種資訊,但您必須了解哪些部分對您所做的任何事情實際上很重要。存在一個“規范”檔案,它控制驅動程式執行的一些與引數相關的內容
現在來看實際資料:
這是gcc可能執行的行程樹:
gcc,“驅動程式”(輸入各種,輸出各種。一些引數由驅動程式本身處理,但大多數傳遞給各種子行程)- (這些對每個輸入檔案重復。如果
-pipe通過,則省略臨時檔案并并行運行行程;如果--save-temps通過,則保留中間檔案):cc1 -E -lang-asm,匯編代碼的“前處理器”(輸入.S、輸出.s——是的,大小寫很重要。僅當您嘗試編譯需要預處理的單獨 ASM 檔案時才相關)cc1 -E, C 代碼的“前處理器” (輸入.c;輸出通過,司機在此之后停止).i-fno-integrated-cppcppPATH-Ecc1,正確的“編譯器”(輸入(通常).c或(很少).i;輸出.s。如果-S通過,則驅動程式在此之后停止;如果-fsyntax-only通過,則此階段甚至沒有完成)- (對于其他語言,請替換
cc1為cc1plus,cc1d,cc1obj,f951,gnat1等。請注意,不同的驅動程式如g,gdc等僅影響默認鏈接的額外庫) as,“匯編程式”(輸入.s;輸出.o。這是在 中查找的PATH;它是作為 Binutils 的一部分提供的,而不是 GCC。如果-c通過,驅動程式將在此處停止)
collect2,“聯結器”包裝器(假設這與建構式有關,并且可能呼叫ld兩次,但實際上我從未見過它。只需將其視為將所有引數轉發給ld,即使您通常有建構式)ld,正確的“聯結器”(輸入.o或其他(假設是庫);輸出可執行檔案或共享庫。就像as,這實際上是 Binutils 的一部分,而不是 GCC,因此在 中查找PATH)
- (這些對每個輸入檔案重復。如果
驅動程式有很多邏輯,所以使用它很重要。值得注意的是,您永遠不應該呼叫asorld自己,因為這將忽略依賴于驅動程式對“確切當前平臺”的感覺的引數。
現在,解決您的具體問題:
忽略不相關的引數并簡化路徑,ld呼叫最終看起來像:
ld -o foo Scrt1.o crti.o crtbeginS.o foo.o -lgcc -lgcc_s -lc -lgcc -lgcc_s crtendS.o crtn.o
各種“crt”松散物件檔案是 GLIBC 和 GCC 的一部分,需要支持 C 運行時(注意還有其他的;它們的鏈接取決于引數)。gcc和gcc_s庫是在平臺上運行代碼所必需的;它們被重復是因為它們依賴于c也依賴它們的庫。
Since -lc is passed by default (regardless of language), the printf symbol can be resolved. Notably, -lm, -lrt, -lpthread and others are not passed by default, so other symbols from differents parts of the C library will not be resolved unless you pass them manually.
All of this is completely independent of what headers are included.
轉載請註明出處,本文鏈接:https://www.uj5u.com/qianduan/456454.html
標籤:C
下一篇:C程式查找給定數量的面額數量
