本章通過跟蹤hello程式的生命周期來開始對計算機系統進行學習,一個源程式從它被程式員創建開始,到在系統上運行,輸出簡單的訊息,然后終止,我們將沿著這個程式的生命周期,簡要地介紹一些逐步出現的關鍵概念、專業術語和組成部分,
@
目錄- 源程式是如何存盤的
- 源程式到可執行檔案的程序
- shell是什么
- 典型系統的硬體組成
- 運行hello程式
- 高速快取
- 存盤設備的層次結構
- 作業系統管理硬體
- 行程&執行緒
- 虛擬記憶體
- 并發&并行
- 多核處理器&多執行緒
??好久沒有更新博客了,從國慶節到現在一直在整理秋招的一些資料,簡歷模版,嵌入式軟體面試知識點總結,秋招筆試題目整理,面經總結復盤等,一共整理了將近400頁,16W字,順便把百度網盤的資料也整理了下,到10.16才整理完(需要資料的在主頁有我聯系方式),不得不說,整理資料是真的磨人性,
??接下來的計劃是補充下作業系統和計算機組成原理相關的知識,從《深入理解計算機系統》這本書開始吧,系統學習下《深入理解計算機系統》這本書,還有9個Lab可以做下,以便加深理解,初步計劃一周一章(不知道行不行),爭取在放寒假前做完這些,
??我會把看書程序中一些重要的知識點,概念的理解以及做實驗的詳細程序都放在博客深入理解計算機系統專欄中,歡迎關注我的博客以便第一時間獲取文章更新的內容,
??下面就是本書第一章的一個簡單總結,
源程式是如何存盤的
#include <stdio.h>
int main()
{
printf("hello,world\n");
return 0;
}
??以上程式是我們通過文本編輯器創建的文本檔案,保存為hello.c,源程式實際上就是一個由值0和1組成的位(又稱為位元)序列,8個位被組織成一組,稱為位元組,每個位元組表示程式中的某些文本字符,現代計算機都使用ASCII標準來表示文本字符,hello.c程式的ASCII文本字符如下所示,

??hello.c程式是以位元組序列的方式儲存在檔案中的,
??hello.c的表示方法說明了一個基本思想:系統中所有的資訊——包括磁盤檔案、記憶體中的程式、記憶體中存放的用戶資料以及網路上傳送的資料,都是由一串位元表示的,區分不同資料物件的唯一方法是我們讀到這些資料物件的背景關系,
源程式到可執行檔案的程序
??GCC編譯器驅動程式讀取源程式檔案hello.c,并把它翻譯成一個可執行目標檔案hello,這個翻譯程序可分為四個階段:預編譯,編譯,匯編,鏈接,

預編譯
??在預編譯的程序中,主要處理源代碼中的預處理指令,引入頭檔案,去除注釋,處理所有的條件編譯指令(#ifdef,#ifndef,#else,#elif,#endif),宏的替換,添加行號,保留所有的編譯器指令,
編譯
??在預處理結束后,進行的是編譯,編譯程序所進行的是對預處理后的檔案進行語法分析,詞法分析,語意分析,符號匯總,然后生成匯編代碼,
匯編
??匯編程序將匯編代碼轉成二進制檔案,二進制檔案就可以讓機器來讀取,每一潭訓編陳述句都會產生一句機器語言,
鏈接
??由匯編程式生成的目標檔案并不能立即就被執行,其中可能還有許多沒有解決的問題,例如,某個源檔案中的函式可能參考了另一個源檔案中定義的某個符號(如變數或者函式呼叫等);在程式中可能呼叫了某個庫檔案中的函式等等,所有這些問題,都需要經鏈接程式的處理方能得以解決,鏈接程式的主要作業就是將有關的目標檔案彼此相連接,也即將在一個檔案中參考的符號同該符號在另外一個檔案中的定義連接起來,使得所有的這些目標檔案成為一個能夠被作業系統裝入執行的統一整體,
shell是什么
??shell是一個命令列解釋器,它輸出一個提示符,等待輸入一個命令列,然后執行這個命令,如果該命令列的第一個單詞不是一個內置的shell命令,那么 shell就會假設這是個可執行檔案的名字,它將加載并運行這個檔案,
典型系統的硬體組成
總線
??貫穿整個系統的是一組電子通道,稱作總線,通常總線中傳輸的是固定長度的位元組塊,也就是字(word),字中的位元組數(字長)是一個基本的系統引數,不同系統字長不同,比如32位系統的字長為4個位元組,64位系統的字長為8個位元組,
IO設備
??I/O(輸入/輸出)設備是系統與外部世界的聯系通道,我們的示例系統包括四個I/O設備:作為用戶輸入的鍵盤和滑鼠,作為用戶輸出的顯示幕,以及用于長期存盤資料和程式的磁盤驅動器(簡單地說就是磁盤),
??每個IO設備都通過一個控制器或配接器與I/O總線相連,控制器和配接器之間的區別主要在于它們的封裝方式,控制器是I/O設備本身或者系統的主印制電路板(通常稱作主板)上的芯片組,而配接器則是一塊插在主板插槽上的卡,無論如何,它們的功能都是在I/O總線和I/O設備之間傳遞資訊,

主存
??主存是一個臨時存盤設備,在處理器執行程式時,用來存放程式和程式處理的資料,從物理上來說,主存是由一組動態隨機存取存盤器(DRAM)芯片組成的,從邏輯上來說,存盤器是一個線性的位元組陣列,每個位元組都有其唯一的地址(陣列索引),這些地址是從零開始的,
處理器
??中央處理單元(CPU),簡稱處理器,是執行存盤在主存中指令的引擎,處理器的核心是一個大小為一個字的存盤設備(或暫存器),稱為程式計數器(PC),在任何時刻,PC都指向主存中的某潭訓器語言指令(即含有該條指令的地址),
運行hello程式
??shell讀取到我們從鍵盤輸入的“./hello”后,計算機中的資訊流向如下圖紅線所示:
??鍵盤->USB控制器->I/O總線->I/O橋->系統總線->暫存器
??暫存器->系統總線->I/O橋->記憶體總線->主存
??shell程式需要把用戶輸入的內容作為一個變數使用,而這個變數一定在記憶體中有個地址,所以它最侄訓到達記憶體,

??當我們在鍵盤上敲回車鍵時, shell程式就知道我們已經結東了命令的輸入,然后shell執行一系列指令來加載可執行的hello檔案,這些指令將hello目標檔案中的代碼和資料從磁盤復制到主存,資料包括最侄訓被輸出的字串“ hello,wor1d\n”,資訊流向如下所示,
??磁盤->磁盤控制器->I/O總線->I/O橋->記憶體總線->主存
??這種訪問資料的方式資料不會經過CPU,而是直接從磁盤到主存,這種方式稱為DMA,DMA(直接存盤器訪問)有利于減輕CPU的負荷,使CPU可以在資料轉移的同時做其它任務,

??加載完hello檔案后,CPU將會開始從hello程式的主函式處執行指令,這些指令將“hello,world\n”字串中的位元組從主存復制到暫存器檔案,再從暫存器檔案中復制到顯示設備,最終顯示在螢屏上,資訊流向如下圖所示,
??主存->暫存器->系統總線->I/O橋->I/O總線->圖形配接器->顯示幕

高速快取
??通過運行hello程式,我們可以知道,指令和資料需要多次在暫存器、主存、磁盤之間來回復制,這些復制其實就是開銷,減慢了程式作業的速度,這個時候我們就需要高速快取存盤器(cache memory)來解決這個問題,

??L1高速快取的容量可以達到數萬位元組,訪問速度幾乎和訪問暫存器檔案一樣快,
??L2高速快取容量為數十萬到數百萬位元組,通過一條特殊的總線連接到處理器,行程訪問L2高速快取的時間要比訪問L1高速快取的時間長5倍,但是這仍然比訪問主存的時間快5~10倍,
??L1和L2高速快取是用一種叫做 靜態隨機訪問存盤器(SRAM) 的硬體技術實作的,
??高速快取區域性原理:程式具有訪問區域區域中的資料和代碼的趨勢,因此,高速快取存盤器作為暫時的集結區域,存放處理器近期可能會需要的資訊,
存盤設備的層次結構
??從上至下,設備的訪問速度越來越慢、容量越來越大,并且每位元組的造價也越來越便宜,暫存器檔案在層次結構中位于最頂部,也就是第0級或記為L0,
??存盤器層次結構的主要思想是上一層的存盤器作為低一層存盤器的高速快取,因此,暫存器檔案就是L1的高速快取,L1是L2的高速快取,L2是L3的高速快取,L3是主存的高速快取,而主存又是磁盤的高速快取,
作業系統管理硬體
??作業系統是應用程式和硬體之間插入的一層軟體,所有應用程式對硬體的操作嘗試都必須通過作業系統,
??作業系統有兩個基本功能:(1)防止硬體被失控的應用程式濫用;(2)向應用程式提供簡單一致的機制來控制復雜而又通常大不相同的低級硬體設備,
??作業系統通過幾個基本的抽象概念(行程、虛擬記憶體和檔案)來實作這兩個功能:檔案是對I/O設備的抽象表示,虛擬記憶體是對主存和磁盤I/O設備的抽象表示,行程則是對處理器、主存和I/O設備的抽象表示,

行程&執行緒
??行程是作業系統對一個正在運行的程式的一種抽象,在一個系統上可以同時運行多個行程,而每個行程都好像在獨占地使用硬體,而并發運行,則是說一個行程的指令和另個行程的指令是交錯執行的,
??背景關系:作業系統保持和跟蹤行程運行所需的所有狀態資訊(PC值,主存的內容等),
??背景關系切換:作業系統通過控制處理器在行程間切換以達到交錯執行的目的,
??從一個行程到另一個行程的轉換是由作業系統內核( kernel)管理的,內核是作業系統代碼常駐主存的部分,內核不是一個獨立的行程,相反,它是系統管理全部行程所用代碼和資料結構的集合,
一個行程由多個稱為執行緒的執行單元組成,每個執行緒都運行在行程的背景關系中,并共享同樣的代碼和全域資料,多執行緒比多行程更容易共享資料,而且執行緒間切換所有的開銷要遠小于行程切換,
虛擬記憶體
??虛擬記憶體是一個抽象概念,它為每個行程提供了一個假象,即每個行程都在獨占地使用主存,每個行程看到的記憶體都是一致的,稱為虛擬地址空間,
??上圖將虛擬地址空間分為了若干個部分,并用箭頭表示該部分的擴展方向,最下端地址為0,向上地址逐漸增長,每個部分作用如下:
?? 程式代碼和資料: 存放可執行程式代碼和代碼中的全域變數,
??堆: 用于動態申請的記憶體變數,比如malloc函式申請的動態記憶體空間,可以向上擴展,
??共享庫: 用于存放C語言庫函式的代碼和資料,本例中即printf的代碼和資料,
??堆疊: 位于虛擬地址空間的頂部,用于函式呼叫、存放區域變數等,當我們呼叫一個函式時,堆疊會向下擴展,回傳時,向上收縮,
??內核虛擬記憶體: 地址空間頂部的區域是為內核保留的,不允許應用程式讀寫這個區域的內容或者直接呼叫內核代碼定義的函式,相反,它們必須呼叫內核來執行這些操作,對于一個64為的作業系統來說,用戶空間為0-3G,內核空間為3G-4G,(用戶空間和內核空間有何區別,見秋招資料整理中的嵌入式軟體工程師筆試面試知識點總結)
并發&并行
??并行:指在同一時刻,有多條指令在多個處理器上同時執行,所以無論從微觀還是從宏觀來看,二者都是一起執行的,

??并發:指在同一時刻只能有一條指令執行,但多個行程指令被快速的輪換執行,使得在宏觀上具有多個行程同時執行的效果,但在微觀上并不是同時執行的,只是把時間分成若干段,使多個行程快速交替的執行,

多核處理器&多執行緒
??多核處理器:多核處理器是將多個CPU(稱為“核”)集成到一個集成電路芯片上,如下圖所示,微處理器芯片有4個CPU核,每個核都有自己的L1和L2高速快取,其中的L1高速快取分為兩個部分——一個保存最近取到的指令,另一個存放資料,這些核共享更高層次的高速快取,以及到主存的介面,
??超執行緒:超執行緒,有時稱為同時多執行緒( simultaneous multi-threading),是一項允許一個CPU執行多個控制流的技術,舉個例子,Intel Core i7處理器可以讓每個核執行兩個執行緒,所以一個4核的系統實際上可以并行地執行8個執行緒,
??養成習慣,先贊后看!如果覺得寫的不錯,歡迎一鍵三連,謝謝!
CSDN:點擊訪問我的CSDN博客
歡迎歡迎關注我的公眾號:嵌入式與Linux那些事,領取秋招筆試面試大禮包(華為小米等大廠面經,嵌入式知識點總結,筆試題目,簡歷模版等)和2000G學習資料,

轉載請註明出處,本文鏈接:https://www.uj5u.com/caozuo/231263.html
標籤:嵌入式
