行程基本概念
- 馮諾提曼體系
- 一、作業系統
- 概念
- 設計OS的目的
- 定位
- 二、行程
- 概念
- 描述行程-PCB
- task_ struct內容分類
- 組織行程
- 三、查看行程
- fork創建子行程
- 行程狀態查看
- 僵尸行程危害
- 孤兒行程
- 四、行程優先級
- 查看系統行程
- PRI and NI
- 查看行程優先級
- 其他概念
- 五、環境變數
- 常見環境變數
- 查看環境變數
- 測驗PATH
- 測驗HOME
- 相關命令
- 組織方式
- 語言操作環境變數
- 六、程式地址空間
- 行程地址空間
馮諾提曼體系
馮諾依曼體系結構:
我們常見的計算機,如筆記本,我們不常見的計算機,如服務器,大部分都遵守馮諾依曼體系,

我們的計算機都是由硬體構成:
輸入設備:鍵盤,滑鼠,寫字板等
處理器(CPU):含有運算器和控制器等
輸出單元:顯示幕,列印機等,
關于馮諾依曼強調幾點:
存盤器其實指的就是記憶體,
CPU只能對記憶體進行讀寫,不能訪問其他的外設設備,
外設想獲取資料,也只能從記憶體中獲取,
所以,所有的設備都只能和記憶體打交道,
此外,越靠近CPU,存盤的效率越高,單價就越高,所以他的容量一般就很小,
以為CPU的執行效率比硬體快得多,所以記憶體和外設設備可以被充當做緩沖區,計算機的運行速度取決于效率低的一方,也就是木桶效應,
一、作業系統
概念
作業系統是一個基本的程式集合,成為作業系統(OS),作業系統包括:
內核(行程管理,記憶體管理,檔案管理,驅動管理)
其他程式(例如函式庫,shell程式等等)
設計OS的目的
與硬體互動,管理硬體資源
與軟體應用程式互動,為用戶提供好的環境,
定位
作業系統是一個搞管理的軟體
管理的六個字:
先描述再組織,

作業系統管理的方式是:
先描述:用struct描述出來,
在組織:用鏈表或者其他高效的資料結構,
二、行程
在描述行程之前,用上面的話說管理行程就是先把它描述出來,再組織
概念
基本概念:一個正在運行的物體,正在執行的程式,
內核概念:擔當分配資源的物體(占用記憶體,CPU時間),
描述行程-PCB
行程資訊被放在一個叫做行程控制塊的資料結構中,可以理解為行程屬性的集合,
課本上稱之為PCB(process control block),Linux作業系統下的PCB是: task_struct
task_struct是PCB的一種,這種資料結構會被裝載到記憶體中并且包含著記憶體的資訊,
task_ struct內容分類
標示符: 描述本行程的唯一標示符,用來區別其他行程,Pid,PPid,
狀態: 任務狀態,退出代碼,退出信號等,
優先級: 相對于其他行程的優先級,
程式計數器: 程式中即將被執行的下一條指令的地址,
記憶體指標: 包括程式代碼和行程相關資料的指標,還有和其他行程共享的記憶體塊的指標,
背景關系資料: 行程執行時處理器的暫存器中的資料[休學例子,要加圖CPU,暫存器],
I/O狀態資訊: 包括顯示的I/O請求,分配給行程的I/O設備和被行程使用的檔案串列,
記賬資訊: 可能包括處理器時間總和,使用的時鐘數總和,時間限制,記賬號等,
其他資訊
組織行程
可以在內核源代碼里找到它,所有運行在系統里的行程都以task_struct鏈表的形式存在內核里,
三、查看行程
第一種方式:行程的資訊可以通過 /proc 系統檔案夾查看

在這些數字中可找到正在運行行程的行程號,
第二種方式:通過ps aux | grep mybin | grep -v grep查找正在運行的行程

fork創建子行程
行程id(PID)
父行程id(PPID)

輸出結果:

從上可以看出fork()之后會再生成一個行程bash是原始行程的父行程,fork之后生成的是子行程,

fork會有兩個回傳值,一個是父行程的回傳值,回傳子行程的pid,還有一個是子行程的回傳值0,
這里就有幾個問題:
1.如何理解行程創建?
創建行程,系統就多了一組管理行程的資料結構和該行程的代碼和資料,
父子行程資料是各自私有的,但代碼共用一份,采用寫時拷貝,可節省系統的空間,
2.fork為什么會有兩個回傳值,如何理解呢?
因為fork函式執行有return函式,存在回傳值,父行程會執行return,子行程也會執行,
3.fork父子執行順序和代碼和資料復制的問題,
行程資料=代碼+資料
父行程創建子行程的時候,代碼是共享的,但資料各自私有一份(寫時拷貝)
代碼是邏輯,一般是不可修改的
而資料可讀可寫,
當父行程fork創建子行程完畢,剩下的代碼誰先運行,這個不確定,由系統調度器決定,
4.為什么父行程回傳的是子行程pid,子行程回傳的是0,
具體的作業系統實作會有所不同,
行程狀態查看
為了弄明白正在運行的行程是什么意思,我們需要知道行程的不同狀態,一個行程可以有幾個狀態(在
Linux內核里,行程有時候也叫做任務),
下面的狀態在kernel源代碼里定義:
/*
* The task state array is a strange "bitmap" of
* reasons to sleep. Thus "running" is zero, and
* you can test for combinations of others with
* simple bit tests.
*/
static const char * const task_state_array[] = {
"R (running)", /* 0 */
"S (sleeping)", /* 1 */
"D (disk sleep)", /* 2 */
"T (stopped)", /* 4 */
"t (tracing stop)", /* 8 */
"X (dead)", /* 16 */
"Z (zombie)", /* 32 */
};
行程狀態:
R運行狀態(running): 并不意味著行程一定在運行中,它表明行程要么是在運行中要么在運行佇列里,
S睡眠狀態(sleeping): 意味著行程在等待事件完成(這里的睡眠有時候也叫做可中斷睡眠(interruptible sleep)),
D磁盤休眠狀態(Disk sleep)有時候也叫不可中斷睡眠狀態(uninterruptible sleep),在這個狀態的行程通常會等待IO的結束,該狀態無法被作業系統殺掉,也是深度睡眠狀態,
T停止狀態(stopped): 可以通過發送 SIGSTOP 信號給行程來停止(T)行程,這個被暫停的行程可以通過發送 SIGCONT 信號讓行程繼續運行,
X死亡狀態(dead):這個狀態只是一個回傳狀態,你不會在任務串列里看到這個狀態,
ps aux 或者 ps axj 命令

這里就有一個面試題,狀態是R的行程他一定在CPU上面跑嗎?
這個不一定,
下圖為行程在記憶體中的佇列,

佇列有幾種不同的狀態,分別是運行佇列,等待佇列,阻塞佇列,而處于R狀態的行程是要么在運行中,要么在等待佇列中,
Z(zombie)-僵尸行程
僵死狀態(Zombies)是一個比較特殊的狀態,當行程退出并且父行程(使用wait()系統呼叫,)沒有讀取到子行程退出的回傳代碼時就會產生僵死(尸)行程僵死行程會以終止狀態保持在行程表中,并且會一直在等待父行程讀取退出狀態代碼,所以,只要子行程退出,父行程還在運行,但父行程沒有讀取子行程狀態,子行程進入Z狀態,
測驗代碼:


僵尸行程危害
??行程的退出狀態必須被維持下去,因為他要告訴關心它的行程(父行程),你交給我的任務,我辦的怎么樣了,可父行程如果一直不讀取,那子行程就一直處于Z狀態?是的!維護退出狀態本身就是要用資料維護,也屬于行程基本資訊,所以保存在task_struct(PCB)中,換句話說,Z狀態一直不退出,PCB一直都要維護?是的!那一個父行程創建了很多子行程,就是不回收,是不是就會造成記憶體資源的浪費?是的!因為資料結構物件本身就要占用記憶體,想想C中定義一個結構體變數(物件),是要在記憶體的某個位置進行開辟空間!造成記憶體泄漏,
為什么會有僵尸狀態?
因為僵尸狀態的時候,task_struct會被保留,以便于父行程獲得退出原因,然后再將它回收,
Linux中echo $? 會獲得最近一個退出行程的退出碼,
孤兒行程
父行程如果提前退出,那么子行程后退出,進入Z之后,那該如何處理呢?
父行程先退出,子行程就稱之為“孤兒行程”
如果沒有行程將它領養,將會造成記憶體泄漏,
孤兒行程被1號systemd行程領養,要有systemd行程回收,
四、行程優先級
cpu資源分配的先后順序,就是指行程的優先權(priority),
優先權高的行程有優先執行權利,配置行程優先權對多任務環境的linux很有用,可以改善系統性能,
還可以把行程運行到指定的CPU上,這樣一來,把不重要的行程安排到某個CPU,可以大大改善系統整體性能,
查看系統行程

UID : 代表執行者的身份
PID : 代表這個行程的代號
PPID :代表這個行程是由哪個行程發展衍生而來的,亦即父行程的代號
PRI :代表這個行程可被執行的優先級,其值越小越早被執行
NI :代表這個行程的nice值
PRI and NI
PRI也還是比較好理解的,即行程的優先級,或者通俗點說就是程式被CPU執行的先后順序,此值越小行程的優先級別越高
那NI呢?就是我們所要說的nice值了,其表示行程可被執行的優先級的修正數值
PRI值越小越快被執行,那么加入nice值后,將會使得PRI變為:PRI(new)=PRI(old)+nice
這樣,當nice值為負值的時候,那么該程式將會優先級值將變小,即其優先級會變高,則其越快被執行
所以,調整行程優先級,在Linux下,就是調整行程nice值
需要強調一點的是,行程的nice值不是行程的優先級,他們不是一個概念,但是行程nice值會影響到行程的優先級變化,可以理解nice值是行程優先級的修正修正資料,

正常情況下,PRI默認值為80,Nice默認值為20,它的取值范圍是[-20,19],一共40個級別,
查看行程優先級
用top命令更改已存在行程的nice
top
進入top后按“r”–>輸入行程PID–>輸入nice值
因為系統默認的優先級是合理的,除非特殊情況下,行程優先級不修改,
其他概念
競爭性: 系統行程數目眾多,而CPU資源只有少量,甚至1個,所以行程之間是具有競爭屬性的,為了高效完成任務,更合理競爭相關資源,便具有了優先級,
獨立性: 多行程運行,需要獨享各種資源,多行程運行期間互不干擾,
并行: 多個行程在多個CPU下分別,同時進行運行,這稱之為并行,
并發: 多個行程在一個CPU下采用行程切換的方式,在一段時間之內,讓多個行程都得以推進,稱之為并發,
五、環境變數
環境變數(environment variables)一般是指在作業系統中用來指定作業系統運行環境的一些引數,
如:我們在撰寫C/C++代碼的時候,在鏈接的時候,從來不知道我們的所鏈接的動態靜態庫在哪里,但是照樣可以鏈接成功,生成可執行程式,原因就是有相關環境變數幫助編譯器進行查找,
環境變數通常具有某些特殊用途,還有在系統當中通常具有全域特性,
如何理解環境變數?
當我們執行一個行程的時候,在硬體上,會把該行程的從硬碟上加載到記憶體;在軟體上,作業系統會為他創建一個task_struct,
正常情況下運行一個程式或命令需要帶上路徑,

而ls有它的默認查找路徑!PATH環境變數當中,
常見環境變數
PATH : 指定命令的搜索路徑
HOME : 指定用戶的主作業目錄(即用戶登陸到Linux系統中時,默認的目錄)
SHELL : 當前Shell,它的值通常是/bin/bash,
查看環境變數
echo $NAME //NAME:你的環境變數名稱
測驗PATH
匯入/usr/bin可直接使用nice行程指令,

這種不推薦,會污染環境變數,
還有一種將當前路徑匯入環境變數,這種不污染,

測驗HOME
用root和普通用戶,分別執行 echo $HOME ,對比差異
. 執行 cd ~; pwd ,對應 ~ 和 HOME 的關系

相關命令
- echo: 顯示某個環境變數值
- export: 設定一個新的環境變數
- env: 顯示所有環境變數
- unset: 清除環境變數
- set: 顯示本地定義的shell變數和環境變數
組織方式

每個程式都會收到一張環境表,環境表是一個字符指標陣列,每個指標指向一個以’\0’結尾的環境字串
SHELL
是什么?系統中的某些具有一定全域性質的變數,通常是為了滿足某些系統需求,
為什么?系統的全域變數是為了方便用戶,開發者,系統進行某種最簡單化的查找,定位,確認等等問題,
怎么辦?命令列,env,export,PATH,SHELL,HOME,
語言操作環境變數



六、程式地址空間
我們寫代碼以及運行記憶體如下圖所示,

我們先用一段代碼來測驗一下:

運行后地址如下:

再來段代碼感受一下,


我們發現,父子行程,輸出地址是一致的,但是變數內容不一樣!能得出如下結論:
變數內容不一樣,所以父子行程輸出的變數絕對不是同一個變數
但地址值是一樣的,說明,該地址絕對不是物理地址!
在Linux地址下,這種地址叫做 虛擬地址
我們在用C/C++語言所看到的地址,全部都是虛擬地址!物理地址,用戶一概看不到,由OS統一管理
這里就有一個問題:程式地址空間是記憶體嗎?
實際上,地址空間它不是物理記憶體,它是虛擬地址,
父子行程訪問的資料,被保存到了不同物理記憶體中,
行程地址空間

我們的行程所占用的是虛擬記憶體,虛擬記憶體先映射到頁表上,然后再由頁表去映射到物理記憶體中,
什么是地址空間?為什么?
當我們使用的地址違法時,物理地址無法識別,可能就寫壞了別人的空間或資料,
轉載請註明出處,本文鏈接:https://www.uj5u.com/qita/398558.html
標籤:其他
上一篇:Dokcer 橋接模式原理決議
