主頁 > 作業系統 > 【原創】(一)Linux行程調度器-基礎

【原創】(一)Linux行程調度器-基礎

2020-09-30 06:11:40 作業系統

背景

  • Read the fucking source code! --By 魯迅
  • A picture is worth a thousand words. --By 高爾基

說明:

  1. Kernel版本:4.14
  2. ARM64處理器,Contex-A53,雙核
  3. 使用工具:Source Insight 3.5, Visio

1. 概述

從這篇文章開始,將開始Linux調度器的系列研究了,
本文也會從一些基礎的概念及資料結構入手,先打造一個粗略的輪廓,后續的文章將逐漸深入,

2. 概念

2.1 行程

  • 從教科書上,我們都能知道:行程是資源分配的最小單位,而執行緒是CPU調度的的最小單位,
  • 行程不僅包括可執行程式的代碼段,還包括一系列的資源,比如:打開的檔案、記憶體、CPU時間、信號量、多個執行執行緒流等等,而執行緒可以共享行程內的資源空間,
  • 在Linux內核中,行程和執行緒都使用struct task_struct結構來進行抽象描述,
  • 行程的虛擬地址空間分為用戶虛擬地址空間和內核虛擬地址空間,所有行程共享內核虛擬地址空間,沒有用戶虛擬地址空間的行程稱為內核執行緒,

Linux內核使用task_struct結構來抽象,該結構包含了行程的各類資訊及所擁有的資源,比如行程的狀態、打開的檔案、地址空間資訊、信號資源等等,task_struct結構很復雜,下邊只針對與調度相關的某些欄位進行介紹,

struct task_struct {
    /* ... */
    
    /* 行程狀態 */
    volatile long			state;

    /* 調度優先級相關,策略相關 */
	int				prio;
	int				static_prio;
	int				normal_prio;
	unsigned int			rt_priority;
    unsigned int			policy;
    
    /* 調度類,調度物體相關,任務組相關等 */
    const struct sched_class	*sched_class;
	struct sched_entity		se;
	struct sched_rt_entity		rt;
#ifdef CONFIG_CGROUP_SCHED
	struct task_group		*sched_task_group;
#endif
	struct sched_dl_entity		dl;
    
    /* 行程之間的關系相關 */
    	/* Real parent process: */
	struct task_struct __rcu	*real_parent;

	/* Recipient of SIGCHLD, wait4() reports: */
	struct task_struct __rcu	*parent;

	/*
	 * Children/sibling form the list of natural children:
	 */
	struct list_head		children;
	struct list_head		sibling;
	struct task_struct		*group_leader;
    
    /* ... */
}

2.2 行程狀態

  • 上圖中左側為作業系統中通俗的行程三狀態模型,右側為Linux對應的行程狀態切換,每一個標志描述了行程的當前狀態,這些狀態都是互斥的;
  • Linux中的就緒態運行態對應的都是TASK_RUNNING標志位,就緒態表示行程正處在佇列中,尚未被調度;運行態則表示行程正在CPU上運行;

內核中主要的狀態欄位定義如下

/* Used in tsk->state: */
#define TASK_RUNNING			0x0000
#define TASK_INTERRUPTIBLE		0x0001
#define TASK_UNINTERRUPTIBLE		0x0002

/* Used in tsk->exit_state: */
#define EXIT_DEAD			0x0010
#define EXIT_ZOMBIE			0x0020
#define EXIT_TRACE			(EXIT_ZOMBIE | EXIT_DEAD)

/* Used in tsk->state again: */
#define TASK_PARKED			0x0040
#define TASK_DEAD			0x0080
#define TASK_WAKEKILL			0x0100
#define TASK_WAKING			0x0200
#define TASK_NOLOAD			0x0400
#define TASK_NEW			0x0800
#define TASK_STATE_MAX			0x1000

/* Convenience macros for the sake of set_current_state: */
#define TASK_KILLABLE			(TASK_WAKEKILL | TASK_UNINTERRUPTIBLE)
#define TASK_STOPPED			(TASK_WAKEKILL | __TASK_STOPPED)
#define TASK_TRACED			(TASK_WAKEKILL | __TASK_TRACED)

#define TASK_IDLE			(TASK_UNINTERRUPTIBLE | TASK_NOLOAD)

2.3 scheduler 調度器

  • 所謂調度,就是按照某種調度的演算法,從行程的就緒佇列中選取行程分配CPU,主要是協調對CPU等的資源使用,行程調度的目標是最大限度利用CPU時間,

內核默認提供了5個調度器,Linux內核使用struct sched_class來對調度器進行抽象:

  1. Stop調度器, stop_sched_class:優先級最高的調度類,可以搶占其他所有行程,不能被其他行程搶占;
  2. Deadline調度器, dl_sched_class:使用紅黑樹,把行程按照絕對截止期限進行排序,選擇最小行程進行調度運行;
  3. RT調度器, rt_sched_class:實時調度器,為每個優先級維護一個佇列;
  4. CFS調度器, cfs_sched_class:完全公平調度器,采用完全公平調度演算法,引入虛擬運行時間概念;
  5. IDLE-Task調度器, idle_sched_class:空閑調度器,每個CPU都會有一個idle執行緒,當沒有其他行程可以調度時,調度運行idle執行緒;

Linux內核提供了一些調度策略供用戶程式來選擇調度器,其中Stop調度器IDLE-Task調度器,僅由內核使用,用戶無法進行選擇:

  • SCHED_DEADLINE:限期行程調度策略,使task選擇Deadline調度器來調度運行;
  • SCHED_RR:實時行程調度策略,時間片輪轉,行程用完時間片后加入優先級對應運行佇列的尾部,把CPU讓給同優先級的其他行程;
  • SCHED_FIFO:實時行程調度策略,先進先出調度沒有時間片,沒有更高優先級的情況下,只能等待主動讓出CPU;
  • SCHED_NORMAL:普通行程調度策略,使task選擇CFS調度器來調度運行;
  • SCHED_BATCH:普通行程調度策略,批量處理,使task選擇CFS調度器來調度運行;
  • SCHED_IDLE:普通行程調度策略,使task以最低優先級選擇CFS調度器來調度運行;

2.4 runqueue 運行佇列

  • 每個CPU都有一個運行佇列,每個調度器都作用于運行佇列;
  • 分配給CPU的task,作為調度物體加入到運行佇列中;
  • task首次運行時,如果可能,盡量將它加入到父task所在的運行佇列中(分配給相同的CPU,快取affinity會更高,性能會有改善);

Linux內核使用struct rq結構來描述運行佇列,關鍵欄位如下:

/*
 * This is the main, per-CPU runqueue data structure.
 *
 * Locking rule: those places that want to lock multiple runqueues
 * (such as the load balancing or the thread migration code), lock
 * acquire operations must be ordered by ascending &runqueue.
 */
struct rq {
	/* runqueue lock: */
	raw_spinlock_t lock;

	/*
	 * nr_running and cpu_load should be in the same cacheline because
	 * remote CPUs use both these fields when doing load calculation.
	 */
	unsigned int nr_running;
    
    /* 三個調度佇列:CFS調度,RT調度,DL調度 */
	struct cfs_rq cfs;
	struct rt_rq rt;
	struct dl_rq dl;

    /* stop指向遷移內核執行緒, idle指向空閑內核執行緒 */
    struct task_struct *curr, *idle, *stop;
    
    /* ... */
}    

2.5 task_group 任務分組

  • 利用任務分組的機制,可以設定或限制任務組對CPU的利用率,比如將某些任務限制在某個區間內,從而不去影響其他任務的執行效率;
  • 引入task_group后,調度器的調度物件不僅僅是行程了,Linux內核抽象出了sched_entity/sched_rt_entity/sched_dl_entity描述調度物體,調度物體可以是行程或task_group
  • 使用資料結構struct task_group來描述任務組,任務組在每個CPU上都會維護一個CFS調度物體、CFS運行佇列,RT調度物體,RT運行佇列

Linux內核使用struct task_group來描述任務組,關鍵的欄位如下:

/* task group related information */
struct task_group {
    /* ... */

    /* 為每個CPU都分配一個CFS調度物體和CFS運行佇列 */
#ifdef CONFIG_FAIR_GROUP_SCHED
	/* schedulable entities of this group on each cpu */
	struct sched_entity **se;
	/* runqueue "owned" by this group on each cpu */
	struct cfs_rq **cfs_rq;
	unsigned long shares;
#endif

    /* 為每個CPU都分配一個RT調度物體和RT運行佇列 */
#ifdef CONFIG_RT_GROUP_SCHED
	struct sched_rt_entity **rt_se;
	struct rt_rq **rt_rq;

	struct rt_bandwidth rt_bandwidth;
#endif

    /* task_group之間的組織關系 */
	struct rcu_head rcu;
	struct list_head list;

	struct task_group *parent;
	struct list_head siblings;
	struct list_head children;

    /* ... */
};

3. 調度程式

調度程式依靠幾個函式來完成調度作業的,下邊將介紹幾個關鍵的函式,

  1. 主動調度 - schedule()
  • schedule()函式,是行程調度的核心函式,大體的流程如上圖所示,
  • 核心的邏輯:選擇另外一個行程來替換掉當前運行的行程,行程的選擇是通過行程所使用的調度器中的pick_next_task函式來實作的,不同的調度器實作的方法不一樣;行程的替換是通過context_switch()來完成切換的,具體的細節后續的文章再深入分析,
  1. 周期調度 - schedule_tick()
  • 時鐘中斷處理程式中,呼叫schedule_tick()函式;
  • 時鐘中斷是調度器的脈搏,內核依靠周期性的時鐘來處理器CPU的控制權;
  • 時鐘中斷處理程式,檢查當前行程的執行時間是否超額,如果超額則設定重新調度標志(_TIF_NEED_RESCHED);
  • 時鐘中斷處理函式回傳時,被中斷的行程如果在用戶模式下運行,需要檢查是否有重新調度標志,設定了則呼叫schedule()調度;
  1. 高精度時鐘調度 - hrtick()
  • 高精度時鐘調度,與周期性調度類似,不同點在于周期調度的精度為ms級別,而高精度調度的精度為ns級別;
  • 高精度時鐘調度,需要有對應的硬體支持;
  1. 行程喚醒時調度 - wake_up_process()
  • 喚醒行程時呼叫wake_up_process()函式,被喚醒的行程可能搶占當前的行程;

上述講到的幾個函式都是常用于調度時呼叫,此外,在創建新行程時,或是在內核搶占時,也會出現一些調度點,

本文只是粗略的介紹了一個大概,后續將針對某些模塊進行更加深入的分析,敬請期待,

轉載請註明出處,本文鏈接:https://www.uj5u.com/caozuo/141112.html

標籤:Linux

上一篇:《作業碰上的技術問題及處理經驗》(四)

下一篇:Linux系統的安裝和常用命令

標籤雲
其他(157675) Python(38076) JavaScript(25376) Java(17977) C(15215) 區塊鏈(8255) C#(7972) AI(7469) 爪哇(7425) MySQL(7132) html(6777) 基礎類(6313) sql(6102) 熊猫(6058) PHP(5869) 数组(5741) R(5409) Linux(5327) 反应(5209) 腳本語言(PerlPython)(5129) 非技術區(4971) Android(4554) 数据框(4311) css(4259) 节点.js(4032) C語言(3288) json(3245) 列表(3129) 扑(3119) C++語言(3117) 安卓(2998) 打字稿(2995) VBA(2789) Java相關(2746) 疑難問題(2699) 细绳(2522) 單片機工控(2479) iOS(2429) ASP.NET(2402) MongoDB(2323) 麻木的(2285) 正则表达式(2254) 字典(2211) 循环(2198) 迅速(2185) 擅长(2169) 镖(2155) 功能(1967) .NET技术(1958) Web開發(1951) python-3.x(1918) HtmlCss(1915) 弹簧靴(1913) C++(1909) xml(1889) PostgreSQL(1872) .NETCore(1853) 谷歌表格(1846) Unity3D(1843) for循环(1842)

熱門瀏覽
  • CA和證書

    1、在 CentOS7 中使用 gpg 創建 RSA 非對稱密鑰對 gpg --gen-key #Centos上生成公鑰/密鑰對(存放在家目錄.gnupg/) 2、將 CentOS7 匯出的公鑰,拷貝到 CentOS8 中,在 CentOS8 中使用 CentOS7 的公鑰加密一個檔案 gpg -a ......

    uj5u.com 2020-09-10 00:09:53 more
  • Kubernetes K8S之資源控制器Job和CronJob詳解

    Kubernetes的資源控制器Job和CronJob詳解與示例 ......

    uj5u.com 2020-09-10 00:10:45 more
  • VMware下安裝CentOS

    VMware下安裝CentOS 一、軟硬體準備 1 Centos鏡像準備 1.1 CentOS鏡像下載地址 下載地址 1.2 CentOS鏡像下載程序 點擊下載地址進入如下圖的網站,選擇需要下載的版本,這里選擇的是Centos8,點擊如圖所示。 決定選擇Centos8后,選擇想要的鏡像源進行下載,此 ......

    uj5u.com 2020-09-10 00:12:10 more
  • 如何使用Grep命令查找多個字串

    如何使用Grep 命令查找多個字串 大家好,我是良許! 今天向大家介紹一個非常有用的技巧,那就是使用 grep 命令查找多個字串。 簡單介紹一下,grep 命令可以理解為是一個功能強大的命令列工具,可以用它在一個或多個輸入檔案中搜索與正則運算式相匹配的文本,然后再將每個匹配的文本用標準輸出的格式 ......

    uj5u.com 2020-09-10 00:12:28 more
  • git配置http代理

    git配置http代理 經常遇到克隆 github 慢的問題,這里記錄一下幾種配置 git 代理的方法,解決 clone github 過慢。 目錄 git配置代理 git單獨配置github代理 git配置全域代理 配置終端環境變數 git配置代理 主要使用 git config 命令 git單獨 ......

    uj5u.com 2020-09-10 00:12:33 more
  • Linux npm install 裝包時提示Error EACCES permission denied解

    npm install 裝包時提示Error EACCES permission denied解決辦法 ......

    uj5u.com 2020-09-10 00:12:53 more
  • Centos 7下安裝nginx,使用yum install nginx,提示沒有可用的軟體包

    Centos 7下安裝nginx,使用yum install nginx,提示沒有可用的軟體包。 18 (flaskApi) [root@67 flaskDemo]# yum -y install nginx 19 已加載插件:fastestmirror, langpacks 20 Loading ......

    uj5u.com 2020-09-10 00:13:13 more
  • Linux查看服務器暴力破解ssh IP

    在公網的服務器上經常遇到別人爆破你服務器的22埠,用來挖礦或者干其他嘿嘿嘿的事情~ 這種情況下正確的做法是: 修改默認ssh的22埠 使用設定密鑰登錄或者白名單ip登錄 建議服務器密碼為復雜密碼 創建普通用戶登錄服務器(root權限過大) 建立堡壘機,實作統一管理服務器 統計爆破IP [root ......

    uj5u.com 2020-09-10 00:13:17 more
  • CentOS 7系統常見快捷鍵操作方式

    Linux系統中一些常見的快捷方式,可有效提高操作效率,在某些時刻也能避免操作失誤帶來的問題。 ......

    uj5u.com 2020-09-10 00:13:31 more
  • CentOS 7作業系統目錄結構介紹

    作業系統存在著大量的資料檔案資訊,相應檔案資訊會存在于系統相應目錄中,為了更好的管理資料資訊,會將系統進行一些目錄規劃,不同目錄存放不同的資源。 ......

    uj5u.com 2020-09-10 00:13:35 more
最新发布
  • vim的常用命令

    Vim的6種基本模式 1. 普通模式在普通模式中,用的編輯器命令,比如移動游標,洗掉文本等等。這也是Vim啟動后的默認模式。這正好和許多新用戶期待的操作方式相反(大多數編輯器默認模式為插入模式)。 2. 插入模式在這個模式中,大多數按鍵都會向文本緩沖中插入文本。大多數新用戶希望文本編輯器編輯程序中一 ......

    uj5u.com 2023-04-20 08:43:21 more
  • vim的常用命令

    Vim的6種基本模式 1. 普通模式在普通模式中,用的編輯器命令,比如移動游標,洗掉文本等等。這也是Vim啟動后的默認模式。這正好和許多新用戶期待的操作方式相反(大多數編輯器默認模式為插入模式)。 2. 插入模式在這個模式中,大多數按鍵都會向文本緩沖中插入文本。大多數新用戶希望文本編輯器編輯程序中一 ......

    uj5u.com 2023-04-20 08:42:36 more
  • docker學習

    ###Docker概述 真實專案部署環境可能非常復雜,傳統發布專案一個只需要一個jar包,運行環境需要單獨部署。而通過Docker可將jar包和相關環境(如jdk,redis,Hadoop...)等打包到docker鏡像里,將鏡像發布到Docker倉庫,部署時下載發布的鏡像,直接運行發布的鏡像即可。 ......

    uj5u.com 2023-04-19 09:26:53 more
  • 設定Windows主機的瀏覽器為wls2的默認瀏覽器

    這里以Chrome為例。 1. 準備作業 wsl是可以使用Windows主機上安裝的exe程式,出于安全考慮,默認情況下改功能是無法使用。要使用的話,終端需要以管理員權限啟動。 我這里以Windows Terminal為例,介紹如何默認使用管理員權限打開終端,具體操作如下圖所示: 2. 操作 wsl ......

    uj5u.com 2023-04-19 09:25:49 more
  • docker學習

    ###Docker概述 真實專案部署環境可能非常復雜,傳統發布專案一個只需要一個jar包,運行環境需要單獨部署。而通過Docker可將jar包和相關環境(如jdk,redis,Hadoop...)等打包到docker鏡像里,將鏡像發布到Docker倉庫,部署時下載發布的鏡像,直接運行發布的鏡像即可。 ......

    uj5u.com 2023-04-19 09:19:04 more
  • Linux學習筆記

    IP地址和主機名 IP地址 ifconfig可以用來查詢本機的IP地址,如果不能使用,可以通過install net-tools安裝。 Centos系統下ens33表示主網卡;inet后表示IP地址;lo表示本地回環網卡; 127.0.0.1表示代指本機;0.0.0.0可以用于代指本機,同時在放行設 ......

    uj5u.com 2023-04-18 06:52:01 more
  • 解決linux系統的kdump服務無法啟動的問題

    問題:專案麒麟系統服務器的kdump服務無法啟動,沒有相關日志無法定位問題。 1、查看服務狀態是關閉的,重啟系統也無法啟動 systemctl status kdump 2、修改grub引數,修改“crashkernel”為“512M(有的機器數值太大太小都會導致報錯,建議從128M開始試,或者加個 ......

    uj5u.com 2023-04-12 09:59:50 more
  • 解決linux系統的kdump服務無法啟動的問題

    問題:專案麒麟系統服務器的kdump服務無法啟動,沒有相關日志無法定位問題。 1、查看服務狀態是關閉的,重啟系統也無法啟動 systemctl status kdump 2、修改grub引數,修改“crashkernel”為“512M(有的機器數值太大太小都會導致報錯,建議從128M開始試,或者加個 ......

    uj5u.com 2023-04-12 09:59:01 more
  • 你是不是暴露了?

    作者:袁首京 原創文章,轉載時請保留此宣告,并給出原文連接。 如果您是計算機相關從業人員,那么應該經歷不止一次網路安全專項檢查了,你肯定是收到過資訊系統技術檢測報告,要求你加強風險監測,確保你提供的系統服務堅實可靠了。 沒檢測到問題還好,檢測到問題的話,有些處理起來還是挺麻煩的,尤其是線上正在運行的 ......

    uj5u.com 2023-04-05 16:52:56 more
  • 細節拉滿,80 張圖帶你一步一步推演 slab 記憶體池的設計與實作

    1. 前文回顧 在之前的幾篇記憶體管理系列文章中,筆者帶大家從宏觀角度完整地梳理了一遍 Linux 記憶體分配的整個鏈路,本文的主題依然是記憶體分配,這一次我們會從微觀的角度來探秘一下 Linux 內核中用于零散小記憶體塊分配的記憶體池 —— slab 分配器。 在本小節中,筆者還是按照以往的風格先帶大家簡單 ......

    uj5u.com 2023-04-05 16:44:11 more