Linux行程詳解-有解無憂

Linux服務器開發相關視頻決議：

linux內核，行程調度器的實作，完全公平調度器 CFS
BAT面試必備：多執行緒、多行程、協程如何選擇及執行緒池如何最高效
Linux內核，行程間通信組件的實作

行程

程式是指儲存在外部存盤(如硬碟)的一個可執行檔案, 而行程是指處于執行期間的程式, 行程包括代碼段(text section) 和資料段(data section), 除了代碼段和資料段外, 行程一般還包含打開的檔案, 要處理的信號和CPU背景關系等等.

行程描述符

Linux行程使用 struct task_struct 來描述(include/linux/sched.h), 如下:

struct task_struct {
    /*
     * offsets of these are hardcoded elsewhere - touch with care
     */
     volatile long state;    /* -1 unrunnable, 0 runnable, >0 stopped */
     unsigned long flags;    /* per process flags, defined below */
     int sigpending;
     mm_segment_t addr_limit;    /* thread address space:
                        0-0xBFFFFFFF for user-thead
                        0-0xFFFFFFFF for kernel-thread
                     */
     struct exec_domain *exec_domain;
     volatile long need_resched;
     unsigned long ptrace;


     int lock_depth;     /* Lock depth */


/*
 * offset 32 begins here on 32-bit platforms. We keep
 * all fields in a single cacheline that are needed for
 * the goodness() loop in schedule().
 */
     long counter;
     long nice;
     unsigned long policy;
     struct mm_struct *mm;
     int processor;
     ...
}

Linux把所有的行程使用雙向鏈表連接起來, 如下圖在這里插入圖片描述
Linux內核為了加快獲取當前行程的的task_struct結構, 使用了一個技巧, 就是把task_struct放置在內核堆疊的堆疊底, 這樣就可以通過 esp暫存器快速獲取到當前運行行程的task_struct結構. 如下圖:
取當前運行行程的task_struct代碼如下:

static inline struct task_struct * get_current(void)
{
     struct task_struct *current;
     __asm__("andl %%esp,%0; ":"=r" (current) : "0" (~8191UL));
     return current;
}

行程狀態

行程描述符的state欄位用于保存行程的當前狀態, 行程的狀態有以下幾種:

TASK_RUNNING (運行) – 行程處于可執行狀態, 在這個狀態下的行程要么正在被CPU執行,
要么在等待執行(CPU被其他行程占用的情況下).
TASK_INTERRUPTIBLE (可中斷等待) – 行程處于等待狀態, 其在等待某些條件成立或者接收到某些信號,
行程會被喚醒變為運行狀態.
TASK_UNINTERRUPTIBLE (不可中斷等待) – 行程處于等待狀態, 其在等待某些條件成立, 行程會被喚醒變為運行狀態,但不能被信號喚醒.
TASK_TRACED (被追蹤) – 行程處于被追蹤狀態, 例如通過ptrace命令對行程進行除錯.
TASK_STOPPED (停止) – 行程處于停止狀態, 行程不能被執行. 一般接收到SIGSTOP, SIGTSTP,
SIGTTIN, SIGTTOU信號行程會變成TASK_STOPPED狀態.

個鐘狀態間的轉換如下圖: 在這里插入圖片描述
【文章福利】需要C/C++ Linux服務器架構師學習資料加群812855908（資料包括C/C++，Linux，golang技術，Nginx，ZeroMQ，MySQL，Redis，fastdfs，MongoDB，ZK，流媒體，CDN，P2P，K8S，Docker，TCP/IP，協程，DPDK，ffmpeg等）

行程的創建

在Linux系統中，行程的創建使用fork()系統呼叫，fork()呼叫會創建一個與父行程一樣的子行程，唯一不同就是fork()的回傳值，父行程回傳的是子行程的行程ID，而子行程回傳的是0，

Linux創建子行程時使用了寫時復制（Copy On Write），也就是創建子行程時使用的是父行程的記憶體空間，當子行程或者父行程修改資料時才會復制相應的記憶體頁，

當呼叫fork()系統呼叫時會陷入內核空間并且呼叫sys_fork()函式，sys_fork()函式會呼叫do_fork()函式，代碼如下(arch/i386/kernel/process.c)：

asmlinkage int sys_fork(struct pt_regs regs)
{
     return do_fork(SIGCHLD, regs.esp, ?s, 0);
}

do_fork()主要的作業是申請一個行程描述符, 然后初始化行程描述符的各個欄位, 包括呼叫 copy_files() 函式復制打開的檔案, 呼叫 copy_sighand() 函式復制信號處理函式, 呼叫 copy_mm() 函式復制行程虛擬記憶體空間, 呼叫 copy_namespace() 函式復制命名空間. 代碼如下:

int do_fork(unsigned long clone_flags, unsigned long stack_start,
        struct pt_regs *regs, unsigned long stack_size)
{
     ...
     p = alloc_task_struct(); // 申請行程描述符
     ...
     if (copy_files(clone_flags, p))
          goto bad_fork_cleanup;
     if (copy_fs(clone_flags, p))
          goto bad_fork_cleanup_files;
     if (copy_sighand(clone_flags, p))
          goto bad_fork_cleanup_fs;
     if (copy_mm(clone_flags, p))
          goto bad_fork_cleanup_sighand;
     if (copy_namespace(clone_flags, p))
          goto bad_fork_cleanup_mm;
     retval = copy_thread(0, clone_flags, stack_start, stack_size, p, regs);
     ...
     wake_up_process(p);
     ...
}

值得注意的是do_fork() 還呼叫了 copy_thread() 這個函式, copy_thread()這個函式主要用于設定行程的CPU執行背景關系 struct thread_struct 結構. 代碼如下:

int copy_thread(int nr, unsigned long clone_flags, unsigned long esp,
    unsigned long unused,
    struct task_struct * p, struct pt_regs * regs)
{
     struct pt_regs * childregs;


     // 指向堆疊頂(見圖2)
     childregs = ((struct pt_regs *) (THREAD_SIZE + (unsigned long) p)) - 1;
     struct_cpy(childregs, regs);  // 復制父行程的堆疊資訊
     childregs->eax = 0;   // 這個是子行程呼叫fork()之后的回傳值, 也就是0
     childregs->esp = esp; // 設定新的堆疊空間


     p->thread.esp = (unsigned long) childregs;      // 子行程當前的堆疊地址, 呼叫switch_to()的時候esp設定為這個地址
     p->thread.esp0 = (unsigned long) (childregs+1); // 子行程內核空間堆疊地址
     p->thread.eip = (unsigned long) ret_from_fork;  // 子行程將要執行的代碼地址


     savesegment(fs,p->thread.fs);
     savesegment(gs,p->thread.gs);


     unlazy_fpu(current);
     struct_cpy(&p->thread.i387, ¤t->thread.i387);


     return 0;
}

do_fork() 函式最后呼叫 wake_up_process() 函式喚醒子行程, 讓子行程進入運行狀態.

內核執行緒

Linux內核有很多任務需要去做, 例如定時把緩沖中的資料刷到硬碟, 當記憶體不足的時候進行記憶體的回收等, 這些作業都需要通過內核執行緒來完成. 內核執行緒與普通行程的主要區別就是: 內核執行緒沒有自己的虛擬空間結構(struct mm), 每次內核執行緒執行的時候都是借助當前運行行程的虛擬記憶體空間結構來運行, 因為內核執行緒只會運行在內核態, 而每個行程的內核態空間都是一樣的, 所以借助其他行程的虛擬記憶體空間結構來運行是完成可行的.

內核執行緒使用 kernel_thread() 函式來創建, 代碼如下:

int kernel_thread(int (*fn)(void *), void * arg, unsigned long flags)
{
    long retval, d0;


    __asm__ __volatile__(
        "movl %%esp,%%esi\n\t"
        "int $0x80\n\t"        /* Linux/i386 system call */
        "cmpl %%esp,%%esi\n\t"  /* child or parent? */
        "je 1f\n\t"     /* parent - jump */
        /* Load the argument into eax, and push it.  That way, it does
         * not matter whether the called function is compiled with
         * -mregparm or not.  */
        "movl %4,%%eax\n\t"
        "pushl %%eax\n\t"      
        "call *%5\n\t"      /* call fn */
        "movl %3,%0\n\t"    /* exit */
        "int $0x80\n"
        "1:\t"
    :"=&a" (retval), "=&S" (d0)
    :"0" (__NR_clone), "i" (__NR_exit),
    "r" (arg), "r" (fn),
    "b" (flags | CLONE_VM)
    : "memory");
    return retval;
}

因為這個函式式使用嵌入匯編來實作的, 所以有點難懂, 不過主要程序就是通過呼叫 _clone()函式來創建一個新的行程, 而創建行程是通過傳入 CLONE_VM 標志來指定行程借用其他行程的虛擬記憶體空間結構

轉載請註明出處，本文鏈接：https://www.uj5u.com/ruanti/253515.html

標籤：其他

上一篇：Linux硬鏈接與軟連接實作對比

下一篇：50個資料結構案例及詳細步驟分析 - C語言版