Linux 多執行緒

背景
執行緒的概念
執行緒的優缺點
- 優點
- 缺點
執行緒創建
- LWP（系統角度）
- 執行緒ID（用戶角度）
執行緒例外
執行緒用途
行程與執行緒
執行緒等待
執行緒終止
執行緒分離

背景

在創建一個行程時，作業系統做了以下的作業：
1、創建一個行程所需要的各種資料結構（pcb、地址空間、頁表、與檔案的關系，父子關系等等）
2、開辟物理記憶體，把硬碟上的代碼和資料加載到物理記憶體中，
3、把虛擬地址空間和物理記憶體通過頁表建立映射關系，

所以，創建一個行程就是一個執行流從無到有的程序，在這個程序中，我們申請了很多資源，創建了很多東西，

當CPU調度時，要找到對應行程的代碼和資料，

如果再想創建一個行程，重復上述程序，

執行緒的概念

行程的概念：是承擔分配系統資源的基本物體，（從作業系統觀點），為了承擔系統資源，作業系統為行程創建了大批資料結構和大批的記憶體塊，以承載該行程的代碼和資料，

執行緒：是調度的基本單位，執行緒是行程內部的執行流！

什么叫做執行緒在行程內部？

執行緒在行程內部運行，本質是在行程地址空間內運行， 所有的執行緒用的是同一個行程的地址空間，

行程和執行緒的對應關系應該是一對多，一個行程內有多個執行流（執行緒），

站在執行緒的角度，怎么理解之前的單行程？

內部只有一個執行流的行程，

現在應該如何看待task_struct呢？

之前我們認為是行程控制塊，現在更新了一下視角：在Linux中，沒有真正意義上的執行緒（指的是Linux在設計執行緒時沒有專門為它設計資料結構），執行緒是用行程模擬的，
【原因是，站在Linux角度，行程與執行緒本質都是要處理事物，具有相同屬性，因此不必設計兩種結構，】
這個模擬性體現在，在Linux中，依舊使用task_struct來表示一個執行緒，在地址空間中，如果只有一個task_struct，認為它是一個具有單執行流的行程；如果有多個時，認為它是具有多個執行流的行程，
之前認為task_struct背后掛靠的都是一個地址空間、一套頁表和代碼和資料；現在在CPU看來，task_struct背后有可能掛靠的是和別的task_struct共享的地址空間（也就是說這時，它只會使用地址空間的一部分），

從CPU角度，現在它看到的task_struct都要比傳統的行程更加輕量化，因此，執行緒也叫作輕量級行程，

執行緒的優缺點

優點

1、創建一個新執行緒的代價要比創建一個新行程小得多
2、與行程之間的切換相比，執行緒之間的切換需要作業系統做的作業要少很多
3、執行緒占用的資源要比行程少很多
4、能充分利用多處理器的可并行數量
5、在等待慢速I/O操作結束的同時，程式可執行其他的計算任務
6、計算密集型應用，為了能在多處理器系統上運行，將計算分解到多個執行緒中實作
7、I/O密集型應用，為了提高性能，將I/O操作重疊，執行緒可以同時等待不同的I/O操作，

缺點

1、性能損失
2、健壯性降低
3、缺乏訪問控制
4、編程難度提高

執行緒創建

執行緒的管理依靠的是pthread庫，

創建一個執行緒，應用的是函式pthread_create

#include <pthread.h>

int pthread_create(pthread_t *thread, const pthread_attr_t *attr, 
void *(*start_routine)(void*), void *arg);

引數：
thread:回傳執行緒ID（作業系統不知道這個id，是由庫提供的）
attr:設定執行緒的屬性，一般設定為NULL表示使用默認屬性
start_routine:是個函式地址，執行緒啟動后要執行的函式
arg:傳給執行緒啟動函式的引數

創建一個執行緒

此時現階段有兩個執行流，如何證明？

一份代碼有兩個死回圈，所以它們應該同時運行，

且生成的可執行程式是動態鏈接的，

./mythread 是一個行程，但有兩個執行流，如何證明這兩個執行流來自一個行程？

ps -aL查看輕量級行程，發現它們的PID是一樣的，

LWP（系統角度）

在上圖，我們發現有一個重要標識LWP (light weight process，輕量級行程)：對行程的標識作用，調度時用的是LWP，

我們知道Linux中沒有真正意義上的執行緒，在對執行緒的管理是依靠pthread庫來完成的，要管理就要描述和組織執行緒，需要有描述執行緒的結構體，在用戶區創建一個執行緒的物體，但在作業系統中需要有一個執行流跟它關聯起來，也就是LWP，

執行緒物體與LWP是有對應關系的，可以簡單理解為用戶區執行緒物體結構體中包含對應的輕量級行程ID，
不同的作業系統對應關系是不一樣的，在Linux中是一一對應的，

總結為，作業系統底層為我們提供執行緒的執行功能；而用戶級別提供用戶空間的執行緒管理功能，

函式pthread_self獲取當前執行緒的執行緒id：

執行緒ID（用戶角度）

這個ID絕不是前面提的輕量級行程ID！ LWP是系統層面的，而該ID是用戶層面，也就是庫提供的，
pthread_create函式的第一個引數，指向的是一個虛擬的記憶體單元，該記憶體單元的地址即為新創建執行緒的執行緒ID，

也就說，動態庫要被加載到共享區中，庫里一定會包含描述執行緒的結構體，把這些結構體按照陣列的形式組織在一起，執行緒ID可以理解成該執行緒在庫當中，描述它自身結構的結構體的記憶體位置的起始地址， 這也就解釋的通，為什么上圖中列印出來的ID這么像地址！

執行緒例外

創建一個行程，此時該行程只有一個執行流，pthread_create執行完畢后，創建了新的執行緒，此時有了兩個執行流，

新執行緒執行時如果出現除零錯誤，作業系統識別到硬體例外，確定是哪個行程讓我的CPU執行除零，向對應行程發送信號【注意：信號發送的基本單位是行程！】，然后行程的資源就被釋放掉了，此時在行程中滋生的一堆執行緒也要使用這些資源，但資源已被釋放，所以這些執行緒也就隨之崩潰了，

因此，執行緒健壯性不強，只要眾多中有一個出現崩潰，整個都會崩潰，

執行緒用途

1、合理的使用多執行緒，能提高CPU密集型程式的執行效率，
2、合理的使用多執行緒，能提高IO密集型程式的用戶體驗（如生活中我們一邊寫代碼一邊下載開發工具，就是多執行緒運行的一種表現）

行程與執行緒

行程與執行緒相比：

行程更強調獨立性，但又不是絕對獨立，比如fork創建子行程，行程間通信等等，都會出現資源共享的情況，

執行緒更強調共享，但又不是絕對共享，還有部分是自己私有的：執行緒ID、一組暫存器、堆疊、errno、信號屏蔽字、調度優先級，

其中，要特別注意：執行緒私有執行緒運行堆疊！每個執行緒都有自己的運行堆疊，如果堆疊是共享的話，堆疊的FILO特性會讓整個資料變得混亂；每個執行緒都有一套自己的暫存器！（也叫硬體背景關系/任務狀態段tss）這個證明執行緒是會被切換的，

各執行緒會共享行程資源和環境：檔案描述符表、每種信號的處理方式(SIG_ IGN、SIG_ DFL或者自定義的信號處理函式)、當前作業目錄、用戶id和組id，

執行緒等待

新執行緒必須被主執行緒等待，如果不等待就會造成類似于僵尸行程這樣的問題，導致記憶體泄漏，

默認都是以阻塞方式等待，

關于執行緒的等待，我們并不用關心例外的情況，因為默認是不會錯的，一旦出現錯誤，就是行程要去處理的，會給行程發信號，所以信號是專門為行程設計的，

int pthread_join(pthread_t thread, void **value_ptr);

thread：執行緒ID
value_ptr：它指向一個指標，該指標指向被等待執行緒的回傳值，
回傳值：成功回傳0；失敗回傳錯誤碼

#include<stdio.h>
#include<fcntl.h>
#include<unistd.h>
#include<sys/types.h>
#include<pthread.h>
void* thread_run(void* arg)
{
	printf("%s, %lu, pid:%d \n",(char*)arg, pthread_self(), getpid());
    sleep(5);
    return (void*)10;
}

int main()
{
   pthread_t tid;
   pthread_create(&tid, NULL, thread_run, "thread 1");

   printf("main : %lu, pid:%d\n",pthread_self(), getpid());
   
   void* ret = NULL;
   pthread_join(tid, &ret);
   printf("thread quit code: %d\n",(long long)ret);
}

執行緒終止

如果需要只終止某個執行緒而不終止整個行程,可以有三種方法:

從執行緒函式return，這種方法對主執行緒不適用,從main函式return相當于呼叫exit，
執行緒可以呼叫pthread_ exit終止自己，
注意：exit是終止行程，pthread_exit終止執行緒，
一個執行緒可以呼叫pthread_ cancel終止同一行程中的另一個執行緒，

void pthread_exit(void *value_ptr);

value_ptr：value_ptr不要指向一個區域變數，因為當其它執行緒得到這個回傳指標時執行緒函式已經退出了，

回傳值：無回傳值，跟行程一樣，執行緒結束的時候無法回傳到它的呼叫者（自身）

int pthread_cancel(pthread_t thread);

thread：執行緒ID

回傳值：成功回傳0；失敗回傳錯誤碼

執行緒分離

int pthread_detach(pthread_t thread);

如果不關心執行緒的回傳值時，可以對執行緒分離，告訴系統，當執行緒退出時，自動釋放執行緒資源，

可以是執行緒組內其他執行緒對目標執行緒進行分離，也可以是執行緒自己分離，

轉載請註明出處，本文鏈接：https://www.uj5u.com/qita/279331.html

標籤：其他

上一篇：HAL庫學習筆記-13 I2C和SPI的應用

下一篇：《STM32從零開始學習歷程》——CAN通訊協議協議層

關于執行緒（概念| 優缺點| 創建| 例外| 操作）