Linux 多執行緒
- 背景
- 執行緒的概念
- 執行緒的優缺點
- 優點
- 缺點
- 執行緒創建
- LWP(系統角度)
- 執行緒ID(用戶角度)
- 執行緒例外
- 執行緒用途
- 行程與執行緒
- 執行緒等待
- 執行緒終止
- 執行緒分離
背景
在創建一個行程時,作業系統做了以下的作業:
1、創建一個行程所需要的各種資料結構(pcb、地址空間、頁表、與檔案的關系,父子關系等等)
2、開辟物理記憶體,把硬碟上的代碼和資料加載到物理記憶體中,
3、把虛擬地址空間和物理記憶體通過頁表建立映射關系,
所以,創建一個行程就是一個執行流從無到有的程序,在這個程序中,我們申請了很多資源,創建了很多東西,
當CPU調度時,要找到對應行程的代碼和資料,
如果再想創建一個行程,重復上述程序,
執行緒的概念

行程的概念:是承擔分配系統資源的基本物體,(從作業系統觀點),為了承擔系統資源,作業系統為行程創建了大批資料結構和大批的記憶體塊,以承載該行程的代碼和資料,
執行緒:是調度的基本單位,執行緒是行程內部的執行流!
什么叫做執行緒在行程內部?
- 執行緒在行程內部運行,本質是在行程地址空間內運行, 所有的執行緒用的是同一個行程的地址空間,
行程和執行緒的對應關系應該是一對多,一個行程內有多個執行流(執行緒),
站在執行緒的角度,怎么理解之前的單行程?
- 內部只有一個執行流的行程,
現在應該如何看待task_struct呢?
- 之前我們認為是行程控制塊,現在更新了一下視角:在Linux中,沒有真正意義上的執行緒(指的是Linux在設計執行緒時沒有專門為它設計資料結構),執行緒是用行程模擬的,
【原因是,站在Linux角度,行程與執行緒本質都是要處理事物,具有相同屬性,因此不必設計兩種結構,】 - 這個模擬性體現在,在Linux中,依舊使用task_struct來表示一個執行緒,在地址空間中,如果只有一個task_struct,認為它是一個具有單執行流的行程;如果有多個時,認為它是具有多個執行流的行程,
- 之前認為task_struct背后掛靠的都是一個地址空間、一套頁表和代碼和資料;現在在CPU看來,task_struct背后有可能掛靠的是和別的task_struct共享的地址空間(也就是說這時,它只會使用地址空間的一部分),
從CPU角度,現在它看到的task_struct都要比傳統的行程更加輕量化,因此,執行緒也叫作輕量級行程,
執行緒的優缺點
優點
1、創建一個新執行緒的代價要比創建一個新行程小得多
2、與行程之間的切換相比,執行緒之間的切換需要作業系統做的作業要少很多
3、執行緒占用的資源要比行程少很多
4、能充分利用多處理器的可并行數量
5、在等待慢速I/O操作結束的同時,程式可執行其他的計算任務
6、計算密集型應用,為了能在多處理器系統上運行,將計算分解到多個執行緒中實作
7、I/O密集型應用,為了提高性能,將I/O操作重疊,執行緒可以同時等待不同的I/O操作,
缺點
1、性能損失
2、健壯性降低
3、缺乏訪問控制
4、編程難度提高
執行緒創建
執行緒的管理依靠的是pthread庫,
創建一個執行緒,應用的是函式pthread_create
#include <pthread.h>
int pthread_create(pthread_t *thread, const pthread_attr_t *attr,
void *(*start_routine)(void*), void *arg);
引數:
thread:回傳執行緒ID(作業系統不知道這個id,是由庫提供的)
attr:設定執行緒的屬性,一般設定為NULL表示使用默認屬性
start_routine:是個函式地址,執行緒啟動后要執行的函式
arg:傳給執行緒啟動函式的引數
- 創建一個執行緒

此時現階段有兩個執行流,如何證明?
- 一份代碼有兩個死回圈,所以它們應該同時運行,

且生成的可執行程式是動態鏈接的,

./mythread 是一個行程,但有兩個執行流,如何證明這兩個執行流來自一個行程?
ps -aL查看輕量級行程,發現它們的PID是一樣的,

LWP(系統角度)
在上圖,我們發現有一個重要標識LWP (light weight process,輕量級行程):對行程的標識作用,調度時用的是LWP,
我們知道Linux中沒有真正意義上的執行緒,在對執行緒的管理是依靠pthread庫來完成的,要管理就要描述和組織執行緒,需要有描述執行緒的結構體,在用戶區創建一個執行緒的物體,但在作業系統中需要有一個執行流跟它關聯起來,也就是LWP,
執行緒物體與LWP是有對應關系的,可以簡單理解為用戶區執行緒物體結構體中包含對應的輕量級行程ID,
不同的作業系統對應關系是不一樣的,在Linux中是一一對應的,
總結為,作業系統底層為我們提供執行緒的執行功能;而用戶級別提供用戶空間的執行緒管理功能,
函式pthread_self獲取當前執行緒的執行緒id:

執行緒ID(用戶角度)
這個ID絕不是前面提的輕量級行程ID! LWP是系統層面的,而該ID是用戶層面,也就是庫提供的,
pthread_create函式的第一個引數,指向的是一個虛擬的記憶體單元,該記憶體單元的地址即為新創建執行緒的執行緒ID,
也就說,動態庫要被加載到共享區中,庫里一定會包含描述執行緒的結構體,把這些結構體按照陣列的形式組織在一起,執行緒ID可以理解成該執行緒在庫當中,描述它自身結構的結構體的記憶體位置的起始地址, 這也就解釋的通,為什么上圖中列印出來的ID這么像地址!

執行緒例外
創建一個行程,此時該行程只有一個執行流,pthread_create執行完畢后,創建了新的執行緒,此時有了兩個執行流,
新執行緒執行時如果出現除零錯誤,作業系統識別到硬體例外,確定是哪個行程讓我的CPU執行除零,向對應行程發送信號【注意:信號發送的基本單位是行程!】,然后行程的資源就被釋放掉了,此時在行程中滋生的一堆執行緒也要使用這些資源,但資源已被釋放,所以這些執行緒也就隨之崩潰了,
因此,執行緒健壯性不強,只要眾多中有一個出現崩潰,整個都會崩潰,
執行緒用途
1、合理的使用多執行緒,能提高CPU密集型程式的執行效率,
2、合理的使用多執行緒,能提高IO密集型程式的用戶體驗(如生活中我們一邊寫代碼一邊下載開發工具,就是多執行緒運行的一種表現)
行程與執行緒
行程與執行緒相比:
行程更強調獨立性,但又不是絕對獨立,比如fork創建子行程,行程間通信等等,都會出現資源共享的情況,
執行緒更強調共享,但又不是絕對共享,還有部分是自己私有的:執行緒ID、一組暫存器、堆疊、errno、信號屏蔽字、調度優先級,
其中,要特別注意:執行緒私有執行緒運行堆疊!每個執行緒都有自己的運行堆疊,如果堆疊是共享的話,堆疊的FILO特性會讓整個資料變得混亂;每個執行緒都有一套自己的暫存器!(也叫硬體背景關系/任務狀態段tss)這個證明執行緒是會被切換的,
各執行緒會共享行程資源和環境:檔案描述符表、每種信號的處理方式(SIG_ IGN、SIG_ DFL或者自定義的信號處理函式)、當前作業目錄、用戶id和組id,

執行緒等待
新執行緒必須被主執行緒等待,如果不等待就會造成類似于僵尸行程這樣的問題,導致記憶體泄漏,
默認都是以阻塞方式等待,
關于執行緒的等待,我們并不用關心例外的情況,因為默認是不會錯的,一旦出現錯誤,就是行程要去處理的,會給行程發信號,所以信號是專門為行程設計的,
int pthread_join(pthread_t thread, void **value_ptr);
thread:執行緒ID
value_ptr:它指向一個指標,該指標指向被等待執行緒的回傳值,
回傳值:成功回傳0;失敗回傳錯誤碼
#include<stdio.h>
#include<fcntl.h>
#include<unistd.h>
#include<sys/types.h>
#include<pthread.h>
void* thread_run(void* arg)
{
printf("%s, %lu, pid:%d \n",(char*)arg, pthread_self(), getpid());
sleep(5);
return (void*)10;
}
int main()
{
pthread_t tid;
pthread_create(&tid, NULL, thread_run, "thread 1");
printf("main : %lu, pid:%d\n",pthread_self(), getpid());
void* ret = NULL;
pthread_join(tid, &ret);
printf("thread quit code: %d\n",(long long)ret);
}

執行緒終止
如果需要只終止某個執行緒而不終止整個行程,可以有三種方法:
- 從執行緒函式return,這種方法對主執行緒不適用,從main函式return相當于呼叫exit,
- 執行緒可以呼叫pthread_ exit終止自己,
注意:exit是終止行程,pthread_exit終止執行緒, - 一個執行緒可以呼叫pthread_ cancel終止同一行程中的另一個執行緒,
void pthread_exit(void *value_ptr);
value_ptr:value_ptr不要指向一個區域變數,因為當其它執行緒得到這個回傳指標時執行緒函式已經退出了,
回傳值:無回傳值,跟行程一樣,執行緒結束的時候無法回傳到它的呼叫者(自身)
int pthread_cancel(pthread_t thread);
thread:執行緒ID
回傳值:成功回傳0;失敗回傳錯誤碼
執行緒分離
int pthread_detach(pthread_t thread);
如果不關心執行緒的回傳值時,可以對執行緒分離,告訴系統,當執行緒退出時,自動釋放執行緒資源,
可以是執行緒組內其他執行緒對目標執行緒進行分離,也可以是執行緒自己分離,
轉載請註明出處,本文鏈接:https://www.uj5u.com/qita/279331.html
標籤:其他
