行程執行緒有多重要?剛開始學Python的時候你可能還沒有感覺到,因為你寫的代碼從上到下執行一遍就可以了,但實際上這很初級,實際開發寫專案的時候,為了充分利用電腦配置來加快程式進度,我們往往會用到多行程多執行緒,
就比如說我們的爬蟲,沒有多行程多執行緒的程式就像只能一只手干活,而開啟了多行程多執行緒之后就是幾只幾十只手在干活,你需要10分鐘才能爬完的資料,別人可能1分鐘不到就弄完了,

行程執行緒也是Python入門的最后一個板塊的知識,基本上我的Python新手入門教程系列文章就要更新完了,

Python新手入門教程系列文章專欄
在開始Python的行程和執行緒教學之前,有一些關于基礎概念需要給大家進行講解,
一、多任務作業系統
作業系統可以執行多個任務,比如我們的Windows系統,除了目前在執行的、你能看得到的幾個任務,還有很多后臺正在執行的任務,可以用Ctrl+Alt+Del鍵調出任務管理器看一下就知道了,

我的電腦配置經常會看到有幾核處理器的屬性,例如我的電腦是12核的,也就是說電腦最多能同時執行12個任務,最多運行12個行程同時進行,

但為什么我們的電腦卻能夠同時運行幾百個任務呢?

其實這得益于于作業系統的任務調度,大部分的作業系統是采用搶占時間片的形式進行調度,系統在極其微小的時間內,在多個任務之間進行極快速的切換,比如說8核的作業系統理論上1秒鐘之內只能同時執行8個任務,但是系統在1秒鐘之內可能在上百個任務之間進行切換,A任務執行一下、B任務執行一下、C任務執行一下…結果1秒鐘之內很多任務都能被執行到,造成了肉眼可見的幾百個任務在一直執行,
術語叫“宏觀并行,微觀串行”,實際上電腦在極端的時間內只能執行不超過配置核數的任務數,8核還是只能執行8個任務,

1.何為行程?
既然講到了任務,那么行程就是任務,1個行程就相當于1個任務,是作業系統分配資源的最小單位,在python中,想要實作多任務可以使用行程來完成,行程是實作多任務的一種方式,
2.何為執行緒?
行程的多個子任務就稱之為執行緒,執行緒是行程的最小執行單位, 一個行程可以有很多執行緒,每個執行緒執行的任務都不一樣,

Python既支持多行程又支持多執行緒,接下來我們就開始進入Python的行程與執行緒的學習,
二、Python的多行程multiprocessing(包)
如果你利用多行程,你的Python代碼是從頭到尾逐行執行的,這其實就是在執行1個行程,這一點應該很好理解,
要想更多利用CPU資源,我們可以利用多行程,這里介紹一個Python多行程時常用的包multiprocessing,它擁有很多的功能,比如子行程、通訊、共享、執行不同的形式等等,我們來了解一些常用的,
1.Process——行程類
Process是multiprocessing里面的一個行程類,通過它就能實作多行程,我們先來看一下它的用法,后面我們會有實際的例子去講述,
Process(target,name,args,kwargs)
- target是目標,在哪里新開行程讓系統去執行?得給系統一個目標,
- name是行程的名字,你可以設定也可以不設定,默認是Process-N,N是從1,2,3…N,系統默認從小到大取名,
- args和kwargs是引數,可用于傳遞到目標,
Process里面有很多方法,其中最常用的就是start()啟動行程的方法,
行程名.start() #開始行程
舉例:寫好的代碼如下,我想看看開啟和沒開啟多行程呼叫函式的效果,
import time
#2個要同時執行的函式
def music() :
for i in range(5): #執行5次
print("聽音樂中...")
time.sleep(0.2) #延遲0.2s,目的是讓效果對比更明顯一些
def movie():
for i in range(5):
print("看視頻中...")
time.sleep(0.2) #延遲0.2s
music()
movie()
print("主行程執行完畢")
在沒有開啟多行程時,執行效果如下:

可以看到,這是很正常的運行情況,程式從上運行到下,逐行運行,music()里面的三次回圈沒有執行完畢就不會執行movie()里面,以及這兩個函式如果沒有執行完畢,就不會執行最后一行的print(“主行程執行完畢”),
我們再來看在上面案例的代碼中加入多行程:
import time
import multiprocessing
# 2個要同時執行的函式
def music():
for i in range(5): # 執行5次
print("聽音樂中...")
time.sleep(0.2) # 延遲0.2s,目的是讓效果對比更明顯一些
def movie():
for i in range(5):
print("看視頻中...")
time.sleep(0.2) # 延遲0.2s
if __name__ == "__main__": # 解決Windows系統下呼叫包時的遞回問題
# 創建子行程
music_process = multiprocessing.Process(target=music)
movie_process = multiprocessing.Process(target=movie)
# 啟用行程
music_process.start()
movie_process.start()
print("主行程執行完畢")
代碼中我加入了一個if陳述句來判斷__name__這個,為什么?因為在Windows系統下, multiprocessing這個包會發生遞回現象,就是會在“匯入模塊—呼叫模塊”之間反復執行,不信你可以把if陳述句去掉,把里面的代碼全部放到外面來執行就會報錯,這是Windows系統下會發生的一個現象,mac、linux等系統是不用加ifl來做判斷的,
關于__name__ = "main"這個知識點我在模塊與包的初始化時候有講過,不懂的可以回去看一下,
運行效果:

可以看出來,這開啟行程之后,代碼運行時是有3個行程同時進行的,一個是從上往下執行的主行程,執行到下面輸出“主行程執行完畢”,另外兩個子行程去執行music()和movie()行程,從他們的執行速度來看,它們是同時在進行的,所以沒有像剛才那樣非要等其中一個函式里面的代碼執行3遍才開始第2個函式,
同樣的代碼,你們的執行效果可能會跟我有所差異,因為效果是根據系統當前的狀況去隨機分配的,但并不影響你能看出來它的結果是多執行緒在進行,
最后補充一下,前面我們講過Process里面有args和kwargs可進行引數傳遞,args是普遍引數的傳遞,kwargs是以字典的形式進行引數傳遞,我們還是以上面的代碼為例,進行一下有引數傳遞的多進行,

2.獲取當前行程的編號
前面我們講到了代碼執行時有多個行程在同時進行任務,那么怎么樣查看當前行程的編號來得知目前有哪些行程在運行呢?哪些是主行程哪些是子行程呢?3個方法,我們先來看一下方法,后面再結合例子一起使用,
(1)獲取當前行程的編號:
需要用到一個os模塊里面的getpid()方法,用法如下:
os.getpid()
(2)獲取當前行程的名字
這里用的還是multiprocessing包,里面有個current_process()的方法,用法如下:
multiprocessing.current_process()
(3)獲取當前父行程(主行程)的編號
子行程是屬于哪個父行程的?這個用的是os模塊里面的getppid() ,用法如下:
os.getppid()

那么方法都看到了,我們來在剛才的例子的基礎上,獲取并列印一下當前行程的名字、編號以及父行程的編號,
import time
import multiprocessing
import os
# 2個要同時執行的函式
def music():
print("music子行程名字:", multiprocessing.current_process())
print("music子行程編號:", os.getpid())
print("music所屬主行程的編號:", os.getppid())
for i in range(5): # 執行5次
print("聽音樂中...")
time.sleep(0.2) # 延遲0.2s,目的是讓效果對比更明顯一些
def movie(a, b):
print("movie子行程名字:", multiprocessing.current_process())
print("movie子行程編號:", os.getpid())
print("movie所屬主行程的編號:", os.getppid())
for i in range(5):
print("看視頻中...")
time.sleep(0.2) # 延遲0.2s
if __name__ == "__main__": # 解決Windows系統下呼叫包時的遞回問題
# 創建子行程
music_process = multiprocessing.Process(target=music)
movie_process = multiprocessing.Process(target=movie, kwargs={"a": 30, "b": 40})
# 啟用行程
music_process.start()
movie_process.start()
print("主行程編號:",os.getpid())
運行結果:

可以只要我們使用獲取執行緒的方法的執行緒,都能被列印出來編號和名字,
三、多執行緒Threading模塊
多行程能同時運行幾個任務,前面我們講過行程的最小單位是執行緒,那么執行緒也同樣可以進行多個任務,如果一個行程只有1個任務(主行程),那么也可以說是只有1個執行緒,就比如我們不使用多行程運行代碼的時候,這時候就可以說1個主行程或1個主執行緒,
1.多執行緒的類Thread類
多執行緒常用的一個模塊是threading,里面有個教Thread的類,跟前面我們將多行程時用到的Process類差不多,我們先來看看用法:
Thread(target=None,name=None,args=(),kwargs=None)
- target:可執行目標
- name:執行緒的名字默認Thread-N
- args/kwargs:目標引數
同樣的,多執行緒也要有開啟的方法,跟前面的也差不多:
start()
還有獲取執行緒名字的方法:
threading.current_thread()
知道了這些知識點,我們開始舉例:用跟上面差不多的例子去使用一下我們的多執行緒,
import threading,time
def music(name,loop):
for i in range(loop):
print("聽音樂 %s , 第%s次"%(name,i))
time.sleep(0.2)
def movie(name,loop):
for i in range(loop):
print("看電影%s , 第%s次"%(name,i))
time.sleep(0.2)
if __name__ =="__main__":
music_thread = threading.Thread(target=music,args=("最親的人",3))
movie_thread = threading.Thread(target=movie,args=("唐探2",3))
music_thread.start()
movie_thread.start()
print("主執行緒執行完畢")
運行結果:
聽音樂 最親的人 , 第0次
看電影唐探2 , 第0次
主執行緒執行完畢
聽音樂 最親的人 , 第1次看電影唐探2 , 第1次
看電影唐探2 , 第2次聽音樂 最親的人 , 第2次
可以看出來,我們的多執行緒其實是跟多行程差不多的,同樣可以運行多個任務,這里我們還增加了引數的使用,

2.繼承Thread類
我們除了用上面的方法實作多執行緒任務,還可以用繼承類的方式去實作多執行緒,
舉例:通過多執行緒的方式,去列印“涼涼”和“頭發沒了",
import threading,time
#多執行緒的創建
class MyThread(threading.Thread):
def __init__(self,name): #初始化
super().__init__() #呼叫父類Thread的初始化方法
self.name = name #name變成實體屬性
def run(self):
#執行緒要做的事情
for i in range(5):
print(self.name)
time.sleep(0.2)
#實體化子執行緒
t1 = MyThread("涼涼")
t2 = MyThread("頭發沒了")
t1.start()
t2.start()
MyThread這個類是我們自己創建的,它是繼承于父類threading.Thread ,同時我們需要寫上MyThread的初始化方法,每當被呼叫的時候把準備作業做好,super().int() 這個我們也講過了,在前面的面向物件時有講過,不懂的可以去看看面向物件那篇文章的內容,
運行結果:
涼涼
頭發沒了
涼涼
頭發沒了
涼涼頭發沒了
涼涼頭發沒了
涼涼
頭發沒了
隨機效果是有的,你們的效果和我的可能會不一樣,每臺電腦在運行多執行緒代碼時,哪個執行緒能夠搶到時間片誰就先執行,
通過類Thread繼承一樣可以實作多執行緒,
結語
行程執行緒講完之后,基本上Python入門的所有知識點都講完了,剩下的就是一章附加文章了,基本上從開始的Python基礎到后面的高級編程板塊的內容,如果你學完了,你去進階Python的任何方向都是OK的,加油!

我的公眾號在一番籌備之后終于出來了,公眾號會有我所有的技術和經驗文章,因為每個平臺支持的文章型別不一樣,所以有些文章大家可能是沒有見過的,歡迎前去查閱,
轉載請註明出處,本文鏈接:https://www.uj5u.com/ruanti/303630.html
標籤:其他
上一篇:【演算法學習】1828. 統計一個圓中點的數目(java / c / c++ / python / go / rust)
