主頁 > 後端開發 > 它來了!真正的 python 多執行緒

它來了!真正的 python 多執行緒

2023-05-26 07:50:49 後端開發

哈嘍大家好,我是咸魚

幾天前,IBM 工程師 Martin Heinz 發文表示 python 3.12 版本回引入"Per-Interpreter GIL”,有了這個 Per-Interpreter 全域解釋器鎖,python 就能實作真正意義上的并行/并發

我們知道,python 的多執行緒/行程并不是真正意義上的多執行緒/行程,這是因為 python GIL (Global Interpreter Lock)導致的

而即將發布的 Python 3.12 中引入了名為 "Per-Interpreter GIL" 的新特性,能夠實作真正的并發

接下來我們來看下這篇文章,原文鏈接如下:

https://martinheinz.dev/blog/97

譯文

Python 到現在已經 32 歲了,但它到現在還沒有實作適當的、真正的并發/并行

由于將在 Python 3.12 (預計 2023 年 10 月發布)中引入 “Per-Interpreter GIL”(全域解釋器鎖),這種情況將會被改變

雖然距離 python 3.12 的發布還有幾個月的時間,但是相關代碼已經實作了,所以讓我們提前來了解一下如何使用子解釋器 API(ub-interpreters API) 來撰寫出真正的并發Python代碼

子解釋器(Sub-Interpreters)

我們首先來看下這個 “Per-Interpreter GIL” 是如何解決 Python 缺失適當并發性這個問題的

簡單來講,GIL(全域解釋器鎖)是一個互斥鎖,它只允許一個執行緒控制 Python 解釋器(某個執行緒想要執行,必須要先拿到 GIL ,在一個 python 解釋器里面,GIL 只有一個,拿不到 GIL 的就不允許執行)

這就意味著即使你在 Python 中創建多個執行緒,也只會有一個執行緒在運行

隨著 “Per-Interpreter GIL” 的參考,單個 python 解釋器不再共享同一個 GIL,這種隔離級別允許每個子 python 解釋器真正地并發運行

這意味著我們可以通過生成額外的子解釋器來繞過 Python 的并發限制,其中每個子解釋器都有自己的GIL(拿到一個 GIL 鎖)

更詳細的說明請參見 PEP 684,該檔案描述了此功能/更改:https://peps.python.org/pep-0684/#per-interpreter-state

如何安裝

想要使用這個新功能,我們需要安裝最新的 python 版本,這需要原始碼編譯安裝

# https://devguide.python.org/getting-started/setup-building/#unix-compiling
git clone https://github.com/python/cpython.git
cd cpython

./configure --enable-optimizations --prefix=$(pwd)/python-3.12
make -s -j2
./python
# Python 3.12.0a7+ (heads/main:22f3425c3d, May 10 2023, 12:52:07) [GCC 11.3.0] on linux
# Type "help", "copyright", "credits" or "license" for more information.

C-API 在哪里

現在我們已經安裝好了最新版本,那么我們該如何使用子解釋器呢?我們可以直接通過 import 來匯入嗎?不幸的是,還不能

正如 PEP-684 中指出的: ...this is an advanced feature meant for a narrow set of users of the C-API.

Per-Interpreter GIL 的特性目前只能通過 C-API 使用,還沒有直接的介面供開發人員使用

介面預計會在 PEP 554中出現,如果大家能夠接受,它應該會在 Python 3.13 中出現,在這個版本出現之前,我們必須自己想辦法來實作子解釋器

雖然還沒有相關檔案,也沒有相關模塊可以匯入,但 CPython 代碼庫中有一些代碼段向我們展示了如何使用它:

  1. 方法一:我們可以使用 _xxsubinterpreters 模塊(因為是通過 C 實作的,所以命名比較奇怪,而且在 python 中不能夠簡單地去檢查代碼)
  2. 方法二:可以使用 CPython 的 test 模塊,該模塊具有用于測驗的示例 Interpreter(和 Channel)類
# Choose one of these:
import _xxsubinterpreters as interpreters
from test.support import interpreters

通常情況下我們一般用上面的第二種方法來實作

我們已經找到了子解釋器,但我們還需要通過 test 模塊去借用一些輔助函式,以便將代碼傳遞給子解釋器,輔助函式如下

from textwrap import dedent
import os
# https://github.com/python/cpython/blob/
#   15665d896bae9c3d8b60bd7210ac1b7dc533b093/Lib/test/test__xxsubinterpreters.py#L75
def _captured_script(script):
    r, w = os.pipe()
    indented = script.replace('\n', '\n                ')
    wrapped = dedent(f"""
        import contextlib
        with open({w}, 'w', encoding="utf-8") as spipe:
            with contextlib.redirect_stdout(spipe):
                {indented}
        """)
    return wrapped, open(r, encoding="utf-8")


def _run_output(interp, request, channels=None):
    script, rpipe = _captured_script(request)
    with rpipe:
        interp.run(script, channels=channels)
        return rpipe.read()

interpreters 模塊與上面的輔助函陣列合在一起,便可以生成第一個子解釋器:

from test.support import interpreters

main = interpreters.get_main()
print(f"Main interpreter ID: {main}")
# Main interpreter ID: Interpreter(id=0, isolated=None)

interp = interpreters.create()

print(f"Sub-interpreter: {interp}")
# Sub-interpreter: Interpreter(id=1, isolated=True)

# https://github.com/python/cpython/blob/
#   15665d896bae9c3d8b60bd7210ac1b7dc533b093/Lib/test/test__xxsubinterpreters.py#L236
code = dedent("""
            from test.support import interpreters
            cur = interpreters.get_current()
            print(cur.id)
            """)

out = _run_output(interp, code)

print(f"All Interpreters: {interpreters.list_all()}")
# All Interpreters: [Interpreter(id=0, isolated=None), Interpreter(id=1, isolated=None)]
print(f"Output: {out}")  # Result of 'print(cur.id)'
# Output: 1

生成和運行新解釋器的一種方法是使用 create() 函式,然后將解釋器與我們想要執行的代碼一起傳遞給 _run_output() 輔助函式

還有一種更簡單的方法,如下所示

interp = interpreters.create()
interp.run(code)

直接使用 interpreters 模塊的 run 方法,

但如果我們運行上面這兩段代碼時,會收到以下報錯

Fatal Python error: PyInterpreterState_Delete: remaining subinterpreters
Python runtime state: finalizing (tstate=0x000055b5926bf398)

為了避免這個報錯,我們還需要清理一些懸掛的解釋器:

def cleanup_interpreters():
    for i in interpreters.list_all():
        if i.id == 0:  # main
            continue
        try:
            print(f"Cleaning up interpreter: {i}")
            i.close()
        except RuntimeError:
            pass  # already destroyed

cleanup_interpreters()
# Cleaning up interpreter: Interpreter(id=1, isolated=None)
# Cleaning up interpreter: Interpreter(id=2, isolated=None)

執行緒

雖然使用上面的輔助函式運行代碼是可行的,但在 threading 模塊中使用熟悉的介面可能會更方便

import threading

def run_in_thread():
    t = threading.Thread(target=interpreters.create)
    print(t)
    t.start()
    print(t)
    t.join()
    print(t)

run_in_thread()
run_in_thread()

# <Thread(Thread-1 (create), initial)>
# <Thread(Thread-1 (create), started 139772371633728)>
# <Thread(Thread-1 (create), stopped 139772371633728)>
# <Thread(Thread-2 (create), initial)>
# <Thread(Thread-2 (create), started 139772371633728)>
# <Thread(Thread-2 (create), stopped 139772371633728)>

我們通過把 interpreters.create 函式傳遞給Thread,它會自動在執行緒內部生成新的子解釋器

我們也可以結合這兩種方法,并將輔助函式傳遞給 threading.Thread

import time

def run_in_thread():
    interp = interpreters.create(isolated=True)
    t = threading.Thread(target=_run_output, args=(interp, dedent("""
            import _xxsubinterpreters as _interpreters
            cur = _interpreters.get_current()

            import time
            time.sleep(2)
            # Can't print from here, won't bubble-up to main interpreter

            assert isinstance(cur, _interpreters.InterpreterID)
            """)))
    print(f"Created Thread: {t}")
    t.start()
    return t


t1 = run_in_thread()
print(f"First running Thread: {t1}")
t2 = run_in_thread()
print(f"Second running Thread: {t2}")
time.sleep(4)  # Need to sleep to give Threads time to complete
cleanup_interpreters()

上面的代碼中演示了如何使用 _xxsubinterpreters 模塊來實作 (方法一)

我們還在每個執行緒中休眠 2 秒來模擬“作業”狀態

請注意,我們甚至不必呼叫 join() 函式等待執行緒完成,只需在執行緒完成時清理解釋器即可

Channels

如果我們進一步挖掘 CPython test 模塊,我們還會發現 RecvChannel 和 SendChannel 類的實作類似于 Golang 中已知的通道

# https://github.com/python/cpython/blob/
#   15665d896bae9c3d8b60bd7210ac1b7dc533b093/Lib/test/test_interpreters.py#L583
r, s = interpreters.create_channel()

print(f"Channel: {r}, {s}")
# Channel: RecvChannel(id=0), SendChannel(id=0)

orig = b'spam'
s.send_nowait(orig)
obj = r.recv()
print(f"Received: {obj}")
# Received: b'spam'

cleanup_interpreters()
# Need clean up, otherwise:

# free(): invalid pointer
# Aborted (core dumped)

上面的例子介紹了如何創建一個接收端通道(r)和發送端通道(s),然后我們使用 send_nowait 方法將資料發送,通過 recv 方法來接收資料

這個通道實際上只是另一個解釋器,和以前一樣,我們需要在處理完它之后進行清理

Digging Deeper

如果我們想要修改或者調整子解釋器的選項(這些選項通常在 C 代碼中設定),我們可以使用

test.support 模塊中的代碼,具體來說是run_in_subinterp_with_config

import test.support

def run_in_thread(script):
    test.support.run_in_subinterp_with_config(
        script,
        use_main_obmalloc=True,
        allow_fork=True,
        allow_exec=True,
        allow_threads=True,
        allow_daemon_threads=False,
        check_multi_interp_extensions=False,
        own_gil=True,
    )

code = dedent(f"""
            from test.support import interpreters
            cur = interpreters.get_current()
            print(cur)
            """)

run_in_thread(code)
# Interpreter(id=7, isolated=None)
run_in_thread(code)
# Interpreter(id=8, isolated=None)

上面這個run_in_subinterp_with_config函式是 C 函式的 Python API,它提供了一些子解釋器選項,如 own_gil,指定子解釋器是否應該擁有自己的 GIL

轉載請註明出處,本文鏈接:https://www.uj5u.com/houduan/553406.html

標籤:其他

上一篇:ThreadLocal的應用及原理

下一篇:返回列表

標籤雲
其他(159694) Python(38169) JavaScript(25452) Java(18129) C(15231) 區塊鏈(8268) C#(7972) AI(7469) 爪哇(7425) MySQL(7211) html(6777) 基礎類(6313) sql(6102) 熊猫(6058) PHP(5873) 数组(5741) R(5409) Linux(5341) 反应(5209) 腳本語言(PerlPython)(5129) 非技術區(4971) Android(4576) 数据框(4311) css(4259) 节点.js(4032) C語言(3288) json(3245) 列表(3129) 扑(3119) C++語言(3117) 安卓(2998) 打字稿(2995) VBA(2789) Java相關(2746) 疑難問題(2699) 细绳(2522) 單片機工控(2479) iOS(2434) ASP.NET(2403) MongoDB(2323) 麻木的(2285) 正则表达式(2254) 字典(2211) 循环(2198) 迅速(2185) 擅长(2169) 镖(2155) .NET技术(1976) 功能(1967) Web開發(1951) HtmlCss(1944) C++(1922) python-3.x(1918) 弹簧靴(1913) xml(1889) PostgreSQL(1878) .NETCore(1861) 谷歌表格(1846) Unity3D(1843) for循环(1842)

熱門瀏覽
  • 【C++】Microsoft C++、C 和匯編程式檔案

    ......

    uj5u.com 2020-09-10 00:57:23 more
  • 例外宣告

    相比于斷言適用于排除邏輯上不可能存在的狀態,例外通常是用于邏輯上可能發生的錯誤。 例外宣告 Item 1:當函式不可能拋出例外或不能接受拋出例外時,使用noexcept 理由 如果不打算拋出例外的話,程式就會認為無法處理這種錯誤,并且應當盡早終止,如此可以有效地阻止例外的傳播與擴散。 示例 //不可 ......

    uj5u.com 2020-09-10 00:57:27 more
  • Codeforces 1400E Clear the Multiset(貪心 + 分治)

    鏈接:https://codeforces.com/problemset/problem/1400/E 來源:Codeforces 思路:給你一個陣列,現在你可以進行兩種操作,操作1:將一段沒有 0 的區間進行減一的操作,操作2:將 i 位置上的元素歸零。最終問:將這個陣列的全部元素歸零后操作的最少 ......

    uj5u.com 2020-09-10 00:57:30 more
  • UVA11610 【Reverse Prime】

    本人看到此題沒有翻譯,就附帶了一個自己的翻譯版本 思考 這一題,它的第一個要求是找出所有 $7$ 位反向質數及其質因數的個數。 我們應該需要質數篩篩選1~$10^{7}$的所有數,這里就不慢慢介紹了。但是,重讀題,我們突然發現反向質數都是 $7$ 位,而將它反過來后的數字卻是 $6$ 位數,這就說明 ......

    uj5u.com 2020-09-10 00:57:36 more
  • 統計區間素數數量

    1 #pragma GCC optimize(2) 2 #include <bits/stdc++.h> 3 using namespace std; 4 bool isprime[1000000010]; 5 vector<int> prime; 6 inline int getlist(int ......

    uj5u.com 2020-09-10 00:57:47 more
  • C/C++編程筆記:C++中的 const 變數詳解,教你正確認識const用法

    1、C中的const 1、區域const變數存放在堆疊區中,會分配記憶體(也就是說可以通過地址間接修改變數的值)。測驗代碼如下: 運行結果: 2、全域const變數存放在只讀資料段(不能通過地址修改,會發生寫入錯誤), 默認為外部聯編,可以給其他源檔案使用(需要用extern關鍵字修飾) 運行結果: ......

    uj5u.com 2020-09-10 00:58:04 more
  • 【C++犯錯記錄】VS2019 MFC添加資源不懂如何修改資源宏ID

    1. 首先在資源視圖中,添加資源 2. 點擊新添加的資源,復制自動生成的ID 3. 在解決方案資源管理器中找到Resource.h檔案,編輯,使用整個專案搜索和替換的方式快速替換 宏宣告 4. Ctrl+Shift+F 全域搜索,點擊查找全部,然后逐個替換 5. 為什么使用搜索替換而不使用屬性視窗直 ......

    uj5u.com 2020-09-10 00:59:11 more
  • 【C++犯錯記錄】VS2019 MFC不懂的批量添加資源

    1. 打開資源頭檔案Resource.h,在其中預先定義好宏 ID(不清楚其實ID值應該設定多少,可以先新建一個相同的資源項,再在這個資源的ID值的基礎上遞增即可) 2. 在資源視圖中選中專案資源,按F7編輯資源檔案,按 ID 型別 相對路徑的形式添加 資源。(別忘了先把檔案拷貝到專案中的res檔案 ......

    uj5u.com 2020-09-10 01:00:19 more
  • C/C++編程筆記:關于C++的參考型別,專供新手入門使用

    今天要講的是C++中我最喜歡的一個用法——參考,也叫別名。 參考就是給一個變數名取一個變數名,方便我們間接地使用這個變數。我們可以給一個變數創建N個參考,這N + 1個變數共享了同一塊記憶體區域。(參考型別的變數會占用記憶體空間,占用的記憶體空間的大小和指標型別的大小是相同的。雖然參考是一個物件的別名,但 ......

    uj5u.com 2020-09-10 01:00:22 more
  • 【C/C++編程筆記】從頭開始學習C ++:初學者完整指南

    眾所周知,C ++的學習曲線陡峭,但是花時間學習這種語言將為您的職業帶來奇跡,并使您與其他開發人員區分開。您會更輕松地學習新語言,形成真正的解決問題的技能,并在編程的基礎上打下堅實的基礎。 C ++將幫助您養成良好的編程習慣(即清晰一致的編碼風格,在撰寫代碼時注釋代碼,并限制類內部的可見性),并且由 ......

    uj5u.com 2020-09-10 01:00:41 more
最新发布
  • 它來了!真正的 python 多執行緒

    哈嘍大家好,我是咸魚 幾天前,IBM 工程師 Martin Heinz 發文表示 python 3.12 版本回引入"Per-Interpreter GIL”,有了這個 Per-Interpreter 全域解釋器鎖,python 就能實作真正意義上的并行/并發 我們知道,python 的多執行緒/行程 ......

    uj5u.com 2023-05-26 07:50:49 more
  • ThreadLocal的應用及原理

    ## 1. ThreadLocal 是什么 JDK 對`ThreadLocal`的描述為: > 此類提供執行緒區域變數。這些變數與普通變數的不同之處在于,每個訪問一個變數的執行緒(通過其get或set方法)都有自己的、獨立初始化的變數副本。ThreadLocal 實體通常是類中的私有靜態欄位,這些欄位希 ......

    uj5u.com 2023-05-26 07:45:35 more
  • Java的CompletableFuture,Java的多執行緒開發

    # 三、Java8的CompletableFuture,Java的多執行緒開發 ## 1、CompletableFuture的常用方法 - 以后用到再加 ```properties runAsync() :開啟異步(創建執行緒執行任務),無回傳值 supplyAsync() :開啟異步(創建執行緒執行任務 ......

    uj5u.com 2023-05-26 07:35:06 more
  • Maven的核心解壓與配置

    ? # Maven的核心解壓與配置 @[toc] ## 1. Maven 官網地址 首頁:[Maven – Welcome to Apache Maven(opens new window)](https://maven.apache.org/) ![在這里插入圖片描述](https://img20 ......

    uj5u.com 2023-05-26 07:29:23 more
  • AQS原始碼解讀----AbstractQueuedSynchronizer

    36 package cn.com.pep; 37 import java.util.concurrent.TimeUnit; 38 import java.util.concurrent.locks.AbstractOwnableSynchronizer; 39 import java.util. ......

    uj5u.com 2023-05-26 07:28:40 more
  • < Python全景系列-7 > 提升Python編程效率:模塊與包全面解讀

    Python全景系列的第七篇,本文將深入探討Python模塊與包的基本概念,使用方法以及其在實際專案中的應用。我們也會揭示一些鮮為人知,卻又實用的技術細節。 ......

    uj5u.com 2023-05-26 07:28:06 more
  • Netty實戰(三)

    [toc](目錄) # 一、Channel、EventLoop 和 ChannelFuture 上一篇博文我們在構建服務端和客戶端中出現了一些新的類,可能有些同學還有些不了解它們的具體功能。沒關系,接下來我們對于 Channel、EventLoop 和 ChannelFuture 類進行的討論增添更 ......

    uj5u.com 2023-05-25 12:11:19 more
  • MyBatis體系筆記(未完結)

    MyBatis 什么是MyBatis MyBatis是優秀的持久層框架 MyBatis使用XML將SQL與程式解耦,便于維護 MyBatis學習簡單,執行高效,是JDBC的延伸 1.MyBatis開發流程 引入MyBatis依賴 創建核心組態檔 創建物體(Entity)類 創建Mapper映射檔案 ......

    uj5u.com 2023-05-25 11:58:15 more
  • springboot~統一處理日期請求引數java.utils.Date和java.time.Lo

    日期型別的引數在從前端通過url引數傳遞到后端時,它會被進行格式化,如果格式化失敗會出現400的錯誤,像日期格式默認會使用yyyy/MM/dd的格式,如果希望自己去個性化配置,我們可以通過實作WebMvcConfigurer介面的addFormatters方法來完成。 # java.time.Loc ......

    uj5u.com 2023-05-25 11:38:09 more
  • JavaWeb編程面試題——導航

    面試題==知識點,這里所記錄的面試題并不針對于面試者,而是將這些面試題作為技能知識點來看待。不以刷題進大廠為目的,而是以學習為目的。這里的知識點會持續更新,目錄也會隨時進行調整。 ......

    uj5u.com 2023-05-25 11:37:48 more