前言
本文的文字及圖片來源于網路,僅供學習、交流使用,不具有任何商業用途,如有問題請及時聯系我們以作處理,
PS:如有需要Python學習資料的小伙伴可以點擊下方鏈接自行獲取
Python免費學習資料、代碼以及交流解答點擊即可加入
Python的記憶體管理機制
對于工程師而言,記憶體管理機制非常重要,是繞不過去的一環,如果你是Java工程師,面試的時候一定會問JVM,C++工程師也一定會問記憶體泄漏,同樣我們想要深入學習Python,記憶體管理機制也是繞不過去的一環,
不過好在Python的記憶體管理機制相對來說比較簡單,我們也不用特別深入其中的細節,簡單做個了解即可,
Python記憶體管理機制的核心就是參考計數,在Python當中一切都是物件,物件通過參考來使用,
我們看到的是變數名,但是變數名指向了記憶體當中的一塊物件,這種關系在Python當中稱為參考,我們通過參考來操作物件,所以根據這點,參考計數很好理解,也就是說我們會對每一個物件進行統計所有指向它的指標的數量,如果一個物件參考計數為0,那么說明它沒有任何參考指向它,也就是說它已經沒有在使用了,這個時候,Python就會將這塊記憶體識訓,
簡單來說參考計數原理就是這些,但我們稍微深入一點,來簡單看看哪些場景會引起物件參考的變化,
參考計數的變化顯然只有兩種,一種是增加,一種是減少,這兩種場景都只有4種情況,我們先來看下增加的情況:
首先是初始化,最簡單的就是我們用賦值操作給一個變數賦值,舉個例子:
這就是最簡單的初始化操作,雖然123在我們來看是一個常數,但是在Python底層同樣被認為是一個常數物件,n是它的一個參考,
第二種情況是參考的傳遞,最簡單的就是我們將一個變數的值賦值給了另外一個變數,
比如我們將n賦值給m,它的本質是我們創建了一個新的參考,指向了同樣一塊記憶體,如果我們用id操作去查看m和n的id,會發現它們的id是一樣的,也就是說它們并不是存盤了兩份相同的值,而是指向了同一份值,并不是有兩個叫做王小二的人,而是王小二有兩個不同的賬號,
第三種情況是作為元素被存盤進了容器當中,比如被存盤進了list當中,
雖然我們用到了一個容器,但是容器并不會拷貝一份這些物件,還是只是存盤這些物件的參考,
最后一種情況就是作為引數傳給函式,在Python當中,所有的傳參都是參考傳遞,這也是為什么,我們經常看到有人會這樣寫代碼的原因:
我們根據上面列舉的這四種參考計數增加的情況,不難推匯出參考減少的情況, 其實基本上是對稱的操作,
和初始化對應的操作是銷毀,比如我們創建的物件被del操作給銷毀了,那么同樣參考計數會-1
和賦值給其他變數名的操作相反的操作是覆寫,比如之前我們的n=123,也就是n這個變數指向123,現在我們將n賦值成其他值,那么123這個物件的參考計數同樣會減少,
既然元素存盤在容器當中會帶來參考計數,那么同樣元素從容器當中移除也會減少參考計數,這個也很好理解,最簡單的就是list呼叫remove方法移除一個元素:
最后一個對應的就是作用域,也就是當變數離開了作用域,那么它對應的記憶體塊的參考計數同樣會減少,比如我們函式呼叫結束,那么作為引數的這些變數對應的參考計數都會減1,
如果一個物件的參考計數減到0,也就是沒有參考再指向它的時候,那么當Python進行gc的時候,這塊記憶體就會被釋放,也就是這個物件會被清除,騰出空間來,
注意一下,參考計數減到0與記憶體回收之間并不是立即發生的,而是有一段間隔的,根據Python的機制,記憶體回收只會在特定條件下執行,在占用記憶體比較小還有很多富裕的情況下,往往是不會執行記憶體回收的,因為Python在執行gc(garbage collection)的時候也會stop the world,也就是暫停其他所有的任務,所以這是影響性能的一件事情,只會在有必要的時候執行,
我們費這么大勁來介紹Python中的記憶體機制,除了向大家科普一下這一塊內容之外,更重要的一點是為了引出我們開發的時候經常遇見的一種情況——回圈參考,
回圈參考
如果熟悉了Python的參考,來理解回圈參考是非常容易的,說白了也很簡單,就是你的一個變數參考我,我的一個變數參考你,
我們來寫一段簡單的代碼,來看看回圈參考:
如果你打個斷點來看的話,會看到a和b之間的回圈參考:
這里是無限展開的,因為這是一個無限回圈,無限回圈并不會導致程式崩潰, 也不會帶來太大的問題,它的問題只有一個,就是根據前面介紹的參考計數法,a和b的參考永遠不可能為0,
也就是說根據參考計數的原則,這兩個變數永遠不會被回收,這顯然是不合理的,雖然Python當中專門建立了機制來解決參考回圈的問題,但是我們并不知道它什么時候會被觸發,
這個問題在Python當中非常普遍,尤其在我們實作一些資料結構的時候,舉個最簡單的例子就是樹中的節點,就是參考回圈的,因為父節點會存盤所有的孩子,往往孩子節點也會存盤父節點的資訊,那么這就構成了參考回圈,
弱參考
為了解決這個問題,Python中提供了一個叫做弱參考的概念,弱參考本質也是一種參考,但是它不會增加物件的參考計數,也就是說它不能保證它參考的物件一定不會被銷毀,只要沒有銷毀,弱參考就可以回傳預期的結果,
弱參考不用我們自己開發,這是Python當中集成的一個現成的模塊weakref,
這個模塊當中的方法很多,用法也很多,但是我們基本上用不到,一般來說最常用的就是ref方法,通過weakref庫中的ref方法,可以回傳物件的一個弱參考,我們還是來看個例子:
其實還是之前的代碼,只是做了一點簡單的改動,一個是我們給Test加上了name這個屬性,以及str方法,另一個是我們把直接賦值改成了使用weakref,
這一次我們再打斷點進來看的話,就看不到無限回圈的情況了:
ref回傳的是一個獲取參考物件的方法,而不是物件本身,所以我們想要獲取這個物件的話,需要再把它當成函式呼叫一下,
當然這樣很麻煩,我們還有更好的辦法,就是使用property注解,通過property注解,我們可以把weakref封裝掉,這樣在使用的時候就沒有感知了,
總結
參考和回圈參考都是基于Python本身的機制,如果對這塊機制不了解,很容易采坑,因為可能會出現邏輯是對的,但是有一些意想不到的bug的情況,這種時候,往往很難通過review代碼或者是測驗發現,這也是我們學習的瓶頸所在,很容易發現代碼已經寫得很熟練了,但是一些進階的代碼還是看不懂或者是寫不出來,本質上就是因為缺少了對于底層的了解和認知,
回圈參考的問題在我們開發代碼的時候還蠻常見的,尤其是涉及到樹和圖的資料結構的時候,由于回圈參考的關系,很有可能出現被洗掉的樹仍然占用著空間,記憶體不足的情況發生,這個時候使用weakref就很有必要了,
轉載請註明出處,本文鏈接:https://www.uj5u.com/houduan/265808.html
標籤:Python
