Python是開發人員中最常用的編程語言之一,但它有一定的局限性,例如,對于某些應用程式而言,它的運行速度可能比其它語言低100倍,這就是為什么當Python的運行速度成為用戶瓶頸后,許多公司會用另一種語言重寫他們的應用程式,但是有沒有一種方法既可以保持Python的特性又能提高速度呢?它就是PyPy,
PyPy是一種非常兼容的Python解釋器,它是CPython2.7、3.6和即將推出的3.7的一種值得替代的方法,在安裝和運行應用程式時使用它,可以顯著提高速度,速度提高多少取決于你運行的應用程式,
在本教程中,您將學習:
如何使用PyPy安裝和運行代碼
PyPy與CPython在速度方面的比較
PyPy的功能及其如何使Python代碼更快地運行
本教程中的示例使用 Python 3.6 ,因為它是PyPy兼容的最新 Python 版本,
PyPy 簡介
Python解釋器可以用多種語言來實作,如CPython(用C撰寫)、Jython(用Java撰寫)、Iron Python(用.NET撰寫)和PyPy(用Python撰寫),
CPython是Python解釋器的最初實作,也是迄今為止使用最廣和最多維護的,當我們從Python官方網站下載并安裝好Python 3.x后,我們就直接獲得了一個官方版本的解釋器:CPython,這個解釋器是用C語言開發的,所以叫CPython,在命令列下運行python就是啟動CPython解釋器,
但是,由于CPython是一種高級的解釋語言,因此它有一定的局限性,并且在速度方面沒有任何優勢,這就是PyPy可以起作用的地方,由于它符合Python語言規范,因此Py Py不需要對代碼庫進行任何更改,并且可以通過下面的功能顯著提高速度,
現在,您可能想知道,如果CPython使用相同的語法,為什么它不實作Py Py的強大功能,原因是,實施這些功能需要對源代碼進行巨大的更改,這將是一項非常繁瑣的作業,
我們來粗略看一下如何在實際操作中使用PyPy,
安裝
您的作業系統可能已提供PyPy軟體包,例如,在Mac OS上,您可以在Homebrew的幫助下安裝它:
$ brew install pypy3
或者您也可以下載與作業系統匹配的二進制檔案,完成下載后,只需打開tarball或ZIP檔案即可,然后,您可以執行以下操作:
$ tar xf pypy3.6-v7.3.1-osx64.tar.bz2
$ ./pypy3.6-v7.3.1-osx64/bin/pypy3
Python 3.6.9 (?, Jul 19 2020, 21:37:06)
[PyPy 7.3.1 with GCC 4.2.1]
Type "help", "copyright", "credits" or "license" for more information.
您需要在上述檔案夾地址執行該命令,有關完整的說明,請參閱安裝檔案,
運行 PyPy
您現在已經安裝了Py Py,并且即將運行它!為此,請創建一個名為script.py的Python檔案,并將以下代碼放入其中:
total = 0
for i in range(1, 10000):
for j in range(1, 10000):
total += i + j
print(f"The result is {total}")
在兩個嵌套的for回圈中,將1到9,999之間的數字相加,并列印結果,
查看運行此腳本需要多長時間:
import time
start_time = time.time()
total = 0
for i in range(1, 10000):
for j in range(1, 10000):
total += i + j
print(f"The result is {total}")
end_time = time.time()
print(f"It took {end_time-start_time:.2f} seconds to compute")
該代碼現在執行以下操作:
第3行將當前時間保存到變數
start_time,第5至8行運行回圈,
第10行列印結果,
第12行將當前時間保存為
end_time,第13行列印開始時間和結束時間之間的差值,以顯示運行腳本所需的時間,
用Python來運行它,下面是我在Mac Book Pro上的結果:
$ python3.6 script.py
The result is 999800010000
It took 20.66 seconds to compute
現在使用Py Py運行它:
$ pypy3 script.py
The result is 999800010000
It took 0.22 seconds to compute
在這個小實驗中,PyPy的速度大約是Python的94倍!
您可以通過瀏覽 PyPy Speed Center 來查看更多嚴格的測驗,
請記住,PyPy如何影響代碼的性能取決于您用代碼來做什么,在某些情況下,Py Py實際上較慢,稍后會看到,但是,就幾何平均而言,它的速度是Python的4.3倍,
PyPy及其特性
Py Py有兩種定義:
1、用于生成動態語言解釋器的動態語言框架 2、使用該框架的Python實作
您應該已經意識到了第二個問題,您使用的Python實作是使用稱為RPython的動態語言框架撰寫的,就像CPython是用C撰寫的,而Jython是用Java撰寫的一樣,
但之前文中不是提到PyPy是用Python撰寫的嗎?嗯,這有點簡單,PyPy成為用Python撰寫的Python解釋器(而不是RPython)這么說的原因是RPython使用了與Python相同的語法,
PyPy是怎么來的?需要解釋以下幾點:
1、它的源代碼是用RPython撰寫,
2、RPython轉換工具應用到了代碼中,從根本上提高了代碼效率,還可以將代碼編譯為機器代碼,這就是Mac,Windows和Linux用戶必須下載不同版本的原因,
3、用上述方式生成的二進制可執行檔案,就是你運行的Python解釋器,
你不需要執行上述所有這些步驟來使用PyPy,因為已經有提供您安裝和使用的可執行檔案,
此外,由于在框架和實作中使用同一個詞非常令人困惑,PyPy背后的團隊決定放棄這種雙重用法,現在,PyPy僅指Python解釋器,而框架被稱為RPython轉換工具,
接下來,您將了解在什么情況下使用PyPy比Python更好、更快,
Just-In-Time (JIT) 編譯器
在了解JIT編譯器的內容之前,讓我們先回顧一下已編譯語言(如C)和解釋語言(如JavaScript)的特性,
在編譯型語言寫的程式執行之前,需要一個專門的編譯程序,把源代碼編譯成機器語言的檔案,如exe格式的檔案,以后要再運行時,直接使用編譯結果即可,如直接運行exe檔案,因為只需編譯一次,以后運行時不需要編譯,所以編譯型語言執行效率高,與特定平臺相關,一般無法移植到其他平臺,如C、C++、Objective等都屬于編譯型語言,
解釋型語言不需要事先編譯,其直接將源代碼解釋成機器碼并立即執行,所以只要某一平臺提供了相應的解釋器即可運行該程式,解釋型語言每次運行都需要將源代碼解釋稱機器碼并執行,效率較低;只要平臺提供相應的解釋器,就可以運行源代碼,所以可以方便源程式移植,
然后還有一些編程語言,例如Python,它混合了編譯和解釋,具體來說,Python首先編譯為位元組碼,然后由CPython解釋,這使代碼的性能優于用純解釋型語言撰寫的代碼,并保持可移植性優勢,
但是它的性能仍然遠遠低于編譯型語言,其原因是,編譯后的代碼可以執行許多優化,而位元組碼是不可能的,
這就是JIT編譯器的來源,它試圖通過對機器代碼進行一些編譯和一些解釋來同時獲得兩種優勢,簡而言之,以下是JIT編譯為提供更快性能所采取的步驟:
1、識別代碼中最常用的組件,如回圈中的函式,
2、運行時將這些部件轉換為機器代碼,
3、優化生成的機器代碼,
4、用優化的機器代碼版本取代之前的實作,
還記得教程開頭的兩個嵌套回圈嗎?PyPy檢測到重復執行相同操作時,將其編譯為機器代碼,優化機器代碼,然后轉換實作,這也是為什么您會看到這樣的結果,
垃圾回識訓制
無論何時創建變數、函式或任何其他物件,您的計算機都會給它們分配記憶體,最終,其中一些物件將不再需要,如果不及時清理,計算機可能會耗盡記憶體并使程式崩潰,
在C和C++等編程語言中,通常必須手動處理此問題,其他編程語言(如Python和Java)會自動為您執行此操作,這被稱為自動垃圾回識訓制,
CPython使用一種稱為參考計數的技術,實質上,每當參考物件時,Python物件的參考計數都會增加,而在取消參考該物件時則遞減計數,當參考計數為零時,CPython會自動為該物件呼叫記憶體釋放函式,這是一種簡單有效的技術,但有一個陷阱,
當大型物件樹的參考計數變為零時,所有相關物件將被釋放,因此,您可能有很長的暫停時間,在此期間您的程式根本無法執行,
此外,還有一個例子,其中參考計數根本不起作用,如下所示:
class A(object):
pass
a = A()
a.some_property = a
del a
在上面的代碼中,定義了新的類,然后,創建一個實體,并將其指定為其自身的屬性,最后,洗掉實體,
此時,實體將不再可訪問,但是,參考計數不會從記憶體中洗掉實體,因為它具有對自身的參考,因此參考計數不是零,此問題被稱為參考回圈,無法使用參考計數解決,
這是CPython使用的另一個工具,稱為回圈垃圾回收器,它從已知根(如型別物件)開始遍歷記憶體中的所有物件,然后,它標識所有可訪問的物件,并釋放不可訪問的物件,因為它們不再存在,這樣就解決了參考回圈問題,但是,當記憶體中存在大量物件時,它可能會創建更明顯的暫停,
另一方面,PyPy不使用參考計數,相反,它只使用第二種技術,即回圈查找器,也就是說,它會定期從根開始遍歷活動物件,這使PyPy比CPython具有一些優勢,因為它不需要考慮參考計數,從而使記憶體管理花費的總時間少于CPython,
此外,PyPy將作業拆分為可變數量的部分,并運行每個部分,直到沒有剩余部分為止,此方法只在每個次要集合之后添加幾毫秒,而不像CPython那樣一次添加數百毫秒,
垃圾回識訓制非常復雜,并且有許多超出本教程范圍的內容,您可以在檔案中找到有關PyPy垃圾回識訓制的詳細資訊,
PyPy的局限性
PyPy并非萬能,它不是一個適合您所有任務的工具,它甚至可能使應用程式的執行速度比CPython慢得多,這就是為什么您必須記住以下局限性,
它不適用于C擴展
PyPy最適合純Python應用程式,無論何時使用C擴展模塊,它的運行速度都要比在CPython中慢得多,原因是PyPy無法優化C擴展模塊,因為它們不受完全支持,此外,PyPy必須模擬代碼中的參考計數,使其更慢,
在這種情況下,PyPy團隊建議去掉CPython擴展并將其替換為純Python版本,如果不行的話,則必須使用CPython,
盡管如此,核心團隊正在處理C擴展,有些軟體包已被移植到PyPy,并且作業速度也同樣快,
它只適用于長時間運行的程式
想象一下你想去一家離你家很近的商店,您既可以直接走路前往,也可以開車,
您的車明顯比您的腳快得多,但是,請考慮需要您完成的步驟:
1.去你的車庫,
2、開車,
3、給車預熱,
4、開車去商店,
5、尋找停車位,
6、在回傳途中重復此程序,
開車需要一系列麻煩的步驟,如果你想去的地方就在附近,那就不一定值得了,
現在想想,如果你想去50公里外的鄰近城市,會發生什么?開車去那里肯定是值得的,而不是步行去,
雖然速度上的對比并不像上面的類比那樣明顯,但PyPy和CPython和這個道理一樣,
當使用PyPy運行腳本時,它會執行許多操作以使代碼運行得更快,如果腳本本身很簡單,則實際腳本運行速度會低于CPython,另一方面,如果您有一個長時間運行的腳本,那么可能會帶來顯著的性能提升,
想親自感受一下的話,請在CPython和PyPy中運行以下小腳本:
import time
start_time = time.time()
for i in range(100):
print(i)
end_time = time.time()
print(f"It took {end_time-start_time:.10f} seconds to compute")
當您使用PyPy運行它時,開始時會有一個小延遲,而CPython會立即運行它,在Mac Book Pro上運行它,用CPython需要0.0004873276秒,用PyPy需要0.0019447803秒,
它不執行提前編譯
正如您在本教程開頭所看到的,PyPy不是一個完全編譯型的Python實作,它編譯Python代碼,但不是Python代碼的編譯器,由于Python固有的一些特性,導致無法將Python編譯為獨立的二進制檔案并重用它,
Py Py比完全解釋型的語言快,但比完全編譯的語言(如C)慢,
總結
PyPy是CPython的一種快速且功能強大的替代方案,使用它運行腳本,您可以在不更改代碼的情況下大大提高速度,但它也不是萬能的,有一些局限性,
在本教程中,您學習了:
PyPy是什么?
如何安裝PyPy并使用它運行腳本
PyPy與CPython在速度方面的比較
PyPy的功能及其如何提高程式速
在哪些情況下PyPy會有局限性
如果您的Python腳本需要稍微提高速度,歡迎嘗試PyPy!
長按掃碼添加“Python小助手” 一起討論PyPy!
▼點擊成為社區會員 喜歡就點個在看吧
轉載請註明出處,本文鏈接:https://www.uj5u.com/qita/218813.html
標籤:其他
