主頁 > 後端開發 > 用 PyPy 讓你的 Python 代碼運行得更快!

用 PyPy 讓你的 Python 代碼運行得更快!

2020-11-15 11:57:06 後端開發

Python是開發人員中最常用的編程語言之一,但它有一定的局限性,例如,對于某些應用程式而言,它的運行速度可能比其它語言低100倍,這就是為什么當Python的運行速度成為用戶瓶頸后,許多公司會用另一種語言重寫他們的應用程式,但是有沒有一種方法既可以保持Python的特性又能提高速度呢?它就是PyPy

PyPy是一種非常兼容的Python解釋器,它是CPython2.7、3.6和即將推出的3.7的一種值得替代的方法,在安裝和運行應用程式時使用它,可以顯著提高速度,速度提高多少取決于你運行的應用程式,

在本教程中,您將學習:

  • 如何使用PyPy安裝和運行代碼

  • PyPy與CPython在速度方面的比較

  • PyPy的功能及其如何使Python代碼更快地運行

  • 本教程中的示例使用 Python 3.6 ,因為它是PyPy兼容的最新 Python 版本,

PyPy 簡介

Python解釋器可以用多種語言來實作,如CPython(用C撰寫)、Jython(用Java撰寫)、Iron Python(用.NET撰寫)和PyPy(用Python撰寫),

CPython是Python解釋器的最初實作,也是迄今為止使用最廣和最多維護的,當我們從Python官方網站下載并安裝好Python 3.x后,我們就直接獲得了一個官方版本的解釋器:CPython,這個解釋器是用C語言開發的,所以叫CPython,在命令列下運行python就是啟動CPython解釋器,

但是,由于CPython是一種高級的解釋語言,因此它有一定的局限性,并且在速度方面沒有任何優勢,這就是PyPy可以起作用的地方,由于它符合Python語言規范,因此Py Py不需要對代碼庫進行任何更改,并且可以通過下面的功能顯著提高速度,

現在,您可能想知道,如果CPython使用相同的語法,為什么它不實作Py Py的強大功能,原因是,實施這些功能需要對源代碼進行巨大的更改,這將是一項非常繁瑣的作業,

我們來粗略看一下如何在實際操作中使用PyPy,

安裝

您的作業系統可能已提供PyPy軟體包,例如,在Mac OS上,您可以在Homebrew的幫助下安裝它:

$ brew install pypy3

或者您也可以下載與作業系統匹配的二進制檔案,完成下載后,只需打開tarball或ZIP檔案即可,然后,您可以執行以下操作:

$ tar xf pypy3.6-v7.3.1-osx64.tar.bz2
$ ./pypy3.6-v7.3.1-osx64/bin/pypy3
Python 3.6.9 (?, Jul 19 2020, 21:37:06)
[PyPy 7.3.1 with GCC 4.2.1]
Type "help", "copyright", "credits" or "license" for more information.

您需要在上述檔案夾地址執行該命令,有關完整的說明,請參閱安裝檔案,

運行 PyPy

您現在已經安裝了Py Py,并且即將運行它!為此,請創建一個名為script.py的Python檔案,并將以下代碼放入其中:

total = 0
for i in range(1, 10000):
    for j in range(1, 10000):
        total += i + j

print(f"The result is {total}")

在兩個嵌套的for回圈中,將1到9,999之間的數字相加,并列印結果,

查看運行此腳本需要多長時間:

import time

start_time = time.time()

total = 0
for i in range(1, 10000):
    for j in range(1, 10000):
        total += i + j

print(f"The result is {total}")

end_time = time.time()
print(f"It took {end_time-start_time:.2f} seconds to compute")

該代碼現在執行以下操作:

  • 第3行將當前時間保存到變數start_time

  • 第5至8行運行回圈,

  • 第10行列印結果,

  • 第12行將當前時間保存為end_time

  • 第13行列印開始時間和結束時間之間的差值,以顯示運行腳本所需的時間,

用Python來運行它,下面是我在Mac Book Pro上的結果:

$ python3.6 script.py
The result is 999800010000
It took 20.66 seconds to compute

現在使用Py Py運行它:

$ pypy3 script.py
The result is 999800010000
It took 0.22 seconds to compute

在這個小實驗中,PyPy的速度大約是Python的94倍!

您可以通過瀏覽 PyPy Speed Center 來查看更多嚴格的測驗,

請記住,PyPy如何影響代碼的性能取決于您用代碼來做什么,在某些情況下,Py Py實際上較慢,稍后會看到,但是,就幾何平均而言,它的速度是Python的4.3倍,

PyPy及其特性

Py Py有兩種定義:

1、用于生成動態語言解釋器的動態語言框架 2、使用該框架的Python實作

您應該已經意識到了第二個問題,您使用的Python實作是使用稱為RPython的動態語言框架撰寫的,就像CPython是用C撰寫的,而Jython是用Java撰寫的一樣,

但之前文中不是提到PyPy是用Python撰寫的嗎?嗯,這有點簡單,PyPy成為用Python撰寫的Python解釋器(而不是RPython)這么說的原因是RPython使用了與Python相同的語法,

PyPy是怎么來的?需要解釋以下幾點:

1、它的源代碼是用RPython撰寫,

2、RPython轉換工具應用到了代碼中,從根本上提高了代碼效率,還可以將代碼編譯為機器代碼,這就是Mac,Windows和Linux用戶必須下載不同版本的原因,

3、用上述方式生成的二進制可執行檔案,就是你運行的Python解釋器,

你不需要執行上述所有這些步驟來使用PyPy,因為已經有提供您安裝和使用的可執行檔案,

此外,由于在框架和實作中使用同一個詞非常令人困惑,PyPy背后的團隊決定放棄這種雙重用法,現在,PyPy僅指Python解釋器,而框架被稱為RPython轉換工具,

接下來,您將了解在什么情況下使用PyPy比Python更好、更快,

Just-In-Time (JIT) 編譯器

在了解JIT編譯器的內容之前,讓我們先回顧一下已編譯語言(如C)和解釋語言(如JavaScript)的特性,

在編譯型語言寫的程式執行之前,需要一個專門的編譯程序,把源代碼編譯成機器語言的檔案,如exe格式的檔案,以后要再運行時,直接使用編譯結果即可,如直接運行exe檔案,因為只需編譯一次,以后運行時不需要編譯,所以編譯型語言執行效率高,與特定平臺相關,一般無法移植到其他平臺,如C、C++、Objective等都屬于編譯型語言,

解釋型語言不需要事先編譯,其直接將源代碼解釋成機器碼并立即執行,所以只要某一平臺提供了相應的解釋器即可運行該程式,解釋型語言每次運行都需要將源代碼解釋稱機器碼并執行,效率較低;只要平臺提供相應的解釋器,就可以運行源代碼,所以可以方便源程式移植,

然后還有一些編程語言,例如Python,它混合了編譯和解釋,具體來說,Python首先編譯為位元組碼,然后由CPython解釋,這使代碼的性能優于用純解釋型語言撰寫的代碼,并保持可移植性優勢,

但是它的性能仍然遠遠低于編譯型語言,其原因是,編譯后的代碼可以執行許多優化,而位元組碼是不可能的,

這就是JIT編譯器的來源,它試圖通過對機器代碼進行一些編譯和一些解釋來同時獲得兩種優勢,簡而言之,以下是JIT編譯為提供更快性能所采取的步驟:

1、識別代碼中最常用的組件,如回圈中的函式,

2、運行時將這些部件轉換為機器代碼,

3、優化生成的機器代碼,

4、用優化的機器代碼版本取代之前的實作,

還記得教程開頭的兩個嵌套回圈嗎?PyPy檢測到重復執行相同操作時,將其編譯為機器代碼,優化機器代碼,然后轉換實作,這也是為什么您會看到這樣的結果,

垃圾回識訓制

無論何時創建變數、函式或任何其他物件,您的計算機都會給它們分配記憶體,最終,其中一些物件將不再需要,如果不及時清理,計算機可能會耗盡記憶體并使程式崩潰,

在C和C++等編程語言中,通常必須手動處理此問題,其他編程語言(如Python和Java)會自動為您執行此操作,這被稱為自動垃圾回識訓制,

CPython使用一種稱為參考計數的技術,實質上,每當參考物件時,Python物件的參考計數都會增加,而在取消參考該物件時則遞減計數,當參考計數為零時,CPython會自動為該物件呼叫記憶體釋放函式,這是一種簡單有效的技術,但有一個陷阱,

當大型物件樹的參考計數變為零時,所有相關物件將被釋放,因此,您可能有很長的暫停時間,在此期間您的程式根本無法執行,

此外,還有一個例子,其中參考計數根本不起作用,如下所示:

class A(object):
    pass

a = A()
a.some_property = a
del a

在上面的代碼中,定義了新的類,然后,創建一個實體,并將其指定為其自身的屬性,最后,洗掉實體,

此時,實體將不再可訪問,但是,參考計數不會從記憶體中洗掉實體,因為它具有對自身的參考,因此參考計數不是零,此問題被稱為參考回圈,無法使用參考計數解決,

這是CPython使用的另一個工具,稱為回圈垃圾回收器,它從已知根(如型別物件)開始遍歷記憶體中的所有物件,然后,它標識所有可訪問的物件,并釋放不可訪問的物件,因為它們不再存在,這樣就解決了參考回圈問題,但是,當記憶體中存在大量物件時,它可能會創建更明顯的暫停,

另一方面,PyPy不使用參考計數,相反,它只使用第二種技術,即回圈查找器,也就是說,它會定期從根開始遍歷活動物件,這使PyPy比CPython具有一些優勢,因為它不需要考慮參考計數,從而使記憶體管理花費的總時間少于CPython,

此外,PyPy將作業拆分為可變數量的部分,并運行每個部分,直到沒有剩余部分為止,此方法只在每個次要集合之后添加幾毫秒,而不像CPython那樣一次添加數百毫秒,

垃圾回識訓制非常復雜,并且有許多超出本教程范圍的內容,您可以在檔案中找到有關PyPy垃圾回識訓制的詳細資訊,

PyPy的局限性

PyPy并非萬能,它不是一個適合您所有任務的工具,它甚至可能使應用程式的執行速度比CPython慢得多,這就是為什么您必須記住以下局限性,

它不適用于C擴展

PyPy最適合純Python應用程式,無論何時使用C擴展模塊,它的運行速度都要比在CPython中慢得多,原因是PyPy無法優化C擴展模塊,因為它們不受完全支持,此外,PyPy必須模擬代碼中的參考計數,使其更慢,

在這種情況下,PyPy團隊建議去掉CPython擴展并將其替換為純Python版本,如果不行的話,則必須使用CPython,

盡管如此,核心團隊正在處理C擴展,有些軟體包已被移植到PyPy,并且作業速度也同樣快,

它只適用于長時間運行的程式

想象一下你想去一家離你家很近的商店,您既可以直接走路前往,也可以開車,

您的車明顯比您的腳快得多,但是,請考慮需要您完成的步驟:

1.去你的車庫,

2、開車,

3、給車預熱,

4、開車去商店,

5、尋找停車位,

6、在回傳途中重復此程序,

開車需要一系列麻煩的步驟,如果你想去的地方就在附近,那就不一定值得了,

現在想想,如果你想去50公里外的鄰近城市,會發生什么?開車去那里肯定是值得的,而不是步行去,

雖然速度上的對比并不像上面的類比那樣明顯,但PyPy和CPython和這個道理一樣,

當使用PyPy運行腳本時,它會執行許多操作以使代碼運行得更快,如果腳本本身很簡單,則實際腳本運行速度會低于CPython,另一方面,如果您有一個長時間運行的腳本,那么可能會帶來顯著的性能提升,

想親自感受一下的話,請在CPython和PyPy中運行以下小腳本:

import time

start_time = time.time()

for i in range(100):
    print(i)

end_time = time.time()
print(f"It took {end_time-start_time:.10f} seconds to compute")

當您使用PyPy運行它時,開始時會有一個小延遲,而CPython會立即運行它,在Mac Book Pro上運行它,用CPython需要0.0004873276秒,用PyPy需要0.0019447803秒,

它不執行提前編譯

正如您在本教程開頭所看到的,PyPy不是一個完全編譯型的Python實作,它編譯Python代碼,但不是Python代碼的編譯器,由于Python固有的一些特性,導致無法將Python編譯為獨立的二進制檔案并重用它,

Py Py比完全解釋型的語言快,但比完全編譯的語言(如C)慢,

總結

PyPy是CPython的一種快速且功能強大的替代方案,使用它運行腳本,您可以在不更改代碼的情況下大大提高速度,但它也不是萬能的,有一些局限性,

在本教程中,您學習了:

  • PyPy是什么?

  • 如何安裝PyPy并使用它運行腳本

  • PyPy與CPython在速度方面的比較

  • PyPy的功能及其如何提高程式速

  • 在哪些情況下PyPy會有局限性

如果您的Python腳本需要稍微提高速度,歡迎嘗試PyPy!

長按掃碼添加“Python小助手” 一起討論PyPy!

▼點擊成為社區會員   喜歡就點個在看吧

轉載請註明出處,本文鏈接:https://www.uj5u.com/houduan/217185.html

標籤:python

上一篇:Android selinux知識點總結

下一篇:中國開源燃燒!Zilliz 獲全球開源基礎軟體最大單筆融資 4300 萬美元

標籤雲
其他(157675) Python(38076) JavaScript(25376) Java(17977) C(15215) 區塊鏈(8255) C#(7972) AI(7469) 爪哇(7425) MySQL(7132) html(6777) 基礎類(6313) sql(6102) 熊猫(6058) PHP(5869) 数组(5741) R(5409) Linux(5327) 反应(5209) 腳本語言(PerlPython)(5129) 非技術區(4971) Android(4554) 数据框(4311) css(4259) 节点.js(4032) C語言(3288) json(3245) 列表(3129) 扑(3119) C++語言(3117) 安卓(2998) 打字稿(2995) VBA(2789) Java相關(2746) 疑難問題(2699) 细绳(2522) 單片機工控(2479) iOS(2429) ASP.NET(2402) MongoDB(2323) 麻木的(2285) 正则表达式(2254) 字典(2211) 循环(2198) 迅速(2185) 擅长(2169) 镖(2155) 功能(1967) .NET技术(1958) Web開發(1951) python-3.x(1918) HtmlCss(1915) 弹簧靴(1913) C++(1909) xml(1889) PostgreSQL(1872) .NETCore(1853) 谷歌表格(1846) Unity3D(1843) for循环(1842)

熱門瀏覽
  • 【C++】Microsoft C++、C 和匯編程式檔案

    ......

    uj5u.com 2020-09-10 00:57:23 more
  • 例外宣告

    相比于斷言適用于排除邏輯上不可能存在的狀態,例外通常是用于邏輯上可能發生的錯誤。 例外宣告 Item 1:當函式不可能拋出例外或不能接受拋出例外時,使用noexcept 理由 如果不打算拋出例外的話,程式就會認為無法處理這種錯誤,并且應當盡早終止,如此可以有效地阻止例外的傳播與擴散。 示例 //不可 ......

    uj5u.com 2020-09-10 00:57:27 more
  • Codeforces 1400E Clear the Multiset(貪心 + 分治)

    鏈接:https://codeforces.com/problemset/problem/1400/E 來源:Codeforces 思路:給你一個陣列,現在你可以進行兩種操作,操作1:將一段沒有 0 的區間進行減一的操作,操作2:將 i 位置上的元素歸零。最終問:將這個陣列的全部元素歸零后操作的最少 ......

    uj5u.com 2020-09-10 00:57:30 more
  • UVA11610 【Reverse Prime】

    本人看到此題沒有翻譯,就附帶了一個自己的翻譯版本 思考 這一題,它的第一個要求是找出所有 $7$ 位反向質數及其質因數的個數。 我們應該需要質數篩篩選1~$10^{7}$的所有數,這里就不慢慢介紹了。但是,重讀題,我們突然發現反向質數都是 $7$ 位,而將它反過來后的數字卻是 $6$ 位數,這就說明 ......

    uj5u.com 2020-09-10 00:57:36 more
  • 統計區間素數數量

    1 #pragma GCC optimize(2) 2 #include <bits/stdc++.h> 3 using namespace std; 4 bool isprime[1000000010]; 5 vector<int> prime; 6 inline int getlist(int ......

    uj5u.com 2020-09-10 00:57:47 more
  • C/C++編程筆記:C++中的 const 變數詳解,教你正確認識const用法

    1、C中的const 1、區域const變數存放在堆疊區中,會分配記憶體(也就是說可以通過地址間接修改變數的值)。測驗代碼如下: 運行結果: 2、全域const變數存放在只讀資料段(不能通過地址修改,會發生寫入錯誤), 默認為外部聯編,可以給其他源檔案使用(需要用extern關鍵字修飾) 運行結果: ......

    uj5u.com 2020-09-10 00:58:04 more
  • 【C++犯錯記錄】VS2019 MFC添加資源不懂如何修改資源宏ID

    1. 首先在資源視圖中,添加資源 2. 點擊新添加的資源,復制自動生成的ID 3. 在解決方案資源管理器中找到Resource.h檔案,編輯,使用整個專案搜索和替換的方式快速替換 宏宣告 4. Ctrl+Shift+F 全域搜索,點擊查找全部,然后逐個替換 5. 為什么使用搜索替換而不使用屬性視窗直 ......

    uj5u.com 2020-09-10 00:59:11 more
  • 【C++犯錯記錄】VS2019 MFC不懂的批量添加資源

    1. 打開資源頭檔案Resource.h,在其中預先定義好宏 ID(不清楚其實ID值應該設定多少,可以先新建一個相同的資源項,再在這個資源的ID值的基礎上遞增即可) 2. 在資源視圖中選中專案資源,按F7編輯資源檔案,按 ID 型別 相對路徑的形式添加 資源。(別忘了先把檔案拷貝到專案中的res檔案 ......

    uj5u.com 2020-09-10 01:00:19 more
  • C/C++編程筆記:關于C++的參考型別,專供新手入門使用

    今天要講的是C++中我最喜歡的一個用法——參考,也叫別名。 參考就是給一個變數名取一個變數名,方便我們間接地使用這個變數。我們可以給一個變數創建N個參考,這N + 1個變數共享了同一塊記憶體區域。(參考型別的變數會占用記憶體空間,占用的記憶體空間的大小和指標型別的大小是相同的。雖然參考是一個物件的別名,但 ......

    uj5u.com 2020-09-10 01:00:22 more
  • 【C/C++編程筆記】從頭開始學習C ++:初學者完整指南

    眾所周知,C ++的學習曲線陡峭,但是花時間學習這種語言將為您的職業帶來奇跡,并使您與其他開發人員區分開。您會更輕松地學習新語言,形成真正的解決問題的技能,并在編程的基礎上打下堅實的基礎。 C ++將幫助您養成良好的編程習慣(即清晰一致的編碼風格,在撰寫代碼時注釋代碼,并限制類內部的可見性),并且由 ......

    uj5u.com 2020-09-10 01:00:41 more
最新发布
  • Rust中的智能指標:Box<T> Rc<T> Arc<T> Cell<T> RefCell<T> Weak

    Rust中的智能指標是什么 智能指標(smart pointers)是一類資料結構,是擁有資料所有權和額外功能的指標。是指標的進一步發展 指標(pointer)是一個包含記憶體地址的變數的通用概念。這個地址參考,或 ” 指向”(points at)一些其 他資料 。參考以 & 符號為標志并借用了他們所 ......

    uj5u.com 2023-04-20 07:24:10 more
  • Java的值傳遞和參考傳遞

    值傳遞不會改變本身,參考傳遞(如果傳遞的值需要實體化到堆里)如果發生修改了會改變本身。 1.基本資料型別都是值傳遞 package com.example.basic; public class Test { public static void main(String[] args) { int ......

    uj5u.com 2023-04-20 07:24:04 more
  • [2]SpinalHDL教程——Scala簡單入門

    第一個 Scala 程式 shell里面輸入 $ scala scala> 1 + 1 res0: Int = 2 scala> println("Hello World!") Hello World! 檔案形式 object HelloWorld { /* 這是我的第一個 Scala 程式 * 以 ......

    uj5u.com 2023-04-20 07:23:58 more
  • 理解函式指標和回呼函式

    理解 函式指標 指向函式的指標。比如: 理解函式指標的偽代碼 void (*p)(int type, char *data); // 定義一個函式指標p void func(int type, char *data); // 宣告一個函式func p = func; // 將指標p指向函式func ......

    uj5u.com 2023-04-20 07:23:52 more
  • Django筆記二十五之資料庫函式之日期函式

    本文首發于公眾號:Hunter后端 原文鏈接:Django筆記二十五之資料庫函式之日期函式 日期函式主要介紹兩個大類,Extract() 和 Trunc() Extract() 函式作用是提取日期,比如我們可以提取一個日期欄位的年份,月份,日等資料 Trunc() 的作用則是截取,比如 2022-0 ......

    uj5u.com 2023-04-20 07:23:45 more
  • 一天吃透JVM面試八股文

    什么是JVM? JVM,全稱Java Virtual Machine(Java虛擬機),是通過在實際的計算機上仿真模擬各種計算機功能來實作的。由一套位元組碼指令集、一組暫存器、一個堆疊、一個垃圾回收堆和一個存盤方法域等組成。JVM屏蔽了與作業系統平臺相關的資訊,使得Java程式只需要生成在Java虛擬機 ......

    uj5u.com 2023-04-20 07:23:31 more
  • 使用Java接入小程式訂閱訊息!

    更新完微信服務號的模板訊息之后,我又趕緊把微信小程式的訂閱訊息給實作了!之前我一直以為微信小程式也是要企業才能申請,沒想到小程式個人就能申請。 訊息推送平臺🔥推送下發【郵件】【短信】【微信服務號】【微信小程式】【企業微信】【釘釘】等訊息型別。 https://gitee.com/zhongfuch ......

    uj5u.com 2023-04-20 07:22:59 more
  • java -- 緩沖流、轉換流、序列化流

    緩沖流 緩沖流, 也叫高效流, 按照資料型別分類: 位元組緩沖流:BufferedInputStream,BufferedOutputStream 字符緩沖流:BufferedReader,BufferedWriter 緩沖流的基本原理,是在創建流物件時,會創建一個內置的默認大小的緩沖區陣列,通過緩沖 ......

    uj5u.com 2023-04-20 07:22:49 more
  • Java-SpringBoot-Range請求頭設定實作視頻分段傳輸

    老實說,人太懶了,現在基本都不喜歡寫筆記了,但是網上有關Range請求頭的文章都太水了 下面是抄的一段StackOverflow的代碼...自己大修改過的,寫的注釋挺全的,應該直接看得懂,就不解釋了 寫的不好...只是希望能給視頻網站開發的新手一點點幫助吧. 業務場景:視頻分段傳輸、視頻多段傳輸(理 ......

    uj5u.com 2023-04-20 07:22:42 more
  • Windows 10開發教程_編程入門自學教程_菜鳥教程-免費教程分享

    教程簡介 Windows 10開發入門教程 - 從簡單的步驟了解Windows 10開發,從基本到高級概念,包括簡介,UWP,第一個應用程式,商店,XAML控制元件,資料系結,XAML性能,自適應設計,自適應UI,自適應代碼,檔案管理,SQLite資料庫,應用程式到應用程式通信,應用程式本地化,應用程式 ......

    uj5u.com 2023-04-20 07:22:35 more