大部門人使用 python 是因為它非常方便,而不是因為它速度快,過多的第三方庫使得 python 相比于 Java 和 C 的性能差距較大,但也是可以理解的,因為在大部分情況下,開發速度優先于執行速度,
另外大家注意:光理論是不夠的,這里順便總大家一套2020最新python入門到高級專案實戰視頻教程,可以去小編的Python交流.裙 :七衣衣九七七巴而五(數字的諧音)轉換下可以找到了,還可以跟老司機交流討教!
但也不要過于擔心 python 的速度,這并不一定是一個非此即彼的命題,經過適當優化,Python 應用程式可以以驚人的速度運行 —— 也許還不能達到 Java 或 C 語言的速度,但是對于 Web 應用程式、資料分析、管理和自動化工具以及大多數其他用途來說,速度已經足夠快了,快到你可能會忘記了你是在用應用程式性能換取開發人員的生產力,
優化 Python 性能不能單從一個角度上看,而是應用所有可用的優化方法,并選擇最適合當前場景的多種方法的集合,(Dropbox 的員工有一個最令人瞠目的例子,展示了 python 優化的強大功能,點擊鏈接查看,)
在本文中,我將簡單講述許多常見的 python 優化方法,有些是臨時措施,只需要簡單地將一項轉換為另一項 (例如更換 Python 解釋器),但是那些帶來最大收益的方法將需要更詳細的作業,
1. 算速度、算速度、算速度!
如果你不能夠找出速度慢的原因所在,你就不能確定你的 python 應用程式為什么運行地不夠理想,
計算的方法有很多,你可以嘗試 python 內置的 cProfile 模塊 進行簡單的計算分析,如果需要更高的精度(計算每行陳述句運行時間),可以使用 line_profiler 第三方工具,通常而言,從計算程式的函式運行時間進行分析就能夠給你提供改進方案,所以推薦使用 profilehooks 第三方庫,它能計算單個函式的運行時間,
你可能需要更多的挖掘才能發現為什么你的程式某個地方這么慢、怎么修復它,重點在于縮小你的排查范圍,逐漸細化到某條陳述句上,
2. 快取需要重復使用的資料
當你可以把需要計算出來的資料保存下來的時候,千萬不要重復上千次去計算它,如果你有一個經常需要使用的函式,而且回傳的是可預測的結果,Python 已經給你提供了一個選項,能將其快取到記憶體中,后續的函式呼叫如果是一樣的,將立即回傳結果,
有許多方法都可以做到,比如說:使用 python 的一個本地庫:functools,擁有一個裝飾器,叫 @functools.lru_cache,它能夠快取函式最近的 N 個呼叫,當快取的值在特定時間內保持不變的時候這個非常好用,比如說列出最近一天使用的物品,
3. 將數學計算重構為 NumPy
如果你的 Python 程式中有基于矩陣或陣列的數學運算,并且希望更高效地對它們進行計算,那么你就應該使用 NumPy,因為它通過使用 C 庫來完成繁重的作業,比原生 python 解釋器能更快得處理陣列,而且能比 Python 內置資料結構更有效地存盤數字資料,
NumPy 還可以極大地加速相對普通的數學運算,該包為許多常見的 Python 數學操作 (如 min 和 max) 提供了替換,這些操作的速度比原始 Python 快很多倍,
NumPy 的另一個優點是對大型物件 (比如包含數百萬項的串列) 能更有效地使用記憶體,一般來說,如果用傳統的 Python 表示類似于 NumPy 中的大型物件,那么它們將占用大約四分之一的記憶體,
重寫 Python 演算法以使用 NumPy 需要做一些作業,因為需要使用 NumPy 的語法重新宣告陣列物件,但是 NumPy 在實際的數學操作中使用 Python 現有的習慣用法 (+、- 等等),所以切換到 NumPy 并不會讓人太迷惑,
4. 使用 C 庫
NumPy 使用 C 撰寫的庫是一種很好的方法,如果現有的 C 庫能夠滿足你的需求,那么 Python 及其生態系統將提供幾個選項來連接到該庫并利用其提高速度,
最常用的方法是 Python 的 ctypes 庫](https://pythondict.com/tag/%e5%ba%93/ “庫”),因為 ctypes 與其他 Python 應用程式廣泛兼容,所以它是最好的起點,但也并不是唯一的,CFFI 專案為 C. Cython 提供了一個更優雅的介面 (參見下面第五點),也可以用來包裝外部庫,代價是你必須學習 Cython 的標記方法,
5. 轉換為 Cython
如果你非常追求速度,應該用 C 而不是 python,但是對于我這種有 python 依賴癥的人來說,對 C 天生就有種畏懼,現在有一個很好的解決辦法出來了,
Cython 允許 Python 用戶方便地訪問 C 的速度,現有的 Python 代碼可以逐步轉換為 C :首先通過 Cython 將所述代碼編譯為 C,然后通過添加型別注釋以獲得更快的速度,
不過,Cython 不能變魔術,按原樣轉換為 Cython 的代碼通常運行速度通常不會加快超過 15%到 50%,因為該級別的大多數優化都集中在減少 Python 解釋器的開銷上,只有在為 Cython 模塊提供型別注釋時才允許將相關代碼轉換為純 C,這時候的速度提升才最大,
6. 使用多執行緒
由于全域解釋器鎖(GIL)的存在,Python 規定一次只執行一個執行緒,以避免在使用多個執行緒時出現狀態問題,它的存在有充分的理由,但依然很討厭,
隨著時間的推移,GIL 的效率顯著提高 (這是為什么你應該用 python3 的其中一個原因),但是核心問題仍然存在,為了解決這個問題,Python 提供了多處理模塊(multiprocessing)來在單獨的內核上運行 Python 解釋器的多個行程,狀態可以通過共享記憶體或服務器行程共享,資料可以通過佇列或管道在行程實體之間傳遞,
您仍然必須手動管理行程之間的狀態,此外,啟動多個 Python 實體并在它們之間傳遞物件也會涉及不少開銷,盡管如此,多處理庫還是很有用的,另外,使用了 C 庫的 Python 模塊和包 (如 NumPy) 也是完全避免 GIL 的,這也是推薦它們提高速度的另一個原因,
7. 知道你的庫正在干嘛
簡單地輸入 import xyz 是多么方便啊,但是你知道,第三方庫雖然可以改變應用程式的性能,但并不總是向好的方向發展,
有時,你加了某個模塊的時候,應用程式反而變慢了,這就是來自特定庫的模塊構成瓶頸,同樣,仔細計算運行時間也會有所幫助,有時則不那么明顯,示例:Pyglet 是一個用于創建視窗圖形化應用程式的庫,它自動啟用除錯模式,這將極大地影響性能,直到顯式禁用為止,除非閱讀檔案,否則你可能永遠不會意識到這一點,多讀書,多了解情況,
8. 意識到平臺間的速度差異
Python 的運行是跨平臺的,但這并不意味著每個作業系統 (Windows、Linux、OS X) 的特性都可以在 Python 下抽象出來,大多數情況下,你需要了解平臺的細節,比如路徑命名約定等等,
但在性能方面,理解平臺的差異也很重要,例如,有些 python 腳本需要使用 Windows 的 api 去訪問一些特定的應用,這些應用也可能會減慢運行速度,
9. 使用 pypy 運行程式
CPython 是 Python 最常用的優化方案,因為它優先考慮兼容性而不是原始速度,對于那些想把速度放在首位的程式員來說,PyPy 是一個 Python 更好的方案,它配備了一個 JIT 編譯器來加速代碼的執行(編譯為 C 代碼),
因為 PyPy 被設計為 CPython 的一個臨時替代品,所以它是獲得快速性能提升的最簡單方法之一,大多數 Python 應用程式將完全按原樣運行在 PyPy 上,然而,充分利用 PyPy 可能需要不斷地測驗,你將會發現,長時間運行的應用程式更有可能從 PyPy 中獲得了最大的性能收益,因為編譯器會隨著時間分析執行情況,對于運行和退出的簡短腳本,最好使用 CPython,因為性能的提高不足以克服 JIT 的開銷,
10. 升級到 python3
如果你用的是 python2,而且沒有壓倒一切的理由 (比如一個不兼容的模塊) 堅持使用它,你應該跳到 python3,
Python 3 中還有許多 Python 2.x 中沒有的構造和優化,例如,Python 3.5 使異步變得不那么棘手,async 和 await 關鍵字成為語言語法的一部分,Python 3.2 對全域解釋器鎖進行了重大升級,顯著改進了 Python 處理多執行緒的方式,
以上就是全部十點的改進方案啦,盡管使用了這些方法可能運行速度還是無法超過 C 和 Java,但是代碼跑得快不快,不取決于語言,而是取決于人,況且 Python 本身不必是最快的,只要足夠快就行
最后注意:光理論是不夠的,這里順便總大家一套2020最新python入門到高級專案實戰視頻教程,可以去小編的Python交流.裙 :七衣衣九七七巴而五(數字的諧音)轉換下可以找到了,還可以跟老司機交流討教!
本文的文字及圖片來源于網路加上自己的想法,僅供學習、交流使用,不具有任何商業用途,著作權歸原作者所有,如有問題請及時聯系我們以作處理,
轉載請註明出處,本文鏈接:https://www.uj5u.com/houduan/147260.html
標籤:Python
