Hello大家好!!!之前有一次肥學介紹過關于python重要庫的博文鏈接文章里面介紹了一些常用的爬蟲啊,資料分析啊和自動化辦公啊等等的一些個常用到的庫,大家反映還不錯最近又整理了一些好用的庫但是只是初級介紹,如果大家用得到的話還請自己到官網上查一下,因為東西太多我一 一介紹的話可能不太現實

哈哈哈那我們言歸正傳,開搞!!!
這里寫目錄標題
- 導讀
- 前戲
- 1 Python標準庫
- 2 科學計算與統計
- 3 資料處理與分析
- 4 可視化
- 5 機器學習、深度學習和強化學習
- 6自然語言處理
導讀
通常,開發大量原始代碼是一個費時費力的作業而且有時候有很多專業知識我們不可能都一 一弄懂,為了避免這種情況,我們會盡可能多地使用庫中已有的類來創建物件,通常僅需要一行代碼,因此,庫能夠幫助我們使用適量的代碼執行重要的任務,我想這也是為什么python能夠活躍在我們身邊的原因之一吧,歡迎大家點贊收藏,日后學習,
前戲
剛才忘了說了,大家在用python的時候我還是推薦大家下一個集成開發環境Anaconda這里面能夠更好的管理這些第三方庫檔案,其好處只有你真正用過才知道老規矩想用的話自己查, 老師說過: “程式員最長走的兩條路一是自己去百度;二是找別人幫你百度!!!” 這真的是名言

1 Python標準庫

有時候你可能想不到python標準庫里面有這么多工功能,Python標準庫提供了豐富的功能,包括文本/二進制資料處理、數學運算、函式式編程、檔案/目錄訪問、資料持久化、資料壓縮/歸檔、加密、作業系統服務、并發編程、行程間通信、網路協議、JSON / XML /其他Internet資料格式、多媒體、國際化、GUI、除錯、分析等,下面列出了一部分Python標準庫模塊,
-
difflib:差異計算工具
-
collections:建立在串列、元組、字典和集合基礎上的加強版資料結構,
-
csv:處理用逗號分隔值的檔案,
-
datetime, time:日期和時間操作,
-
decimal:定點或浮點運算,包括貨幣計算,
-
doctest:通過驗證測驗或嵌入在docstring中的預期結果進行簡單的單元測驗,
-
json:處理用于Web服務和NoSQL檔案資料庫的JSON(JavaScript Object Notation)資料,
-
math:常見的數學常量和運算,
-
os:與作業系統進行互動,
-
queue:一種先進先出的資料結構,
-
random:偽亂數操作,
-
re:用于模式匹配的正則運算式,
-
sqlite3:SQLite關系資料庫訪問,
-
statistics:數理統計函式,如均值、中值、眾數和方差等,
-
sys:—命令列引數處理,如標準輸入流、輸出流和錯誤流,
-
timeit:性能分析,
-
string:通用字串操作
-
textwrap:文本填充
-
unicodedata:Unicode字符資料庫
-
stringprep:互聯網字串準備工具
-
readline:GNU按行讀取介面
-
rlcompleter:GNU按行讀取的實作函式
Python擁有一個龐大且仍在快速增長的開源社區,社區中的開發者來自許多不同的領域,該社區中有大量的開源庫是Python受歡迎的最重要的原因之一,

許多任務只需要幾行Python代碼就可以完成,這會令人感到很神奇,下面列出了一些流行的資料科學庫,

2 科學計算與統計
- NumPy(Numerical Python):Python沒有內置的陣列資料結構,它提供的串列型別雖然使用起來更方便,但是處理速度較慢,NumPy提供了高性能的ndarray資料結構來表示串列和矩陣,同時還提供了處理這些資料結構的操作,
- SciPy(Scientific Python):SciPy基于NumPy開發,增加了用于科學處理的程式,例如積分、微分方程、額外的矩陣處理等,scipy.org負責管理SciPy和NumPy,
StatsModels:為統計模型評估、統計測驗和統計資料研究提供支持, - IPython是Python科學計算標準工具集的組成部分,它可以把很多東西聯系到一起,有點類似一個增強版的Python shell,目的是為了提高編程,測驗和除錯Python代碼的速度,好像很多國外的大學教授,還有Google大牛都很喜歡用IPython,確實很方便,
3 資料處理與分析

- pandas:一個非常流行的資料處理庫,pandas充分利用了NumPy的ndarray型別,它的兩個關鍵資料結構是Series(一維)和DataFrame(二維),
- modin[14] pandas加速庫,介面語法與pandas高度一致
- dask[15] pandas加速庫,介面語法與pandas高度一致
- plydata[16] pandas管道語法庫
4 可視化
- Pyecharts Echarts 是個由百度開源的資料可視化,憑借著良好的互動性,精巧的圖表設計,得到了眾多開發者的認可,而 Python 是門富有表達力的語言,很適合用于資料處理,當資料分析遇上資料可視化時pyecharts 誕生了
- Matplotlib:可高度定制的可視化和繪圖庫,Matplotlib可以繪制正規圖、散點圖、柱狀圖、等高線圖、餅圖、矢量場圖、網格圖、極坐標圖、3D圖以及添加文字說明等,
Seaborn:基于Matplotlib構建的更高級別的可視化庫,與Matplotlib相比,Seaborn改進了外觀,增加了可視化的方法,并且可以使用更少的代碼創建可視化,

5 機器學習、深度學習和強化學習

-
scikit-learn:一個頂級的機器學習庫,機器學習是AI的一個子集,深度學習則是機器學習的一個子集,專注于神經網路,
-
Keras:最易于使用的深度學習庫之一,Keras運行在TensorFlow(谷歌)、CNTK(微軟的深度學習認知工具包)或Theano(蒙特利爾大學)之上,
-
TensorFlow:由谷歌開發,是使用最廣泛的深度學習庫,TensorFlow與GPU(圖形處理單元)或谷歌的定制TPU(Tensor處理單元)配合使用可以獲得最佳的性能,TensorFlow在人工智能和大資料分析中有非常重要的地位,因為人工智能和大資料對資料處理的需求非常巨大,
-
OpenAI Gym:用于開發、測驗和比較強化學習演算法的庫和開發環境,
-
pytorch ?Pytorch是torch的python版本,是由Facebook開源的神經網路框架,專門針對 GPU 加速的深度神經網路(DNN)編程,Torch 是一個經典的對多維矩陣資料進行操作的張量(tensor )庫,在機器學習和其他數學密集型應用有廣泛應用,與Tensorflow的靜態計算圖不同,pytorch的計算圖是動態的,可以根據計算需要實時改變計算圖,但由于Torch語言采用 Lua,導致在國內一直很小眾,并逐漸被支持 Python 的 Tensorflow 搶走用戶,作為經典機器學習庫 Torch 的埠,PyTorch 為 Python 語言使用者提供了舒適的寫代碼選擇,
6自然語言處理

- NLTK(Natural Language Toolkit):用于完成自然語言處理(NLP)任務,
- TextBlob:一個面向物件的NLP文本處理庫,基于NLTK和模式NLP庫構建,簡化了許多NLP任務,
- Gensim:功能與NLTK類似,通常用于為檔案合集構建索引,然后確定另一個檔案與索引中每個檔案的相似程度,
博主主頁:https://blog.csdn.net/jiahuiandxuehui?spm=1011.2124.3001.5343
轉載請註明出處,本文鏈接:https://www.uj5u.com/qita/286194.html
標籤:AI
上一篇:趁著課余時間學點Python(九)函式的進階 生成器 裝飾器的理解
下一篇:C語言 二叉樹與堆
