pandas
資料分析處理庫
pandas官方網站
pandas中文網
API
說明:
import pandas as pd
df_obj: DataFrame物件(表格型的資料結構,提供有序的列和不同型別的列值)
s_obj: series物件(一維陣列物件,包含一組索引和一組資料)
1. pd.read_csv(filepath_or_buffer, ...)
??將csv檔案讀取到DataFrame中,
?常用引數:
?? filepath_or_buffer:任何有效的字串路徑;也可以是URL,有效的URL方案包括:http, ftp, s3 和 file.
?回傳值:
??DataFrame or TextParser
2. df_obj.head(n:int=5)/s_obj.head(n:int=5)
??回傳前n行,
?引數:
??n:int, default:5; 回傳前多少行,
?回傳值:
??same type as caller,
3. pd.value_counts(values, sort:bool=True, ascending:bool=False, normalize:bool=False, bins=None, dropna:bool=True)
??回傳一個包含唯一值計數的Series, 結果降序排列,不包含NaN值,
?引數:
??values: 要統計計數的資料
??sort: bool型別,是否按頻率排序,默認為True.
??ascending: bool型別,升序排列,默認為False.
??normalize: bool型別,是否顯示頻率,默認為False.
??bins: int型別,不再是按值統計計數,而是將區間均分為幾等分,統計每個區間中的計數,
??dropna: bool型別,不包括NaN計數,默認為True.
?回傳值:
??Series.
4. df_obj / s_obj.sort_index(axis=0, level=None, ascending=True, inplace=False, kind="quicksort", na_position="last", sort_remaining=True, ignore_index=False)
??按索引標簽對序列進行排序,
?引數:
??axis: 進行排序的軸(0/index:行,1/columns:列),默認為0.
??level: int / 級別名稱 / 級別串列 / 級別名稱串列;如果不是None, 則對索引級別中的值進行排序,
??ascending: 升序排序,默認為True,
??inplace: 如果為True, 則就地執行操作(改變原序列),默認為False(生成一個排序后的新列),
??kind: 選擇排序演算法,(quicksort, mergesort, heapsort), 對于DataFrame, 僅對單個列或標簽排序時適用,
??na_position:last / first; NaN放在開頭還是結尾,默認為last.
??sort_remaining: 默認為False, 如果為True且級別或索引是多層的,則按指定級別排序后也按其他級別排序,
??ingore_index: 默認為False, 如果為True, 則結果軸將標記為0,1,2,..., n-1.
轉載請註明出處,本文鏈接:https://www.uj5u.com/houduan/158895.html
標籤:Python
下一篇:實體014:分解質因數
