pandas

資料分析處理庫
pandas官方網站
pandas中文網

API

說明：
import pandas as pd
df_obj: DataFrame物件（表格型的資料結構，提供有序的列和不同型別的列值）
s_obj: series物件（一維陣列物件，包含一組索引和一組資料）
1. pd.read_csv(filepath_or_buffer, ...)
??將csv檔案讀取到DataFrame中，
?常用引數：
?? filepath_or_buffer：任何有效的字串路徑；也可以是URL，有效的URL方案包括：http, ftp, s3 和 file.
?回傳值：
??DataFrame or TextParser
2. df_obj.head(n:int=5)/s_obj.head(n:int=5)
??回傳前n行，
?引數：
??n：int, default:5; 回傳前多少行，
?回傳值：
??same type as caller，
3. pd.value_counts(values, sort:bool=True, ascending:bool=False, normalize:bool=False, bins=None, dropna:bool=True)
??回傳一個包含唯一值計數的Series, 結果降序排列，不包含NaN值，
?引數：
??values: 要統計計數的資料
??sort: bool型別，是否按頻率排序，默認為True.
??ascending: bool型別，升序排列，默認為False.
??normalize: bool型別，是否顯示頻率，默認為False.
??bins: int型別，不再是按值統計計數，而是將區間均分為幾等分，統計每個區間中的計數，
??dropna: bool型別，不包括NaN計數，默認為True.
?回傳值：
??Series.
4. df_obj / s_obj.sort_index(axis=0, level=None, ascending=True, inplace=False, kind="quicksort", na_position="last", sort_remaining=True, ignore_index=False)
??按索引標簽對序列進行排序，
?引數：
??axis: 進行排序的軸（0/index:行，1/columns:列），默認為0.
??level: int / 級別名稱 / 級別串列 / 級別名稱串列；如果不是None, 則對索引級別中的值進行排序，
??ascending: 升序排序，默認為True，
??inplace: 如果為True, 則就地執行操作（改變原序列），默認為False（生成一個排序后的新列），
??kind: 選擇排序演算法，（quicksort, mergesort, heapsort）, 對于DataFrame, 僅對單個列或標簽排序時適用，
??na_position:last / first; NaN放在開頭還是結尾，默認為last.
??sort_remaining: 默認為False, 如果為True且級別或索引是多層的，則按指定級別排序后也按其他級別排序，
??ingore_index: 默認為False, 如果為True, 則結果軸將標記為0,1,2,..., n-1.

轉載請註明出處，本文鏈接：https://www.uj5u.com/houduan/158895.html

標籤：Python

上一篇：Python3標準庫：uuid 全域唯一識別符號

下一篇：實體014：分解質因數

pandas常用API_1

pandas

API