pandas的檔案讀取和保存
一、Excel檔案的讀取(read_excel)
pd.read_excel(io, sheetname=0, header=0, skiprows=None, skip_footer=0, index_col=None, names=None, parse_cols=None, parse_dates=False, date_parser=None, na_values=None, thousands=None, convert_float=True, has_index_names=None, converters=None, dtype=None, true_values=None, false_values=None, engine=None, squeeze=False, **kwds)
引數說明:
-
io:字串,檔案的路徑物件
-
sheetname:None、string、int、字串串列或者是整數串列,default 為0,字串用于作業表名稱,整數用于零索引作業表位置,字串串列或整數串列用于請求多個作業表,為None時獲取所有作業表,

| sheetname | 值的描述 |
|---|---|
| 0 | 獲取sheet1表格 |
| 1 | 獲取sheet2表格 |
| ‘Sheet3’ | 獲取sheet3表格 |
| [0,1,‘Sheet5’] | 獲取sheet1,sheet2和sheet5表格 |
-
header: 表示的是哪一行作為列索引,默認是0(第一行), 當header不為第一行的時候,會將默認為列索引之前的行全部洗掉不讀,資料為列名行以下的資料;若資料不含列名,則設定 header = None,
-
names:當檔案中沒有給出表頭的時候,需要將header設定為None值, 并且傳入與列相同數量的list
data = pd.read_excel(r'G:\第四階段-資料分析\day07\作業\meal_order_detail.xlsx',header=None,names=np.arange(19)) print(data.head()) -
index_col:指定列為索引列,默認None列(0索引)用作DataFrame的行標簽,\
-
skiprows :跳過指定行(包括)之前的行開始讀取
-
傳入的值從1開始的任意int型別,超出行的長度不報錯,顯示為空,如下:
Empty DataFrame
Columns: []
Index: [] -
只剩最后一條資料時,顯示如下:
Empty DataFrame
Columns: [4, peter, 18, man]
Index: []
nrows -
值為int型別,默認None,只取前n行資料,按索引傳參
-
傳入值為0時,只取第一行,顯示如下:
Empty DataFrame
Columns: [1, jack, 22, man]
Index: [] -
傳入其余值時,只顯示該值(包括)之前的行,超出行的長度后不報錯,有多少行顯示多少行
-
二、讀取csv檔案(read_csv)
注釋:.csv屬于文本檔案,逗號分隔檔案,編碼一般為gbk;
引數說明:
- sep:元素之間分隔符,csv檔案默認分隔符為逗號;
- engine:{‘c’, ‘python’},底層編譯的方式,默認是c語言,如果遇到問題,可以將engine改為Python;
- encoding:一般是gbk
- delimiter:str, default None,定界符,備選分隔符(如果指定該引數,則sep引數失效)
pd.read_table( r’path’,
sep=’,’,
encoding=‘gbk’,
engine=‘python’).head()

三、檔案的保存
(1)保存到excel檔案:to_excel
引數說明:
- excel_writer:字串或Excelwrite物件,檔案路徑或現有的ExcelWriter
- sheet_name:字串,默認’Sheet1’
- na_rep:字串,默認’ ',缺失資料表示
df.to_excel(‘filename.xlsx’)
(2)保存到csv檔案:to_csv
引數說明:
- path_or_buf:默認值為None,字串或檔案句柄,默認無檔案,路徑或物件,如果沒有提供,結果將回傳為字串.
- sep:輸出檔案的欄位的分隔符,默認為’,’
- na_rep:缺失資料表示,默認為’ ’
,默認無檔案,路徑或物件,如果沒有提供,結果將回傳為字串.
- sep:輸出檔案的欄位的分隔符,默認為’,’
- na_rep:缺失資料表示,默認為’ ’
轉載請註明出處,本文鏈接:https://www.uj5u.com/houduan/245224.html
標籤:python
上一篇:堆疊和佇列精華決議
下一篇:pandas分組聚合、表格操作
