pandas的檔案讀取和保存

一、Excel檔案的讀取(read_excel)

pd.read_excel(io, sheetname=0, header=0, skiprows=None, skip_footer=0, index_col=None, names=None, parse_cols=None, parse_dates=False, date_parser=None, na_values=None, thousands=None, convert_float=True, has_index_names=None, converters=None, dtype=None, true_values=None, false_values=None, engine=None, squeeze=False, **kwds)

引數說明:

io:字串,檔案的路徑物件
sheetname：None、string、int、字串串列或者是整數串列，default 為0，字串用于作業表名稱,整數用于零索引作業表位置,字串串列或整數串列用于請求多個作業表，為None時獲取所有作業表，

在這里插入圖片描述

sheetname	值的描述
0	獲取sheet1表格
1	獲取sheet2表格
‘Sheet3’	獲取sheet3表格
[0,1,‘Sheet5’]	獲取sheet1,sheet2和sheet5表格

header：表示的是哪一行作為列索引,默認是0(第一行), 當header不為第一行的時候,會將默認為列索引之前的行全部洗掉不讀，資料為列名行以下的資料；若資料不含列名，則設定 header = None，

names：當檔案中沒有給出表頭的時候,需要將header設定為None值, 并且傳入與列相同數量的list

data = pd.read_excel(r'G:\第四階段-資料分析\day07\作業\meal_order_detail.xlsx',header=None,names=np.arange(19))
print(data.head())

index_col：指定列為索引列，默認None列（0索引）用作DataFrame的行標簽，\
skiprows :跳過指定行(包括)之前的行開始讀取
- 傳入的值從1開始的任意int型別，超出行的長度不報錯，顯示為空，如下：
  Empty DataFrame
  Columns: []
  Index: []
- 只剩最后一條資料時，顯示如下：
  Empty DataFrame
  Columns: [4, peter, 18, man]
  Index: []
  nrows
- 值為int型別，默認None，只取前n行資料，按索引傳參
- 傳入值為0時，只取第一行，顯示如下：
  Empty DataFrame
  Columns: [1, jack, 22, man]
  Index: []
- 傳入其余值時，只顯示該值(包括)之前的行，超出行的長度后不報錯，有多少行顯示多少行

二、讀取csv檔案(read_csv)

注釋：.csv屬于文本檔案,逗號分隔檔案,編碼一般為gbk;

引數說明:

sep:元素之間分隔符,csv檔案默認分隔符為逗號;
engine:{‘c’, ‘python’},底層編譯的方式,默認是c語言,如果遇到問題,可以將engine改為Python;
encoding:一般是gbk
delimiter:str, default None,定界符，備選分隔符（如果指定該引數，則sep引數失效）

pd.read_table( r’path’,
sep=’,’,
encoding=‘gbk’,
engine=‘python’).head()

在這里插入圖片描述

三、檔案的保存

（1）保存到excel檔案:to_excel

引數說明:

excel_writer:字串或Excelwrite物件,檔案路徑或現有的ExcelWriter
sheet_name:字串,默認’Sheet1’
na_rep:字串,默認’ ',缺失資料表示

df.to_excel(‘filename.xlsx’)

(2)保存到csv檔案:to_csv

引數說明:

path_or_buf:默認值為None,字串或檔案句柄，默認無檔案,路徑或物件，如果沒有提供，結果將回傳為字串.
sep:輸出檔案的欄位的分隔符,默認為’,’
na_rep:缺失資料表示,默認為’ ’

，默認無檔案,路徑或物件，如果沒有提供，結果將回傳為字串.

sep:輸出檔案的欄位的分隔符,默認為’,’
na_rep:缺失資料表示,默認為’ ’

轉載請註明出處，本文鏈接：https://www.uj5u.com/houduan/245224.html

標籤：python

上一篇：堆疊和佇列精華決議

下一篇：pandas分組聚合、表格操作