令筆者對pandas印象最為深刻的一件事,就是在pandas中已經內置了很多資料匯入匯出方法,然而本人并不了解,在一次小專案的作業中曾手寫了一個從excel表格匯入資料到DataFrame的python腳本,這個糗事讓筆者深感代碼能力急需加強!
為了讓那次教訓刻骨銘心,也為了避免廣大讀者再走類似的彎路,本文主要介紹關于pandas的資料匯入匯出功能,理解起來非常簡單,
pandas支持的匯入匯出資料格式多種多樣,有csv,excel,sql,json,html,pickle等,
雖然支持眾多資料格式,但各類資料格式匯入匯出的操作方法千篇一律,了解其中一個便能掌握全部,因而本文以資料分析中常見的csv格式為例,介紹pandas的資料匯入匯出功能,
1 從csv檔案匯入資料到pandas
例中,要讀取的csv檔案與代碼程式在同一目錄下:

exam.csv檔案內容如下:

程式將csv檔案讀入到data變數中:

從中可以看到:pandas默認會將csv檔案的第一行作為列名匯入進來,
如果匯入的資料檔案中沒有保存列名,則在匯入時可以手動添加列名,示例如下:
先復制一份上述csv檔案,去掉原有列名部分,其余不變:

在讀入資料時,指定列名:

2 匯出資料到csv檔案

為方便起見,我們將剛才讀入的資料再次匯出到同目錄下的daochu.csv檔案:

查看daochu.csv檔案中的內容:

可以看到:匯出時選擇了三列資料,并且輸出列名(header=True)與行索引(index=True),索引默認是“0,1,2,3”的形式,
匯出csv檔案函式的引數比較多,可以對匯出后的檔案內容進行多種設定,具體每一個引數的作用效果還要靠諸位親自探索,
轉載請註明出處,本文鏈接:https://www.uj5u.com/houduan/198249.html
標籤:Python
