我目前正在閱讀 5 個 CSV 檔案,并希望獲取不同變數的特定資料列
我正在用 Pandas read_csv 做這件事,然后嘗試切片該變數
all_files = pd.read_csv('ca.csv'), pd.read_csv("ny.csv"), pd.read_csv("tn.csv"), pd.read_csv('az.csv'), pd.read_csv("tx.csv')
date_index = all_files[1:, 1]
這會引發錯誤TypeError:元組索引必須是整數或切片,而不是元組
不知道我哪里出錯了?
uj5u.com熱心網友回復:
錯誤的原因是all_files多個資料幀的元組,您讀取的每個檔案都有一個。因此,當您嘗試這樣做時,all_files[slice]您正在切片tuple,而不是它包含的資料幀。元組只能使用整數切片,就像普通串列一樣,因此會出現錯誤。
如果要從每個資料幀中獲取相同的列,則需要一些回圈結構:
date_indexes = [df.ix[:,0] for df in all_files]
例如,上面的代碼將從您讀取的每個資料幀中獲取第一列,作為一個系列,在串列中。
如果您打算在閱讀后以某種方式組合資料框,則您可能不需要這樣做。你可以考慮堆疊它們。如果您想要通過組合每個檔案中的相同列來獲得長序列,則堆疊也適用于 Pandas 系列(這是從資料幀中提取的列)。
轉載請註明出處,本文鏈接:https://www.uj5u.com/net/313629.html
上一篇:PythonBeautifulSoup-抓取多個頁面并將結果匯出到CVS
下一篇:在CSV檔案中添加和附加資料
