我有一個原始資料框df,如下所示:
0 1 2 3 4 5 6 7
0 Table 3.1a NaN NaN NaN NaN NaN NaN NaN
1 BLANK NaN NaN NaN NaN NaN NaN NaN
2 BLANK FY2015 FY2016 FY2017 FY2018 FY2019 FY2020 FY2021
3 BLANK NaN NaN NaN NaN NaN (Revised) (Budgeted)
4 Operating Revenue 64823 68964 75816 73738 74274 64608 76636
我試圖將資料幀的索引設定為第一列,并將索引 2 行設定為標題,并使用 BLANK 和 NaN 洗掉空行。
但是,當我運行以下代碼時:
df = df.set_index(df.columns[0])
new_header = df.iloc[2]
df = df.drop([df.index[0], df.index[1], df.index[2], df.index[3]])
df.columns = new_header
結果資料框是:
BLANK FY2015 FY2016 FY2017 FY2018 FY2019 FY2020 FY2021
0
Operating Revenue 64823 68964 75816 73738 74274 64608 76636
Tax Revenue 55647 58699 66363 66203 67645 58564 69964
Fees and Charges 8674 9760 9075 7106 6275 5595 6185
Others 502 506 378 430 354 449 487
Total Expenditure 67447 71045 73556 77824 75337 94056 102338
我該怎么做才能從標題行(“BLANK”)的第一個專案中洗掉 BLANK 并洗掉“BLANK”單元格下方的 0?我想在最后實作的資料框是:
FY2015 FY2016 FY2017 FY2018 FY2019 FY2020 FY2021
Operating Revenue 64823 68964 75816 73738 74274 64608 76636
Tax Revenue 55647 58699 66363 66203 67645 58564 69964
Fees and Charges 8674 9760 9075 7106 6275 5595 6185
Others 502 506 378 430 354 449 487
Total Expenditure 67447 71045 73556 77824 75337 94056 102338
uj5u.com熱心網友回復:
從您的原始 DataFrame 開始,您可以嘗試:
df = df.drop(df.index[[0,1,3]])
df = df.rename(columns=df.iloc[0])
df = df.drop(df.index[0])
df = df.set_index(df.columns[0])
df.index.name = None
另外,請注意,Tax Revenue您的值可能位于錯誤的位置,因為第一個數字位于索引列中。
轉載請註明出處,本文鏈接:https://www.uj5u.com/ruanti/333425.html
