設定索引時從第一個單元格中洗掉內容-有解無憂

我有一個原始資料框df，如下所示：

    0                 1      2      3      4      5      6        7
0   Table 3.1a        NaN    NaN    NaN    NaN    NaN    NaN      NaN
1   BLANK             NaN    NaN    NaN    NaN    NaN    NaN      NaN
2   BLANK             FY2015 FY2016 FY2017 FY2018 FY2019 FY2020   FY2021
3   BLANK             NaN    NaN    NaN    NaN    NaN   (Revised) (Budgeted)
4   Operating Revenue 64823  68964  75816  73738  74274 64608     76636

我試圖將資料幀的索引設定為第一列，并將索引 2 行設定為標題，并使用 BLANK 和 NaN 洗掉空行。

但是，當我運行以下代碼時：

df = df.set_index(df.columns[0])
new_header = df.iloc[2]
df = df.drop([df.index[0], df.index[1], df.index[2], df.index[3]])
df.columns = new_header

結果資料框是：

BLANK               FY2015  FY2016  FY2017  FY2018  FY2019  FY2020  FY2021
0                           
Operating Revenue   64823   68964   75816   73738   74274   64608   76636
Tax Revenue 55647   58699   66363   66203   67645   58564   69964
Fees and Charges    8674    9760    9075    7106    6275    5595    6185
Others              502     506     378     430     354     449     487
Total Expenditure   67447   71045   73556   77824   75337   94056   102338

我該怎么做才能從標題行（“BLANK”）的第一個專案中洗掉 BLANK 并洗掉“BLANK”單元格下方的 0？我想在最后實作的資料框是：

                    FY2015  FY2016  FY2017  FY2018  FY2019  FY2020  FY2021                      
Operating Revenue   64823   68964   75816   73738   74274   64608   76636
Tax Revenue 55647   58699   66363   66203   67645   58564   69964
Fees and Charges    8674    9760    9075    7106    6275    5595    6185
Others              502     506     378     430     354     449     487
Total Expenditure   67447   71045   73556   77824   75337   94056   102338

uj5u.com熱心網友回復：

從您的原始 DataFrame 開始，您可以嘗試：

df = df.drop(df.index[[0,1,3]])
df = df.rename(columns=df.iloc[0])
df = df.drop(df.index[0])
df = df.set_index(df.columns[0])
df.index.name = None

另外，請注意，Tax Revenue您的值可能位于錯誤的位置，因為第一個數字位于索引列中。

轉載請註明出處，本文鏈接：https://www.uj5u.com/ruanti/333425.html

標籤：Python 熊猫

上一篇：將字串轉換為確定正確年份的確切日期

下一篇：Pandas在條件下添加列：如果單元格的值為True，則將Period中最大數字的值設定為true