我正在使用 NUTS3 級別的人口統計資料資料框,不同地區以不同的時間間隔報告資料。我總是想要最新的資料,年份因地區而異。
資料可能如下所示 |
region|2015|2014|2013|
AT201 | 101| 100| |
AB301 | | 123| 456|
AB302 | | | 234|
如何將年份列組合成一個包含最新資料的列,例如
region|newest_data|
AT201 | 101|
AB301 | 123|
AB302 | 234|
下面是實際資料截圖的鏈接 https://i.stack.imgur.com/AUP3A.png
非常感謝任何提示或指示!
uj5u.com熱心網友回復:
將 not years 列轉換為 index by DataFrame.set_index,回填缺失值,選擇第一列,重命名并轉換為DataFrame:
df = df.set_index(['region']).bfill(axis=1).iloc[:, 0].rename('newest_data').reset_index()
轉載請註明出處,本文鏈接:https://www.uj5u.com/qiye/345063.html
