我在 Python 中有 Pandas 資料框,如下所示:
NR
--------
910517196
921122192
NaN
通過使用下面的代碼,我嘗試根據上面資料框中的 NR 列計算年齡(下面的代碼如何作業無關緊要,我知道它是正確的 - 簡單地說,我采用 6 個第一個值來計算年齡,因為例如 910517 是1991-05-17 :)):
df["age"] = (ABT_DATE - pd.to_datetime(df.NR.str[:6], format = '%y%m%d')) / np.timedelta64(1, 'Y')
我的問題是:我可以修改上面的代碼以僅使用資料框中“NR”列中的 NOT NaN 值來計算年齡,但有些值是 NaN。
我的問題是:如何修改我的代碼以便僅計算列“NR”中的這些行,其中不是 NaN ?
因此,我需要類似下面的內容,所以我只需要暫時忽略 NaN 行,并且在 NR 列中存在 NaN 的情況下,在計算的年齡列中也插入一個 NaN:
NR age
------------------
910517196 | 30
921122192 | 29
NaN | NaN
我怎樣才能在 Python Pandas 中做到這一點?
uj5u.com熱心網友回復:
df['age']=np.where(df['NR'].notnull(),'your_calculation',np.nan)
轉載請註明出處,本文鏈接:https://www.uj5u.com/qukuanlian/321361.html
上一篇:在PythonPandas中基于波蘭語PESEL計算年齡時出錯?
下一篇:開始日期大于日歷周期的結束日期
