R 中有一個名為 cut() 的函式,它可以按年份對資料進行分類,以添加“closeyr”列,如下表所示。
df$closeyr <- cut(df$closedate,breaks="year")
| 銀行 | 封閉式 | 關門 |
|---|---|---|
| 銀行1 | 2008-07-25 | 2008-01-01 |
| 銀行2 | 2008-10-20 | 2008-01-01 |
| 銀行3 | 2010-12-10 | 2010-01-01 |
| 銀行4 | 2005-10-01 | 2005-01-01 |
| 銀行5 | 2007-08-04 | 2007-01-01 |
| 銀行6 | 2005-06-10 | 2005-01-01 |
我正在嘗試使用 pandas cut() 函式將其翻譯成 python,但我不知道如何按年分類資料。如果“closedate”中的一行包含年份“2008”,則“closeyr”列中的行值應為“2008-01-01”。
df['closeyr'] = pd.cut(df['closedate'], bins = )
我怎樣才能創建一個新列來按年組織我的“封閉”值來復制上面的表格?
uj5u.com熱心網友回復:
df.closedate = pd.to_datetime(df.closedate)
df['closeyr'] = df.closedate.dt.strftime('%Y-01-01')
df
Out[37]:
Bank closedate closeyr
0 Bank1 2008-07-25 2008-01-01
1 Bank2 2008-10-20 2008-01-01
2 Bank3 2010-12-10 2010-01-01
3 Bank4 2005-10-01 2005-01-01
4 Bank5 2007-08-04 2007-01-01
5 Bank6 2005-06-10 2005-01-01
uj5u.com熱心網友回復:
嘗試這個:
df['closeyr'] = pd.to_datetime(df['closedate']).dt.year.apply(lambda x: pd.Timestamp(x, 1, 1))
轉載請註明出處,本文鏈接:https://www.uj5u.com/gongcheng/441287.html
