我想直接在 CatBoost 模型中使用分類特征,我需要在 Catboost 模型中將我的物件列宣告為分類。我的資料框中有一列,它是一個包含 nace 代碼的物件,如下所示:
NACE_code
5632 81.101
8060 41.200
15147 43.120
24644 68.100
29144 86.909
37122 68
39853 43
59268 43
108633 70.220
108693 56.102
175820 43.320
184606 41.200
Name: NACE_code, dtype: object
Python 不接受此列作為分類列。相反,它告訴我這是一個浮點數,因為某些值有點。我在 python 中相對較新,我嘗試了不同的方法從這些值中洗掉點,但我最后一次嘗試將所有沒有點的值更改為 NAN。
df['NACE_code'].str.replace(r"(\d)\.", r"\1")
5632 81101
8060 41200
15147 43120
24644 68100
29144 86909
37122 NaN
39853 NaN
59268 NaN
108633 70220
108693 56102
175820 43320
184606 41200
Name: NACE_KODE, dtype: object
如何讓我的專欄看起來像這樣?我很感激我能得到的任何幫助!
5632 81101
8060 41200
15147 43120
24644 68100
29144 86909
37122 68
39853 43
59268 43
108633 70220
108693 56102
175820 43320
184606 41200
uj5u.com熱心網友回復:
# The following code should work:
df.NACE_code = df.NACE_code.astype(str)
df.NACE_code = df.NACE_code.str.replace('.', '')
uj5u.com熱心網友回復:
用于astype('str')在呼叫之前將列轉換為字串型別str.replace.
沒有正則運算式:
df['NACE_code'].astype('str').str.replace(r".", r"", regex=False)
轉載請註明出處,本文鏈接:https://www.uj5u.com/qita/443801.html
上一篇:如何在一個字串中讀取兩個單詞
