背景:我正在創建一個配方來清理和轉換將被多個模型使用的時間序列資料。該配方中的一個步驟是使用step_corr()函式來移除相關的預測因子。
然而,由于資料集的性質,在使用滾動視窗進行交叉驗證時,一些變數可能在整個訓練資料集中具有恒定的值,從而導致step_corr()函式拋出一個警告。
問題陳述:在這種情況下,是否有可能將此類變數從相關步驟中排除?或者完全洗掉該變數?
P.S.我想知道,我是否可以在相關步驟中排除這些變數?
P.S. 我知道我可以很容易地忽略這個警告并繼續進行。但是我正在尋找一種更干凈的方法/最佳實踐建議。
uj5u.com熱心網友回復:
有兩個步驟供你考慮:
。step_zv()將洗掉所有具有相同值的變數(零差異)step_nzv()將洗掉almost都有相同值的變數(高度稀疏和不平衡) 。
轉載請註明出處,本文鏈接:https://www.uj5u.com/houduan/306885.html
標籤:
