我有一個龐大的資料集。我想對其進行 K 次采樣,運行線性回歸并每次提取 RMSE 以存盤在資料框中。
偽代碼:
rmse <- emptyDataFrame{}
for (i in 1:100)
sample_n(df, n, replace=True)
model <- lm(y ~ ., data = df)
rmse <- sqrt(mean(y_pred - y)^2))
誰能給我缺少的細節?
uj5u.com熱心網友回復:
您可以添加一個[i]afterrmse將值存盤在不同的索引中。另外,我不知道您的函式是如何sample_n作業的,但也許您需要將其輸出保存在一個新變數中以將其傳遞給lm.
此外,RMSE 的公式是sqrt(mean((y_pred - y)^2))。
rmse <- c()
for (i in 1:100){
df_sampled <- sample_n(df, n, replace=True)
model <- lm(y ~ ., data = df_sampled)
rmse[i] <- sqrt(mean((y_pred - y)^2))
}
as.data.frame(rmse)
轉載請註明出處,本文鏈接:https://www.uj5u.com/ruanti/519479.html
標籤:r数据框循环线性回归
