我對從一個現有的資料集(10000行和114列)中隨機抽取樣本感興趣,其大小不斷增加(從194到236:194、208、222、236),并且可以替換。
直到現在,我一直在嘗試這樣做。然而,我找不到輸入不同大小的方法(這就是為什么它在x定義中失敗了)。
# A small portion of the dataset.
資料集<-資料。 frame(ID = c("model0001">。 "model0002"/span>。 "model0003", "model0004", "model0005",
"model0006", "model0007", "model0008"。 "model0009", "model0010"),
IL_NA = 1。 10, PROD = 11。 20, INJ = 21。 30)
# 如前所述,我的真實尺寸是-> seq(194,236,by=14),得到的樣本尺寸為194, 208, 222, 236; 對于這個例子:
sizes < - seq(1, 8, by=2)
x < - rep_sample_n(candidate_wells, size=sizes。 replace=T。 reps=4)
sample_set < - lapply( x, function(i) dataset[sample(nrow(dataset)。 i), ])
如果有任何幫助,我們將不勝感激。 謝謝!
uj5u.com熱心網友回復:
你真的很接近。我不知道rep_sample_n來自哪里,但是如果你跳過這一行,其他的東西看起來都是對的:
sizes < - seq(1, 8。 通過= 2)
sample_set < - lapply(sizes, function(i) dataset[sample(nrow(dataset)。 i), ])
轉載請註明出處,本文鏈接:https://www.uj5u.com/gongcheng/322200.html
標籤:
下一篇:基于字串串列的公式輸出
