以下是我目前创建两个独立样本DS和RS的方法:
data$rnd<-runif(nrow(data),0,1)
fraction<-0.5
DS<-subset(data, rnd <= fraction)
RS<-subset(data, rnd > fraction)
显然,这只会给我两个大小相等的样本。我想如果我能得到完全相等的分裂,我的交叉验证分析会更有效(但是我的样本有不等的n)。我想到了一个自然数字生成器,它可以在1和N之间选择每个数字,但我没有找到任何东西。
答案 0 :(得分:1)
使用sample
:
mask<-sample(nrow(data),nrow(data)/2);
DS<-data[mask,]
RS<-data[-mask,]
答案 1 :(得分:0)
您是否尝试从您拥有的数据中模拟新数据或样本?
如果是后者,请做样本(数据,大小,替换=假)
如果您提供帮助(样本),您将获得所有详细信息。