我有一个300个数字的向量(从1到300)。我想创建两个子集,即模型/培训(200个数字)和测试集(100个数字)与替换。我尝试使用sample
和subset
,但没有得到我想要的结果。
MWE:
x=(1,2,3,.......300)
x1 = (1,1,2,3,5,5,...........,300) (Consider it training set of 200 samples)
x2 = (1,3,9,101,130,130,..........299)
任何建议请!!!!!
答案 0 :(得分:0)
您可以为训练集创建一组随机索引,然后为测试集选择除索引之外的所有索引,如下所示:
data <- c(1,3,8,7,19,5,4,10,11,20)
i <- sample(1:length(data), 5)
training <- data[i]
test <- data[-i]
这将为训练集获得5分,所有剩余的分数将进入测试集。