在R中拆分随机数据

时间:2016-02-09 22:47:03

标签: r split dataset random-sample

我是R的新用户。我需要将数据集随机分成两部分。第一个包含2000个obs作为训练样本,另一个包含1333个用于验证的obs。麻木的总麻木是3333.我怎么能在R? 非常感谢你。

1 个答案:

答案 0 :(得分:0)

随机选择内容时,您通常希望使用sample(...)

> trainingIndices = sample(c(TRUE, FALSE), nrow(dataset), replace = TRUE)
> testingIndices = !trainingIndices
> trainingSet = dataset[trainingIndices,]
> testingSet = dataset[trainingIndices,]