我是R的新用户。我需要将数据集随机分成两部分。第一个包含2000个obs作为训练样本,另一个包含1333个用于验证的obs。麻木的总麻木是3333.我怎么能在R? 非常感谢你。
答案 0 :(得分:0)
随机选择内容时,您通常希望使用sample(...)
:
> trainingIndices = sample(c(TRUE, FALSE), nrow(dataset), replace = TRUE)
> testingIndices = !trainingIndices
> trainingSet = dataset[trainingIndices,]
> testingSet = dataset[trainingIndices,]