我在R中进行分类。我有一个名为testD的测试数据数据框和一个称为结果的数据数据框(这些是正确的分类值)。
这些数据框非常大,在整个模型上训练我的模型需要太长时间,因此我想随机选择大约5,000个数据点并对其进行训练。
我知道如何从任一数据框中随机选择5,000行,但我需要确切地知道我从'testD'中选择了哪些行,因此我知道要比较的'结果'中有5,000行。
非常感谢任何帮助!
答案 0 :(得分:9)
你可以这样做:
indices = sample(NROW(testD), 5000)
testD.sample = testD[indices, ]
results.sample = results[indices, ]