我使用weka explorer,它有列车/测试分割百分比项目。它以给定的百分比将数据集转换为trainset和testset。我不知道它是否会在weka RF中的trainset中重复实例。重复是否会影响结果。 我知道RandomForest使用bootstrap并且trainset重复实例并且数据集具有相同的大小。
答案 0 :(得分:0)
是否会在weka RF中的trainset中重复实例
是的,它会生成bootstrap示例,所以会有重复的实例,请看一下这里的答案:Exact implementation of RandomForest in Weka 3.7
以及重复是否会影响结果
嗯,这是随机森林的本质,它是如何运作的。但请记住,只是在重复实例中学习,用于评估的测试集保持不变。