我想知道随机森林预测时以下两种方法之间的区别:
方法1:
方法2:
方法2(据我了解)是使用所谓的“诚实”树,因为每棵树都建立在一个集合上,并在另一集合上进行预测(这将导致渐近正态预测(Athey&Wager,2017年)但是,这与方法1有什么不同,方法1也是在一个集合上构建我的树,并在另一集合上进行预测?我确实知道在方法1中,我只随机分配一次训练和测试集,而方法2中则是因此,在方法1中,我必须确保两组中X(特征)和Y(标签)之间的联合分布相同,方法2中的情况应该平均。方法1的情况也一样,这两种方法是否相同?那么,我的预测在两种方法中都渐近正常吗?
对此表示感谢,感谢您!