在python的sklearn中的RandomForestClassifier中包括oob_Score = True和不包括oob_score有什么区别? Out-of-bag(OOB)误差是使用从各自的引导程序样本权中不包含的树的预测中计算出的每个误差的平均误差,因此包括参数oob_score = True会如何影响平均误差的计算。 / p>
答案 0 :(得分:1)
对于每棵树,仅选择一部分数据来构建树,即训练。其余样本为袋装样本。这些袋装样本可在培训期间直接使用以计算测试准确性。如果激活该选项,将计算“ oob_score_”和“ oob_prediction _”。
如果激活或不激活该选项,则训练模型将不会更改。显然,由于RF的随机性,如果您应用两次,该模型将不完全相同,但是与“ oob_score”选项无关。 不幸的是,scikit-learn选项不允许您设置OOB比率,即用于构建树的样本百分比。其他库(例如C ++ Shark http://image.diku.dk/shark/sphinx_pages/build/html/rest_sources/tutorials/algorithms/rf.html)就是这种情况。