1)随机森林是否需要归一化?
2)应该对所有特征进行归一化还是仅对数字进行归一化?
3)在拆分为训练数据和测试数据之前还是之后进行归一化是否重要?
4)我是否需要预处理也会被分类的将来对象的特征? (在接受模型之后,而不是在测试期间)
答案 0 :(得分:1)
1)否!特征归一化对于任何基于树的分类器都是不必要的。
2)一般来说,归一化应该在所有功能上进行,而不仅仅是数字功能。
3)在实践中并没有太大区别。但是,正确的做法是从训练集中识别每个特征的最小值和最大值,然后根据这些值对两个集的特征进行归一化。
4)是,此后,任何样品需要与培训期间一样完全处理。