在python中训练randomforest时哪个dtype表现更好?

时间:2016-03-04 16:52:08

标签: python pandas scikit-learn

我试图在python中训练randomforest分类器。但是,在我原来的pandas.dataframe中,有 float64,object,datetime64,int64和bool dtypes(pandas中允许的几乎所有类型的dtypes)。

  • 是否有必要将 bool 转换为浮动 int
  • 对于双值对象列,我应该将其转换为 bool int 浮动 ?哪一个表现更好?或者没关系?

谢谢!

1 个答案:

答案 0 :(得分:2)

几乎所有的scikit-learn估算器都会在运行算法之前将输入数据转换为float,而不管数组中的原始类型如何。这适用于随机森林实施。