无法将分类变量提供给随机森林

时间:2018-08-30 06:14:59

标签: python-3.x machine-learning random-forest

我有10个类别变量和3个数值变量。分割后我将它们直接喂给Random Forest,但它显示了,

ValueError: could not convert string to float: 'No internet service'

我读到Random Forest可以处理数字变量和类别变量,这为什么会显示此错误?

1 个答案:

答案 0 :(得分:2)

这取决于您用于实现RandomForest的库。例如,R可以使用RandomForest处理类别变量。但是,根据我到目前为止的经验,Python中的Sci-kit需要转换为伪变量。该错误告诉我您正在使用Python,因此您很可能会使用sklearn,这需要转换为虚拟变量。您可以用一行代码转换您的列。

pd.get_dummies(df['column_name'])