我有10个类别变量和3个数值变量。分割后我将它们直接喂给Random Forest,但它显示了,
ValueError: could not convert string to float: 'No internet service'
我读到Random Forest可以处理数字变量和类别变量,这为什么会显示此错误?
答案 0 :(得分:2)
这取决于您用于实现RandomForest的库。例如,R可以使用RandomForest处理类别变量。但是,根据我到目前为止的经验,Python中的Sci-kit需要转换为伪变量。该错误告诉我您正在使用Python,因此您很可能会使用sklearn,这需要转换为虚拟变量。您可以用一行代码转换您的列。
pd.get_dummies(df['column_name'])