我有一些如下数据:
username, password, valid
kramer, abcd1234, 1
dan,123123123,0
你可以看到数据的字符可以是字符串。所以scikit-learn.RandomForestClassifier返回错误,如
ValueError: could not convert string to float: 'hEZ7P|N*Akem'
我正在考虑两种解决方案。
哪一个更好?你能提出一些建议吗?
答案 0 :(得分:0)
我认为您需要使用像热门编码这样的分类功能进行编码,因为您需要数字表示。请查看此答案以获取更多信息