随机林机器是否学习支持字符串字符?

时间:2017-06-28 14:07:57

标签: machine-learning scikit-learn

我有一些如下数据:

username, password, valid
kramer, abcd1234, 1
dan,123123123,0

你可以看到数据的字符可以是字符串。所以scikit-learn.RandomForestClassifier返回错误,如

ValueError: could not convert string to float: 'hEZ7P|N*Akem'

我正在考虑两种解决方案。

  1. 将字符串更改为float,因为它们可以用ASCII
  2. 表示
  3. 找到另一个支持字符串功能的algothrim。
  4. 哪一个更好?你能提出一些建议吗?

1 个答案:

答案 0 :(得分:0)

我认为您需要使用像热门编码这样的分类功能进行编码,因为您需要数字表示。请查看此答案以获取更多信息

https://datascience.stackexchange.com/questions/5226/strings-as-features-in-decision-tree-random-forest

相关问题