Python - 决策树和处理唯一标签/功能

时间:2017-02-21 16:59:46

标签: python machine-learning scikit-learn feature-selection

不确定标题是否完全合理,对此感到抱歉。 我是机器学习的新手,我正在使用Scikit和决策树。

这就是我想要做的;我想接受所有输入并包含一个独特的功能,即客户端ID。现在,客户端ID是唯一的,并且不能以特征在决策树分析中的正常方式进行总结。现在发生的事情是树正在将客户端ID作为任何其他整数值,然后将其分支,例如,客户端ID小于430的路径与430以上的路径不同。这不正确而不是我想要的去做。我想要做的是让决策树理解不能以这种方式分析特定字段,并且每个客户端都有自己的分支。这可能与决策树有关吗?

我确实有几个解决方法,其中一个是为每个客户开发独特的决策树,但培训这将是一场噩梦。我还可以做另一个解决方法,并且假设我们有800个客户端,我会用一个字段创建800个功能,但这也很疯狂。

0 个答案:

没有答案