决策树学习能否“半监督”

时间:2016-04-26 19:27:30

标签: machine-learning tree decision-tree azure-machine-learning-studio

我有一个包含三种变量的数据集:自然状态,人类决策,响应变量。我正在尝试使用决策树学习使用其他变量来预测响应变量。

我的心理模型是人们正在关注自然状态和做出决定。因此,我强烈希望我的决策树可以根据自然变量的状态进行分区,然后根据人类决策变量进行分区。我宁愿不在决策树模型中查看所有变量,看看弹出的是什么。

这种心理模型是否有效,如果是这样,我将如何使用Azure ML实现这样的功能?我甚至不知道用正确的词来形容这个问题 - 这是“半监督”的决策树学习吗?

1 个答案:

答案 0 :(得分:0)

这里没有“半监督”部分。半监督意味着部分数据缺乏标签(响应变量),但事实并非如此。您只需为决策树学习提出非常奇怪的约束,最后处理特征子集。为了做这样的事情,你需要改变DT学习过程,或者最好 - 从头开始​​编码。 DT是一种非常简单的算法,它需要很少的线程代码,而你的修改是一个简单的内部,它说“如果,从根目录开始我们还没有使用所有有意义的'自然'功能,那就不要看了进入'人类决定'“。因此它很简单,但我不认为任何库实际上支持这种约束(因为它远非自然,特别是对于DT)。