多目标决策树

时间:2011-12-30 18:14:52

标签: vector label machine-learning decision-tree multitargeting

这是我的问题。我需要实现一个多目标决策树算法。多目标是多标签学习的扩展,其中标签不是二进制的,但可以是连续的,分类的等等。例如,多标签分类问题的标签向量可能看起来像{1,0,1,0,0,0,1},而多目标看起来像{2,35,3,-2, 24}。 我的问题是这个。如果我有一个带有3个离散值的标签,我如何在向量中表示它们? 让我们说我有一个叫做工作的标签,需要3个值,机械师,老师和运动员。我如何编码这个标签,以便在向量中使用它? 在决策树中的每个节点处,为了找到我的分割,我需要计算该节点中所有标签向量的平均向量(我使用方差方法方程来找到我的分割)。如果我有二进制标签这很容易,因为添加0和1不会造成任何问题。如果我使用0,1,2对这3个作业进行编码,那么这就是问题,因为添加具有标签运动员的标签向量,比添加具有作业机制的向量更重要,并且平均向量是不准确的。

让我们举个例子。我有这3个标签:

          job: {mechanic,teacher,athlete}
          married:{yes,no}
          age:  continuous value

很容易说已婚标签可以编号为{0,1},年龄标签可以编号为连续编号。但是我如何编写工作标签?将其编码为{0,1,2}会导致下一个问题。想象一个节点中的2个标签向量:{0,0,45}对应于机械师,已婚和45岁,{2,1,48}对应于运动员,未结婚,45岁。平均向量为{1,0.5,46.5}。使用此向量,我可以预测落入该节点的实例的年龄是46.5,我可以说未结婚的实例(具有大于或等于0.5的规则是1)并且我可以说它的工作是老师。老师的工作是完全错误的,而其他工作都没问题。您现在看到编码分类标签的问题。帮助或建议???谢谢:D

1 个答案:

答案 0 :(得分:1)

如果值超过2,如何获取要素的所有离散值并将它们全部转换为要素,例如:

job: {mechanic, teacher, athlete}
married:{yes, no}
age:  continuous value

将导致5维vecor

(技师0/1,老师0/1,运动员0/1,结婚0/1,年龄0-inf)