基于特征出现顺序的分类

时间:2017-08-01 16:26:37

标签: machine-learning decision-tree

我有来自源的输入。当输入匹配特定顺序时,它被分类到特定组。基于此,我建立了我的培训文件如下。

LABEL FEATURE1,FEATURE2,FEATURE3,FEATURE4
CLASS_A INPUT_A,INPUT_B,INPUT_C,INPUT_D
CLASS_A INPUT_A,INPUT_B,INPUT_C,INPUT_D
CLASS_A INPUT_A,INPUT_B,INPUT_C,INPUT_D
CLASS_A INPUT_A,INPUT_B,INPUT_C,INPUT_D
CLASS_B INPUT_C,INPUT_D,,
CLASS_B INPUT_C,INPUT_D,,
CLASS_B INPUT_C,INPUT_D,,
CLASS_C INPUT_A,INPUT_B,INPUT_D,
CLASS_C INPUT_A,INPUT_B,INPUT_D,
CLASS_C INPUT_A,INPUT_B,INPUT_D,
CLASS_C INPUT_A,INPUT_B,INPUT_D,
CLASS_C INPUT_A,INPUT_B,INPUT_D,
CLASS_D INPUT_E,INPUT_F,,
CLASS_D INPUT_E,INPUT_F,,
CLASS_D INPUT_E,INPUT_F,,
CLASS_D INPUT_E,INPUT_F,,

我正在尝试使用决策树进行分类,但问题是在构建模型时没有考虑到它。决策树是解决问题的正确方法,其中特征的顺序对于进行分类而不是每个特征的权重很重要,或者是否有更好的算法/方法可用于解决这些问题。

1 个答案:

答案 0 :(得分:0)

决策树很好为此,但似乎您选择的算法在处理输入时不会考虑其顺序。如果您使用预先打包的算法,您可能会发现编辑输入文件并使用其顺序标记每个要素更容易:将订单视为要素值。例如,您的输入可能如下所示:

CLASS_A 1 2 3 4 0 0
CLASS_B 0 0 1 2 0 0
CLASS_C 1 2 0 3 0 0
CLASS_D 0 0 0 0 1 2

这将允许您从各种训练算法中进行选择:决策树,朴素贝叶斯,支持向量机,甚至是k均值聚类。