Question

我有来自源的输入。当输入匹配特定顺序时，它被分类到特定组。基于此，我建立了我的培训文件如下。

LABEL FEATURE1,FEATURE2,FEATURE3,FEATURE4
CLASS_A INPUT_A,INPUT_B,INPUT_C,INPUT_D
CLASS_A INPUT_A,INPUT_B,INPUT_C,INPUT_D
CLASS_A INPUT_A,INPUT_B,INPUT_C,INPUT_D
CLASS_A INPUT_A,INPUT_B,INPUT_C,INPUT_D
CLASS_B INPUT_C,INPUT_D,,
CLASS_B INPUT_C,INPUT_D,,
CLASS_B INPUT_C,INPUT_D,,
CLASS_C INPUT_A,INPUT_B,INPUT_D,
CLASS_C INPUT_A,INPUT_B,INPUT_D,
CLASS_C INPUT_A,INPUT_B,INPUT_D,
CLASS_C INPUT_A,INPUT_B,INPUT_D,
CLASS_C INPUT_A,INPUT_B,INPUT_D,
CLASS_D INPUT_E,INPUT_F,,
CLASS_D INPUT_E,INPUT_F,,
CLASS_D INPUT_E,INPUT_F,,
CLASS_D INPUT_E,INPUT_F,,

我正在尝试使用决策树进行分类，但问题是在构建模型时没有考虑到它。决策树是解决问题的正确方法，其中特征的顺序对于进行分类而不是每个特征的权重很重要，或者是否有更好的算法/方法可用于解决这些问题。

Answer 1

决策树很好为此，但似乎您选择的算法在处理输入时不会考虑其顺序。如果您使用预先打包的算法，您可能会发现编辑输入文件并使用其顺序标记每个要素更容易：将订单视为要素值。例如，您的输入可能如下所示：

CLASS_A 1 2 3 4 0 0
CLASS_B 0 0 1 2 0 0
CLASS_C 1 2 0 3 0 0
CLASS_D 0 0 0 0 1 2

这将允许您从各种训练算法中进行选择：决策树，朴素贝叶斯，支持向量机，甚至是k均值聚类。

基于特征出现顺序的分类

1 个答案: