很难理解PMML目标类别属性

时间:2011-06-10 20:00:31

标签: xml data-modeling data-mining svm

我正在尝试为支持向量机草拟PMML文档,我对dmg.org上指定的SupportVectorMachine标记的targetCategory属性感到困惑。我的问题是,当有两个以上的分类器时,它应该如何工作?是否需要一个targetCategory和其他alternateTargetCategory属性?

鉴于Iris数据集,我猜它会是这样的:

<SupportVectorMachine targetCategory="Iris-setosa" alternateTargetCategory="Iris-versicolor" alternateTargetCategory="Iris-virginica">

1 个答案:

答案 0 :(得分:0)

我环顾四周,找到了自己问题的答案。有一个名为KNIME的免费应用程序可以直接使用并生成PMML输出。事实证明alternateTargetCategory仅用于二进制分类。对于Iris数据集,SupportVectorMachine的输出如下:

<SupportVectorMachine targetCategory="1">
  <SupportVectors numberOfAttributes="4" numberOfSupportVectors="3">
    <SupportVector vectorId="1_1_23"/>
    <SupportVector vectorId="1_1_41"/>
    <SupportVector vectorId="2_2_98"/>
  </SupportVectors>
  <Coefficients numberOfCoefficients="3" absoluteValue="-1.2257883098134195">
    <Coefficient value="0.0082595394670607"/>
    <Coefficient value="5.981904829451028E-4"/>
    <Coefficient value="0.008857729950005803"/>
  </Coefficients>
</SupportVectorMachine>
<SupportVectorMachine targetCategory="2">
  <SupportVectors numberOfAttributes="4" numberOfSupportVectors="16">
  ... etc.