我们正在学习stanford-nlp分类器的用法。正如其维基页面所述,它可用于构建模型,用于分类像Iris这样的数值数据: http://www-nlp.stanford.edu/wiki/Software/Classifier#Iris_data_set
但是在解释输出时,我们对其中一些输入属性很难:输入属性有4列(1值,2值,3值,4值),输出标签有1列(Iris-setosa) ,Iris-versicolor,Iris-virginica)。但CLASS在这里是什么?它是整体输出列吗?
构建此分类器:具有以下权重的线性分类器
Iris-setosa Iris-versicolor Iris-virginica 3-Value -2.27 0.03 2.26 CLASS 0.34 0.65 -1.01 4-Value -1.07 -0.91 1.99 2-Value 1.60 -0.13 -1.43 1-Value 0.69 0.42 -1.23 Total: -0.72 0.05 0.57 Prob: 0.15 0.32 0.54
答案 0 :(得分:0)
CLASS就像简单线性回归中的截距项 - 它代表不同类的相对频率。这是每个实例的一个特征。