我是模式分类的初学者,因此这个问题看似微不足道。假设我们正在对具有4个要素和3个类别的IRIS database
花进行分类,其中Class1, Class2, Class3
分别表示为(0 0 1; 0 1 0; 1 1 0)
。 NN有3个输出神经元。因此,当网络输出ModelOutput = 1 1 0
时,我们可以得出结论该特征属于Class3。现在,考虑一下文中提到的模型。该模型将具有4个输入概念和3个输出,每个类一个,每个输出概念通过权重连接。根据论文Link,估计的类是概念值“最高”的类。因此,在这种情况下,模型输出
1 1 0
其中两个概念值为1
。那么,“最高”是什么意思?有人请解释这部分吗?谢谢
答案 0 :(得分:1)
很难猜测文章中究竟使用了什么而没有详细研究(意味着我无法找到相关的段落)。此外,通过快速浏览,我不确定这是否是这类一般问题的最佳资源。我宁愿建议你学习一些像Bishop或Hastie这样的机器学习书。
您的目标是多类分类。更具体地说,您似乎正在使用 one-versus-all 策略,在该策略中,您可以组合多个二元分类器的输出( - 这一个是您的感知器)以形成对班级成员。根据书"机器学习和模式识别"通过Bishop,这可能会导致概念上的问题,因为通常在输入空间中存在分类不明确的区域,请参见下图,了解感知器的情况(图4.2来自Bishop):
这个问题不会出现的替代方案是一对一分类器,您可以在其中训练大量的二元分类器。
但回答你的问题:通常,课堂作业相当简单。你得到了学习者的实际输出y
[我猜你正在使用多层感知器],它被sigmoid函数映射到[0,1](或者更常见的是[-1,1]由tanh功能)。接下来,您需要一条规则将结果0和1分配给您的输出,通常选择0 if y<0.5
和1 if y>=0.5
。因此,您评估两个二进制分类并设置结果向量。