我之前asked有关线性可分数据的解释。还在阅读Mitchell的机器学习书,我在理解为什么感知器规则仅适用于线性可分数据时会遇到一些麻烦?
Mitchell将感知器定义如下:
也就是说,如果加权输入的总和超过某个阈值,则y为1或-1。
现在,问题是确定一个权重向量,使感知器为每个给定的训练样例产生正确的输出(1或-1)。实现这一目标的一种方法是通过感知器规则:
学习可接受的权重向量的一种方法是随机开始 权重,然后迭代地将感知器应用于每个训练 例如,每当错误分类时修改感知器权重 一个例子。重复该过程,遍历训练 在感知器对所有人进行分类之前,需要多次举例 训练样例正确。每个步骤都会修改权重 根据感知器训练规则,修改重量wi 根据规则与输入xi相关联:
所以,我的问题是:为什么这只适用于线性可分的数据?感谢。
答案 0 :(得分:6)
因为w
和x
的点积是x
的线性组合,实际上,您使用超平面将数据拆分为2个类{{1} }
考虑2D示例:a_1 x_1 + … + a_n x_n > 0
和X = (x, y)
然后W = (a, b)
。如果X * W = a*x + b*y
的参数大于0,则sgn
返回1,也就是说,对于类#1,您有a*x + b*y > 0
,这相当于y > -a/b x
(假设b!= 0)。此等式为线性,并将2D平面划分为2个部分。