我必须使用SVM为以下分类问题计算成本函数:
训练数据:
X1 X2 Y
1.3 0.2 0
1.5 0.4 0
4.7 1.4 1
4.5 1.5 1
A. 1.6*x1 + 4*x2 - 5.6 = 0
B. 2.4*x1 + 4 * x2 - 7.2 = 0
C. 0.96*x1 + 4 * x2 - 4.8 = 0
如何为上述每个决策边界计算成本函数,以找到最佳选择?
答案 0 :(得分:0)
要计算每个给定决策边界的“成本”,您必须计算每个数据点的预测标签。例如,对于决策边界A和第一个数据点,您必须替换x1 = 1.3
和x2 = 0.2
,然后预测的标签为1.6 * 1.3 + 4 * 0.2 - 5.6 = -2.72
。由于您正在处理二进制标签,因此通常情况下,模型(您没有训练模型并且已经给出了决策边界)应该说“ if(1.6 * x1 + 4 * x2-5.6)> = 0,则其标签为1“(反之亦然)。 仔细检查给定的模型。例如,假设决策边界A的预测标签和第一个数据点为0
(因为计算值是-2.72 <0),是真正的负数(因为预测标签和给定标签均为0
)。
共有4例: 1)如果预测标签为1,给定标签为1,则称为“真阳性”。 2)如果预测标签为0,给定标签为0,则称为“真阴性”。 3)如果预测标签为1且给定标签为0,则称为“假阳性”。 4)如果预测标签为0,给定标签为1,则称为“假阴性”。
然后,通常,成本函数是就“真正”,“真负”,“假正”,“假负”的数目而言的函数。然后,在为所有四个给定的数据点计算了预测的标签之后,就可以计算这些数字,从而计算模型的成本。
P.S。在99.9%的机会中,成本函数仅是“假阳性”,“假阴性”,但在极少数情况下,有时可能还取决于“真阳性”,“真阴性”。