计算最佳成本函数-SVM

时间:2019-07-10 11:25:32

标签: machine-learning svm

我必须使用SVM为以下分类问题计算成本函数:

训练数据:

X1   X2   Y  
1.3  0.2  0
1.5  0.4  0
4.7  1.4  1
4.5  1.5  1
A. 1.6*x1 + 4*x2 - 5.6 = 0
B. 2.4*x1 + 4 * x2 - 7.2 = 0
C. 0.96*x1 + 4 * x2 - 4.8 = 0

如何为上述每个决策边界计算成本函数,以找到最佳选择?

1 个答案:

答案 0 :(得分:0)

要计算每个给定决策边界的“成本”,您必须计算每个数据点的预测标签。例如,对于决策边界A和第一个数据点,您必须替换x1 = 1.3x2 = 0.2,然后预测的标签为1.6 * 1.3 + 4 * 0.2 - 5.6 = -2.72。由于您正在处理二进制标签,因此通常情况下,模型(您没有训练模型并且已经给出了决策边界)应该说“ if(1.6 * x1 + 4 * x2-5.6)> = 0,则其标签为1“(反之亦然)。 仔细检查给定的模型。例如,假设决策边界A的预测标签和第一个数据点为0(因为计算值是-2.72 <0),是真正的负数(因为预测标签和给定标签均为0)。

共有4例: 1)如果预测标签为1,给定标签为1,则称为“真阳性”。 2)如果预测标签为0,给定标签为0,则称为“真阴性”。 3)如果预测标签为1且给定标签为0,则称为“假阳性”。 4)如果预测标签为0,给定标签为1,则称为“假阴性”。

然后,通常,成本函数是就“真正”,“真负”,“假正”,“假负”的数目而言的函数。然后,在为所有四个给定的数据点计算了预测的标签之后,就可以计算这些数字,从而计算模型的成本。

P.S。在99.9%的机会中,成本函数仅是“假阳性”,“假阴性”,但在极少数情况下,有时可能还取决于“真阳性”,“真阴性”。