Question

我必须使用SVM为以下分类问题计算成本函数：

训练数据：

X1   X2   Y  
1.3  0.2  0
1.5  0.4  0
4.7  1.4  1
4.5  1.5  1

A. 1.6*x1 + 4*x2 - 5.6 = 0
B. 2.4*x1 + 4 * x2 - 7.2 = 0
C. 0.96*x1 + 4 * x2 - 4.8 = 0

如何为上述每个决策边界计算成本函数，以找到最佳选择？

Answer 1

要计算每个给定决策边界的“成本”，您必须计算每个数据点的预测标签。例如，对于决策边界A和第一个数据点，您必须替换x1 = 1.3和x2 = 0.2，然后预测的标签为1.6 * 1.3 + 4 * 0.2 - 5.6 = -2.72。由于您正在处理二进制标签，因此通常情况下，模型（您没有训练模型并且已经给出了决策边界）应该说“ if（1.6 * x1 + 4 * x2-5.6）> = 0，则其标签为1“（反之亦然）。 仔细检查给定的模型。例如，假设决策边界A的预测标签和第一个数据点为0（因为计算值是-2.72 <0），是真正的负数（因为预测标签和给定标签均为0）。

共有4例： 1）如果预测标签为1，给定标签为1，则称为“真阳性”。 2）如果预测标签为0，给定标签为0，则称为“真阴性”。 3）如果预测标签为1且给定标签为0，则称为“假阳性”。 4）如果预测标签为0，给定标签为1，则称为“假阴性”。

然后，通常，成本函数是就“真正”，“真负”，“假正”，“假负”的数目而言的函数。然后，在为所有四个给定的数据点计算了预测的标签之后，就可以计算这些数字，从而计算模型的成本。

P.S。在99.9％的机会中，成本函数仅是“假阳性”，“假阴性”，但在极少数情况下，有时可能还取决于“真阳性”，“真阴性”。

计算最佳成本函数-SVM

1 个答案: