应用错误收集

结果随分类中数据集的大小而变化

时间：2016-06-22 04:59:59

标签： machine-learning

我使用经过训练的模型对数据进行分类，结果因大小而异。例如假设我最初有n行并对它们进行分类并得到一组结果X.现在如果我将m行添加到前一个数据集并且有n + m行并对其进行分类，那么前n行的结果也不同。是的，变化不可忽视。如果有人能提供这方面的见解，请。如果问题不明确，请告诉我。我使用的是R，分类器是SVM。

1 个答案:

答案 0 :(得分：0)

如果我理解正确的原因是因为SVM模型表示所有样本都是空间中的点。

仅来自维基百科：

这意味着您的所有数据都已映射，以便进行示例单独的类别除以明确的差距，宽度为可能的。

您的所有示例都会映射到同一个空间，并根据它们所处的差距的哪一方面预测属于某个类别。

由于所有数据都已映射，因此新数据集可能意味着新的分区，从而影响您的最终结果。