结果随分类中数据集的大小而变化

时间:2016-06-22 04:59:59

标签: machine-learning

我使用经过训练的模型对数据进行分类,结果因大小而异。例如假设我最初有n行并对它们进行分类并得到一组结果X.现在如果我将m行添加到前一个数据集并且有n + m行并对其进行分类,那么前n行的结果也不同。是的,变化不可忽视。如果有人能提供这方面的见解,请。如果问题不明确,请告诉我。我使用的是R,分类器是SVM。

1 个答案:

答案 0 :(得分:0)

如果我理解正确的原因是因为SVM模型表示所有样本都是空间中的点。

仅来自维基百科:

  

这意味着您的所有数据都已映射,以便进行示例   单独的类别除以明确的差距,宽度为   可能的。

您的所有示例都会映射到同一个空间,并根据它们所处的差距的哪一方面预测属于某个类别。

由于所有数据都已映射,因此新数据集可能意味着新的分区,从而影响您的最终结果。