我使用经过训练的模型对数据进行分类,结果因大小而异。例如假设我最初有n行并对它们进行分类并得到一组结果X.现在如果我将m行添加到前一个数据集并且有n + m行并对其进行分类,那么前n行的结果也不同。是的,变化不可忽视。如果有人能提供这方面的见解,请。如果问题不明确,请告诉我。我使用的是R,分类器是SVM。
答案 0 :(得分:0)
如果我理解正确的原因是因为SVM模型表示所有样本都是空间中的点。
仅来自维基百科:
这意味着您的所有数据都已映射,以便进行示例 单独的类别除以明确的差距,宽度为 可能的。
您的所有示例都会映射到同一个空间,并根据它们所处的差距的哪一方面预测属于某个类别。
由于所有数据都已映射,因此新数据集可能意味着新的分区,从而影响您的最终结果。