标签: k-means
我们有一组KMeans模型。有些经过了100%数据的培训,有些经过了抽样。然后将两个模型都拟合到整个数据集。在重复样本中,具有不同随机种子的迭代之间拟合为100%的样本比在样本上训练的样本更稳定,但是我们小组不同意哪种样本在避免过度拟合的情况下产生足够一致的结果。部分原因是我们无法像看到不一致一样容易地测量过度拟合。
社区会建议什么准则?