如何在python中将10,000行的样本外推到整个总体(100,000)。我在python中对样本进行了凝聚聚类,并将结果外推到整个群体。
答案 0 :(得分:0)
没有一般规则。
对于层次聚类,这在很大程度上取决于您的链接,不同样本或整个群体的聚类可能非常不同。 (对于初学者,尝试不同的样本并进行比较!)
将聚类结果推广到新数据通常与群集的假设相矛盾。这不是分类,而是探索性数据分析。
但是,如果您找到良好的群集结果,并且您已经验证了它们是合意的,那么您可以在群集标签上训练分类器来预测群集新数据的标签。