将样本外推至人口

时间:2016-12-22 15:09:00

标签: python-3.x cluster-analysis hierarchical-clustering extrapolation

如何在python中将10,000行的样本外推到整个总体(100,000)。我在python中对样本进行了凝聚聚类,并将结果外推到整个群体。

1 个答案:

答案 0 :(得分:0)

没有一般规则。

对于层次聚类,这在很大程度上取决于您的链接,不同样本或整个群体的聚类可能非常不同。 (对于初学者,尝试不同的样本并进行比较!)

将聚类结果推广到新数据通常与群集的假设相矛盾。这不是分类,而是探索性数据分析。

但是,如果您找到良好的群集结果,并且您已经验证了它们是合意的,那么您可以在群集标签上训练分类器来预测群集新数据的标签。