找出输入的新数据属于哪个群集,并返回同一群集中的其他项目

时间:2017-06-02 08:54:56

标签: python cluster-analysis prediction

我有一套规格等的产品数据。 我已将kmode聚类应用于数据集,以形成最相似产品的聚类。

当我输入新数据时,我想知道这些数据属于哪个群集以及其他产品是什么(与这个新产品几乎相同)。我该怎么做?

1 个答案:

答案 0 :(得分:0)

使用最近的邻居。

无需依赖群集,群集往往不稳定并产生不平衡群集。将90%的数据合理地放在同一个集群中是很常见的(例如,#34;普通用户和#34;集群,或者#34;单次访问"集群)。所以你应该问问自己:你通过这样做获得了什么,成本效益比是多少?