标签: python cluster-analysis prediction
我有一套规格等的产品数据。 我已将kmode聚类应用于数据集,以形成最相似产品的聚类。
当我输入新数据时,我想知道这些数据属于哪个群集以及其他产品是什么(与这个新产品几乎相同)。我该怎么做?
答案 0 :(得分:0)
使用最近的邻居。
无需依赖群集,群集往往不稳定并产生不平衡群集。将90%的数据合理地放在同一个集群中是很常见的(例如,#34;普通用户和#34;集群,或者#34;单次访问"集群)。所以你应该问问自己:你通过这样做获得了什么,成本效益比是多少?