非欧几里德空间中的数据挖掘聚类

时间:2015-11-12 00:41:39

标签: cluster-computing data-mining

考虑具有编辑距离的字符串空间作为距离 测量。给出一组字符串的示例,以便我们选择clustroid 通过最小化到其他点的距离之和,我们得到一个点 作为clustroid,但如果我们通过最小化最大值来选择clustroid 到其他点的距离,另一个点变成了群集。

我遇到了这个话题的挑战。任何人都可以帮助我吗?

2 个答案:

答案 0 :(得分:0)

尝试这组字符串:

badger
badger
badger
badger
badger
banana
nanana

什么字符串有最小总和,字符串是最小的最小距离?

答案 1 :(得分:0)

基于Anony-Mousse的回答,我想我会给出以下信息: 支持者 巴彻 啤酒 巴珀 巴杰 巴诺诺 卡诺诺