集群我的数据和输入测试

时间:2012-02-06 06:55:16

标签: cluster-analysis

对给定数据进行聚类,并使用任何检索算法来显示输出,如下所示。 (任何聚类算法) 欧几里德距离可用于寻找最接近的病例。

让包含输入向量的数据文件,如

caseid  f1  f2  f3    f4 
1       30  45  9.5   1500

2       35  45  8     1600
3       38  47  10    1550 

4       32  50  9.5   1800

..
..
..
t1      30   45   9.5   1500(target)

输出应该

NO.  f1  f2  f3   f4
t1   30  45  9.5  1500 (target) 
21   35  45  10   1500(1st closest to target)
39   35  50  8   1500 (2nd closes)
56   35  42  9.5 1500  (3rd closes)   

1 个答案:

答案 0 :(得分:0)

对我来说,这看起来像是经典的最近邻居查询,而不像群集。

此外,我在这里使用欧几里德距离时要小心。属性f1中的差值1看起来不等于属性f4中的差值1。价值似乎有着完全不同的程度。