对给定数据进行聚类,并使用任何检索算法来显示输出,如下所示。 (任何聚类算法) 欧几里德距离可用于寻找最接近的病例。
让包含输入向量的数据文件,如
caseid f1 f2 f3 f4
1 30 45 9.5 1500
2 35 45 8 1600
3 38 47 10 1550
4 32 50 9.5 1800
..
..
..
t1 30 45 9.5 1500(target)
输出应该
NO. f1 f2 f3 f4
t1 30 45 9.5 1500 (target)
21 35 45 10 1500(1st closest to target)
39 35 50 8 1500 (2nd closes)
56 35 42 9.5 1500 (3rd closes)
答案 0 :(得分:0)
对我来说,这看起来像是经典的最近邻居查询,而不像群集。
此外,我在这里使用欧几里德距离时要小心。属性f1中的差值1看起来不等于属性f4中的差值1。价值似乎有着完全不同的程度。