是否有一个度量来根据属性来评估两个对象之间的相似性?

时间:2015-10-17 17:43:43

标签: math statistics mean difference metric

假设我有一个对象X,其中包含10个要素:[0, 0, 0, 0, 0, 0, 0, 0, 0, 0]

然后,我还有两个对象:

  • A : [2, 2, 2, 2, 2, 2, 2, 2, 2, 2]
  • B : [0, 0, 0, 0, 0, 0, 0, 0, 0, 20]

我需要知道AB是哪个"更近"到X

我想到的想法"相似性"是:

  

最好所有功能几乎相同,而不是很多功能非常接近但有些非常不同。

根据此"定义",A似乎比X更接近B

然而,算术平均值似乎不是实现这个想法的正确工具,因为它对于两个对象都是2。

请问这类问题是否有特定指标?

3 个答案:

答案 0 :(得分:1)

euclidean distance怎么样?

在你的情况下,A和X之间的欧几里德距离是平方根40(约= 6.32),B和X之间的距离是20,所以A确实更接近该指标。

答案 1 :(得分:1)

您还可以考虑使用余弦相似度。余弦相似度测量矢量相对于原点的相似性,而欧几里德距离测量沿矢量的特定兴趣点之间的距离。

Here是关于何时选择其中一个的好文章。

另一个常见的衡量标准是Jaccard相似度。 Here是一篇将余弦与Jaccard相似性进行比较的文章。

答案 2 :(得分:0)

如果特征非常相似并且可能有不同的变化,则必须对欧几里德距离进行标准化。

这可以使用涉及特征差异的Mahalanobis distance来完成。

Mahalanobis distance

另请参阅this question