还有其他有用的相似性或距离指标吗?

时间:2016-06-11 12:42:03

标签: machine-learning distance euclidean-distance cosine-similarity hamming-distance

我正在开发一个近似计算系统。定义相似的两个对象的数量是这种系统中的基本操作。

通常在计算机科学和数学中,相似性是两个物体之间距离的同义词,但我并不总是清楚在哪种应用中使用以下距离:

  1. Jaccard系数用于排名和评分的信息检索。
  2. 余弦相似度用于实数向量,例如用于衡量文档之间的相似度(即使它不考虑术语位置,但只考虑频率)
  3. 汉明距离用于二进制向量,它用于测量计算机视觉和图像处理中二进制描述符(如ORB)之间的相似性
  4. 欧几里德距离用于实数向量,它用于测量两点之间的距离(通常被称为L ^ 2距离)
  5. 内核函数:在机器学习中,一些内核函数(如RBF内核)用于利用内核技巧的相似性度量。
  6. 我知道这些指标中的每一个都以不同的方式定义,但我想知道是否有一项调查或论文列出了计算机科学中每一个可能的应用程序(或者我没有报告的其他应用程序) )。你能帮我解决这个问题吗?

1 个答案:

答案 0 :(得分:0)