两个不同变量之间的距离函数?

时间:2017-07-10 14:41:09

标签: distribution euclidean-distance metric

计算两个物体之间距离的最佳指标是什么?对象由四个参数表示(程序前后两个相同的变量)。

目标是在整个集合中将数据点分配为对。此外,每对的数据点应彼此接近/相似。

The data

正态和标准化分布:在轴上以不同的幅度看相同。

Feature scaling

2 个答案:

答案 0 :(得分:3)

您可以使用任何测量功能。大多数情况下,人们使用欧氏距离,但最佳距离很大程度上取决于情况。否则,你总是可以尝试所有的功能来观察哪个是最准确的。

我建议做的事情是扩展你的功能(如果你有多个)。通过缩放功能,您可以确定每个功能在欧几里德公式中的影响程度。

如果您的某个功能看起来比另一个功能更重要,则可以将其缩放到稍大的数字。如果您的所有功能都是相同的权重,则应将它们全部缩放到相同的数字范围,通常为[-0.5, 0.5]

答案 1 :(得分:2)

真的没有" mahalanobis距离"在两点之间,一点功能缩放可能是你最好的选择。此外,最近邻居似乎不是在此问题中使用的最佳算法。