为什么两个向量不相似但结果是1?

时间:2017-04-08 20:17:25

标签: machine-learning data-mining text-mining cosine-similarity bigdata

我使用余弦相似度公式来计算两个向量之间的相似性。我尝试了两个不同的向量:

Vector1(-1237373741,27,1,1,331289590,1818540802)

Vector2(-1237373741,49,1,1,311289590,1818540802)

两个向量略有不同,但结果是 1

我不知道为什么?谁能为我解释这个问题?非常感谢。

1 个答案:

答案 0 :(得分:0)

在大多数情况下,这两个向量指向相同的方向(较大的坐标将主导另一个坐标中较小的差异)。预计余弦相似度为〜(记住cos(0)= 1)