我可以将余弦相似性标准化吗?

时间:2012-06-09 08:37:08

标签: percentage normalize cosine-similarity

有没有办法将余弦相似度列表转换为百分比?我试图将我的大脑包裹起来,但我非常怀疑。

将四个文档的余弦值标准化是否有意义:

Doc #1  0.9600
Doc #2  0.9300
Doc #3  0.8800
Doc #4  0.8500

总结一下

0.9600 + 0.9300 + 0.8800 + 0.8500 = 3.6200

将它们标准化。

Doc #1  0.9600 / 3.6200 = 0.2652
Doc #2  0.9300 / 3.6200 = 0.2570
Doc #3  0.8800 / 3.6200 = 0.2431
Doc #4  0.8500 / 3.6200 = 0.2348

还是有更多可接受的方式来显示它?

1 个答案:

答案 0 :(得分:2)

我想这取决于你的用例,但总的来说,我认为没有太多需要对余弦相似度得分进行归一化,因为它们已经在0到1的范围内。