有没有办法将余弦相似度列表转换为百分比?我试图将我的大脑包裹起来,但我非常怀疑。
将四个文档的余弦值标准化是否有意义:
Doc #1 0.9600
Doc #2 0.9300
Doc #3 0.8800
Doc #4 0.8500
总结一下
0.9600 + 0.9300 + 0.8800 + 0.8500 = 3.6200
将它们标准化。
Doc #1 0.9600 / 3.6200 = 0.2652
Doc #2 0.9300 / 3.6200 = 0.2570
Doc #3 0.8800 / 3.6200 = 0.2431
Doc #4 0.8500 / 3.6200 = 0.2348
还是有更多可接受的方式来显示它?
答案 0 :(得分:2)
我想这取决于你的用例,但总的来说,我认为没有太多需要对余弦相似度得分进行归一化,因为它们已经在0到1的范围内。