文档项矩阵各列之间的余弦距离的含义

时间:2019-07-26 09:02:32

标签: machine-learning nlp

给定document-term matrix,如何解释列之间的余弦距离?

1 个答案:

答案 0 :(得分:0)

只需将每条记录视为一个向量,并使用余弦距离来计算它们之间的对 enter image description here

示例向量D1(1,1,0,1)和向量D2(1,0,1,1)并使用类似enter image description here的余弦相似度

距离(D1,D2)= cos =(1.1 + 1.0 + 0.1 + 1.1)/(sqrt(1 ^ 2 + 1 ^ 2 + 0 ^ 2 + 1 ^ 2)* sqrt(1 ^ 2 + 0 ^ 2 + 1 ^ 2 + 1 ^ 2))

如果D3计算了另外两个距离(D1,D3)和距离(D2,D3)