标签: machine-learning nlp
给定document-term matrix,如何解释列之间的余弦距离?
答案 0 :(得分:0)
只需将每条记录视为一个向量,并使用余弦距离来计算它们之间的对
示例向量D1(1,1,0,1)和向量D2(1,0,1,1)并使用类似的余弦相似度
距离(D1,D2)= cos =(1.1 + 1.0 + 0.1 + 1.1)/(sqrt(1 ^ 2 + 1 ^ 2 + 0 ^ 2 + 1 ^ 2)* sqrt(1 ^ 2 + 0 ^ 2 + 1 ^ 2 + 1 ^ 2))
如果D3计算了另外两个距离(D1,D3)和距离(D2,D3)