标签: machine-learning similarity
假设我有两个文档向量,X1和X2。现在我用零向量填充它们以具有最大文档长度约束。它会影响两个载体之间的相似性吗?或者一般来说它是如何帮助我们的?
答案 0 :(得分:1)
我可以回答第一部分。它不会影响矢量之间的相似性。通常,在文档处理中,将使用向量之间的余弦距离。通过添加零,余弦距离不会改变。您正在通过添加零来增加维度。例如,在二维空间[1,2]和[3,4]是两点。在三维中,相同的点表示为[1,2,0]和[3,4,0]。即使尺寸增加,积分也保持不变。