标签: nlp document similarity term
我的目标是找到每对术语之间的相似性。据我了解,有两种不同的方法。
一个来自信息检索。该方法形成文档术语矩阵,并评估术语向量之间的余弦相似度。
第二个也称为语言的超空间模拟。该方法形成术语项共现矩阵,并评估向量之间的余弦相似度。 哪种方法更好?