标签: cosine-similarity
当我想在具有不同字数的两个文档之间找到余弦相似性时,是否有任何规则?
答案 0 :(得分:2)
标准公式不需要匹配的单词数。你可以总结两个文件的单词的结合。 B中但不在A中的所有单词在A的单词向量中都会产生0。所有在A中但不在B中的单词在B的单词向量中会产生0。