标签: nlp cosine-similarity glossary
我有一个程序,通过使用余弦相似度来比较文本。 有一个选项可以上载词汇表文件,其中包含不是标准英语单词的特殊单词。 我想对这些单词给予更大的重视,因此,例如,如果两个不同的文本包含相同的特殊单词,则它们匹配的可能性要大于那些普通英语单词。
我一直在寻找有关的信息,但找不到。 我很乐于解释或参考与此相关的文章。谢谢