计算非英语文本字符串的余弦相似度

时间:2019-12-29 12:47:55

标签: python nlp word2vec cosine-similarity

要创建一个Python脚本,该脚本可以比较两个文本字符串并确定它们的相似度。我发现进行比较的最佳方法是余弦相似度。

为了理解每个字符串中的单词,我开始将自己锁定在Word2vec,但是阅读numberbatch方法更好。

在答案中找到了较旧的帖子,并提供了一些不错的实现。但这仅支持英语,我需要瑞典语。 Calculate cosine similarity given 2 sentence strings

是否有更好的方法比较两个短字符串之间的相似性?

该如何使用瑞典语?

0 个答案:

没有答案