标签: python nlp word2vec cosine-similarity
要创建一个Python脚本,该脚本可以比较两个文本字符串并确定它们的相似度。我发现进行比较的最佳方法是余弦相似度。
为了理解每个字符串中的单词,我开始将自己锁定在Word2vec,但是阅读numberbatch方法更好。
在答案中找到了较旧的帖子,并提供了一些不错的实现。但这仅支持英语,我需要瑞典语。 Calculate cosine similarity given 2 sentence strings
是否有更好的方法比较两个短字符串之间的相似性?
该如何使用瑞典语?