使用带有Tf-IDF的Difflib SequenceMatcher(TfidfVectorizer)

时间:2016-06-23 22:09:06

标签: python tf-idf difflib

我是python的新手,所以请原谅我的天真。我研究了很多使用余弦相似度来计算Python中字符串相似度的例子。但是,我想使用Difflib的SequenceMatcher。有没有办法使用TfidfVectorizer与Difflib的SequenceMatcher来计算相似度得分?

为了提供更多介绍,我有一个超过6000条评论和建议的数据库。我的目标是将每个传入的提交与所有现有建议相匹配,并选择最适合新建议的5到10个建议。我使用TfidfVectorizer

中的sklearn.feature_extraction.text

0 个答案:

没有答案