我是python的新手,所以请原谅我的天真。我研究了很多使用余弦相似度来计算Python中字符串相似度的例子。但是,我想使用Difflib的SequenceMatcher
。有没有办法使用TfidfVectorizer
与Difflib的SequenceMatcher
来计算相似度得分?
为了提供更多介绍,我有一个超过6000条评论和建议的数据库。我的目标是将每个传入的提交与所有现有建议相匹配,并选择最适合新建议的5到10个建议。我使用TfidfVectorizer
sklearn.feature_extraction.text