Python单词短语相似度比较

时间:2016-07-08 05:24:47

标签: python scikit-learn bigdata

现在是否有Python的库/函数来比较单词短语和返回的相似程度和/或第一个短语中的信息如何完全出现在第二个短语中的程度?

E.g。 " John Leron先生"与" Jonh Ler相比。小老师"?

我希望它可能是一些“矢量”'用于大数据分析的函数。

1 个答案:

答案 0 :(得分:1)

我推荐使用cosine-similariy算法。参考网址如下。

How to calculate cosine similarity given 2 sentence strings? - Python