在python中查找两个字符串中重新出现的单词数

时间:2012-11-29 12:17:10

标签: python string nltk

我想知道是否有一个库或一个函数可以返回一个数字,如果输入是两个字符串,输出应该是两个字符串中重新出现的单词的数量一个例子...

输入:

string 1= my name is user
string 2= my friend is here

输出:

2 

因为“我的”和“是”在两个字符串中重复...我听说nltk可以帮助我,如果真的可以有人请指导我的功能...请帮帮我

2 个答案:

答案 0 :(得分:5)

不确定nltk - 似乎有些过分(除非你想要一些高级标记化)。如果您只能按空格标记单词,那么您可以按如下方式使用集合:

>>> a = 'one two three four five'
>>> b = 'three blind mice'
>>> set(a.split()).intersection(b.split())
set(['three'])

然后花点时间......

答案 1 :(得分:-1)

res=set(a.split())&set(b.split())
print len(res)