我想计算植物在文本文件中显示的次数。但是,一些植物实例显示为:
Floweredplants or plantdaisy.
如何拆分上述单词并使用regexp
替换为'plant'答案 0 :(得分:1)
你可以这样做:
if s.find("plant") >= 0:
print "It contains plant"
这只是测试"植物"是s
的子字符串(find
如果字符串中不存在参数,则返回-1
)。那是你在寻找什么?
答案 1 :(得分:1)
使用边界:
\bplant\w* # will match 'plantation'
\w*plant\b # will match 'eleplant'
\w*plant\w* # will match any of previous examples and 'eleplanted'
\bplant\b # will match only exactly 'plant' words
希望它有所帮助。
答案 2 :(得分:0)
您可以使用一些简单的正则表达式来匹配所有可能的情况,如下所示:
import re
re.search('[A-Za-z]*plants?', 'floweredplants')