如何在python中拆分连接的单词

时间:2015-11-08 18:22:51

标签: python regex

我想计算植物在文本文件中显示的次数。但是,一些植物实例显示为:

Floweredplants or plantdaisy. 

如何拆分上述单词并使用regexp

替换为'plant'

3 个答案:

答案 0 :(得分:1)

你可以这样做:

if s.find("plant") >= 0:
    print "It contains plant"

这只是测试"植物"是s的子字符串(find如果字符串中不存在参数,则返回-1)。那是你在寻找什么?

答案 1 :(得分:1)

使用边界:

\bplant\w*         # will match 'plantation'
\w*plant\b         # will match 'eleplant'
\w*plant\w*        # will match any of previous examples and 'eleplanted'
\bplant\b          # will match only exactly 'plant' words

希望它有所帮助。

答案 2 :(得分:0)

您可以使用一些简单的正则表达式来匹配所有可能的情况,如下所示:

import re
re.search('[A-Za-z]*plants?', 'floweredplants')