我想匹配字符串的一部分(特定单词)并打印出来。正是grep -o
的作用。
我的话就是“黄狗”,它可以在一个跨越多行的字符串中找到。
[34343] | ****. "Example": <one>, yellow dog
tstring0 123
tstring1 456
tstring2 789
让我们试试这个正则表达式mydog = re.compile(', .*\n')
然后
if mydog.search(string):
仅打印匹配的字词。
如何在输出中只获得“黄狗”?
答案 0 :(得分:15)
使用捕获组并查找:
>>> import re
>>> s = """[34343] | ****. "Example": <one>, yellow dog
... tstring0 123
... tstring1 456
... tstring2 789"""
>>> mydog = re.compile(', (.*)\n')
>>> mydog.findall(s)
['yellow dog']
如果您只想要第一场比赛,那么:
>>> mydog.findall(s)[0]
'yellow dog'
注意:当IndexError
不包含匹配项时,您需要处理s
。
答案 1 :(得分:4)
如果未指定捕获组,则整个表达式匹配的文本将包含matchResult.group(0)
。在您的情况下,这将是', yellow dog\n'
。如果您只想要yellow dow
,则应该在表达式中添加一个捕获组:, (.*?)\n
。请注意,我还将.*
更改为.*?
,这样它就会非贪婪,并在找到第一个换行符时停止。
>>> s = '''[34343] | ****. "Example": <one>, yellow dog
tstring0 123
tstring1 456
tstring2 789'''
>>> mydog = re.compile(', (.*?)\n')
>>> matchResult = mydog.search(s)
>>> if matchResult:
print(matchResult.group(1))
yellow dog