考虑您有以下文字:
yada yada
yada yada 1
;
<Hello.There>yada:EGHKJHKG, Source:QWEKGHGHJGKGHJKGHJKVMVNMVMVMVMVMVMVMBTDFHG, </Hello.There>
yada2
yada3
我希望能够在Source:
之后和,
之前获取信息。
我已设法使用此site执行此操作,并匹配源值
我的正则表达式是:
<Hello.There>.+Source:(.+?),\s*</Hello.There>
我的python代码是:
match = re.match(r'<Hello.There>.+Source:(.+?),\s*</Hello.There>
在这一行之后我得到了无,任何想法?
(我尝试了更多正则表达式选项而没有成功)
答案 0 :(得分:4)
re.match
仅匹配字符串的开头。如果您不想在开头匹配,则需要使用re.search
。
>>> import re
>>> re.match('llo', 'hello') # only match at the beginning
>>> re.search('llo', 'hello') # match anywhere
<_sre.SRE_Match object at 0x00000000029BA4A8>
请参阅search() vs. match() from the Python re
module documentation。