您好我有正则表达式问题,
这是文本结构:
TK00123456:改变了很多乱码16:34。 ---访问:[更多 乱码模块](http://somewebsite.com/selectedModuleCode=Support form.aspx longblob)汇总--- |属性| | ---创作者|更多 胡言乱语16/01/2018 16:26:53经理|外部状况|
处理决议案 正确的英文文本
这是我的正则表达式
re.match(r'(?s)Change(.*?)Working', text)
输出:
None
Match 1 Full match 12-270
`改变了很多乱码16:34。 ---访问: [更加胡言乱语 模块](http://somewebsite.com/selectedModuleCode=Support form.aspx longblob)总结--- |属性| | ---创作者|更多的胡言乱语 16/01/2018 16:26:53经理|外部状况|
Working`
我在RHEL上有python版本2.6.6,如果这是问题,我就无法升级到python 2.7。
有什么建议吗?
答案 0 :(得分:1)
您正在寻找re.search()
而不是re.match()
:
import re
string = """
TK00123456: Change a lot gibberish 16:34. --- access : [ more gibberish Module](http://somewebsite.com/selectedModuleCode=Support form.aspx longblob) summary --- | Properties | | --- Creator | more gibberish | 16/01/2018 16:26:53 Manager | External Status |
Working on Resolution
Proper English Text
"""
rx = re.compile(r'(?s)Change(.*?)Working')
print(rx.search(string).group(0))
<小时/> 解释:
re.match()
仅匹配字符串的开头且没有Change
(请参阅那里的TK00123456:
)。