我正在尝试从字符串中提取最多4位数字(111):
<td align=right><font color=yellow>Meldung:<td align=left><font color=yellow>111</tr></table><p><table border width=90% cellpadding=3 bordercolor=darkgray><caption valign=top align=left>Aktuelle Messdaten bei Eintritt der Störung</caption>
字符串就是一切,正则表达式应该使用,因为文档被分成行
我的正则表达式是^r"<.*?><.*?>.*?<.*?><.*?yellow>"
,用于查找数字的开头。如果我在regex101.com中尝试它,它可以工作,但如果我在python中使用它,我得不到匹配:
numberBegin = re.search(r"^<.*?><.*?>.*?<.*?><.*?yellow>", tableRow).end(0) + 1
感谢您的帮助
答案 0 :(得分:0)
错误是.*?
与\r\n
不匹配,\r\n
在某种程度上是在字符串中但我的IDE没有显示。我删除了{{1}},但它确实有效。