正则表达式将相同类型的组视为一个匹配而不是两个

时间:2018-06-18 07:25:51

标签: python regex

我有一个考虑正则表达式匹配的HTML文档。该组的正则表达式是(ITEM\s*\W+\s*([1-9])\b\s*\W+\s*(?P<title>\w.*?))(?=\s*$)。现在这个正则表达式正确匹配下面给出的文本中的组。

Item 5 || Some english text||64
Item 5(c) ||Some english text|| 89     #multiline,unicode,insensitive flag is set
Item 8|| Some english text ||78

现在我希望正则表达式考虑第5项而不考虑5(c)。

1 个答案:

答案 0 :(得分:0)

在([1-9])和\ b

之间插入(?!\(.\))