我想解析的文本如下:
<p class="p p1"><strong>Analysts</strong></p>\n<p class="p p1">Mark Troman - BofA Merrill Lynch, Research Division</p>\n<p class="p p1">Ben Uglow - Morgan Stanley, Research Division</p>
使用reg = <p class="p p[1-9][0-9]{0,1}">(.+?)<\/p>
,我可以分为两组:
<strong>Analysts</strong>
Ben Uglow - Morgan Stanley, Research Division
但是,我想过滤掉以<strong>
开头和以</strong>
结尾的群组,并保持
Ben Uglow - Morgan Stanley, Research Division
。
有什么方法可以重写正则表达式并在单行正则表达式中完成过滤?
答案 0 :(得分:1)
我想过滤出以
开头的组
此正则表达式只能匹配不包含<strong>
的组:
<p class="p p[1-9][0-9]{0,1}">([a-zA-Z0-9, -]+?)<\/p>