正则表达式:从某个字符串开始过滤掉组

时间:2020-05-26 18:50:11

标签: html regex

我想解析的文本如下:

<p class="p p1"><strong>Analysts</strong></p>\n<p class="p p1">Mark Troman - BofA Merrill Lynch, Research Division</p>\n<p class="p p1">Ben Uglow - Morgan Stanley, Research Division</p>

使用reg = <p class="p p[1-9][0-9]{0,1}">(.+?)<\/p>,我可以分为两组:

  • <strong>Analysts</strong>
  • Ben Uglow - Morgan Stanley, Research Division

但是,我想过滤掉以<strong>开头和以</strong>结尾的群组,并保持 Ben Uglow - Morgan Stanley, Research Division

有什么方法可以重写正则表达式并在单行正则表达式中完成过滤?

1 个答案:

答案 0 :(得分:1)

我想过滤出以

开头的组

此正则表达式只能匹配不包含<strong>的组:

<p class="p p[1-9][0-9]{0,1}">([a-zA-Z0-9, -]+?)<\/p>