使用Notepad ++提取HTML标记中的子字符串

时间:2016-06-03 07:43:14

标签: html regex notepad++

我正在尝试从HTML代码片段中提取子字符串,如下所示:

some text here. some text here.<img src="//zhihu.com/equation?tex=m_%7Bt%2B1%7D" alt="m_{t+1}" eeimg="1">some text here.<img src="//zhihu.com/equation?tex=p_t%3DE_t%28m_%7Bt%2B1%7Dx_%7Bt%2B1%7D%29" alt="p_t=E_t(m_{t+1}x_{t+1})" eeimg="1">some text here.

要绘制第一个m_{t+1}标记中包含的子字符串img和第二个标记中的p_t=E_t(m_{t+1}x_{t+1}),我只需在Notepad ++中使用regexp <img.+ alt="((?!eeimg).)*" eeimg="1">,但表达式不是单独匹配两个img标记,它只显示包含整个HTML片段的结果。

有人能告诉我一个正确的方法吗?

感谢。

1 个答案:

答案 0 :(得分:1)

你可以制作。+非贪婪的添加?就像这样:

(<img(.+?) alt="((?!eeimg).)*" eeimg="1">)

希望它可以帮到你