我正在尝试从HTML代码片段中提取子字符串,如下所示:
some text here. some text here.<img src="//zhihu.com/equation?tex=m_%7Bt%2B1%7D" alt="m_{t+1}" eeimg="1">some text here.<img src="//zhihu.com/equation?tex=p_t%3DE_t%28m_%7Bt%2B1%7Dx_%7Bt%2B1%7D%29" alt="p_t=E_t(m_{t+1}x_{t+1})" eeimg="1">some text here.
要绘制第一个m_{t+1}
标记中包含的子字符串img
和第二个标记中的p_t=E_t(m_{t+1}x_{t+1})
,我只需在Notepad ++中使用regexp <img.+ alt="((?!eeimg).)*" eeimg="1">
,但表达式不是单独匹配两个img
标记,它只显示包含整个HTML片段的结果。
有人能告诉我一个正确的方法吗?
感谢。
答案 0 :(得分:1)
你可以制作。+非贪婪的添加?就像这样:
(<img(.+?) alt="((?!eeimg).)*" eeimg="1">)
希望它可以帮到你