删除/剥离特定的Html标记并使用NotePad ++替换

时间:2016-07-20 14:22:00

标签: html regex notepad++

这是我的文字:

<h3>#6</h2>
Is he eating a lemon?

</div>

我的文章中有一些#unumber总是不同的,文本也总是不同。

我想这样做:

<h3>#6 Is he eating a lemon?</h3>

我在记事本++中通过正则表达式尝试过但我对此仍然很陌生:

我的搜索:

<h3>.*?</h2>\r\n.*?\r\n\r\n</div> 

另见here

现在总是选择文本的正确部分。

我的替换命令现在需要看起来像上面那样得到输出吗?

2 个答案:

答案 0 :(得分:1)

您应该修改原始正则表达式以捕获组中所需的文本,如下所示:

<h3>(.*?)</h2>\r\n(.*?)\r\n\r\n</div>
    (   )         (   ) 
//  ^             ^     These are your capture groups

然后,您可以分别使用\1\2令牌访问这些群组。

所以你的替换模式看起来像:

<h3>\1 \2</h3>

答案 1 :(得分:0)

您的搜索可能是<h3>(.*)<\/h2>\r\n(.*)\r\n\r\n<\/div> 替换为<h3>$1 $2</h3>,其中$ 1和$ 2表示括号中捕获的字符串。