正则表达式匹配并删除字符串之前的所有内容(打开html标记)

时间:2015-02-22 19:06:05

标签: html regex

我使用的是Dreamweaver和Notepad ++并且已经搜索过高低,但似乎没有任何效果可以解决。

我有一大堆html页面,我需要从所有这些页面中删除所有内容,但不包括文档中的第一个标记。具体来说,字符串"<h1"之前的所有内容(无引号)。我在Notepad ++中尝试了各种示例,它找到了第一个h1标记,但在它之前没有替换它。

2 个答案:

答案 0 :(得分:0)

您可以从命令行或文本编辑器执行此操作,该编辑器允许您搜索 - 替换多个文件。但是,您确定每个html文件中的内容是否相同?

答案 1 :(得分:0)

Assuming you want to lose everything in your file before the "<h1" text
then specify ".*<[hH]1" as search tag and "<h1" as replacement and check
the box marked ". matches newline". Works for me.