我有超过一千个网页,我需要在某个字段内抓取HTML数据,然后不替换该数据,但我需要将该数据复制到同一个html文档头部的上面的元字段中。
我发现下面的代码有点使用了。
查找
@ArtikelNr
替换例如。
<span class="CatStyle">(.*)</span>
但是我如何使用/我可以使用正则表达式来查找上面的数据,但是然后我可以在上面的示例中替换/替换,就像我在文档头部中替换/插入var $ 1到<span class="CatStyle">$1</span>
<meta name="Category" content="$1">
,而不是插入跨度下方。 ?
任何想法?
答案 0 :(得分:2)
注意:要操作HTML,您可以使用更好的工具 - HTML解析器 - 而不是带有正则表达式支持的S&amp; R对话框。
对于一次性作业,如果您需要在搜索和替换对话框和中使用该模式,则只有一个meta
标记在name
之前span
等于类别,您可以使用
(<meta name="Category" content=")[^"]*(">[\s\S]*<span class="CatStyle">)([\s\S]*?)(</span>)
并替换为$1$3$2$3$4
反向引用序列。
<强>详情:
(<meta name="Category" content=")
- 第1组捕获<meta name="Category" content="
字符串[^"]*
- 除"
(">[\s\S]*<span class="CatStyle">)
- 第2组捕获">
,然后捕获任意0个字符(尽可能多)到最后<span class="CatStyle">
然后<span class="CatStyle">
本身([\s\S]*?)
- 第3组捕获任何0+字符,尽可能少,直到第一个...... (</span>)
- 第4组捕获</span>
在配对$n
的帮助下,(...)
是对模式中定义的组的反向引用。