如何从整个网站

时间:2017-04-12 17:11:33

标签: regex

我有一千个html页面(没有管理面板),包含adsense代码。 我想从html中删除所有这些内容。 一个代码如下:

<ins class="adsbygoogle"
 style="display:inline-block;width:160px;height:600px"
 data-ad-client="ca-pub-7165746718333100"
 data-ad-slot="9087512399"></ins>

另:

<ins class="adsbygoogle"
 style="display:inline-block;width:160px;height:600px"
 data-ad-client="ca-pub-7163746711373100"
 data-ad-slot="7467236139"></ins>

所有这些都相似但不相等。试图写正则表达式来查找并用空字符串替换它,但没有成功。

任何建议如何自动完成?

1 个答案:

答案 0 :(得分:2)

可以(注意我不应该使用的评论):

(?s:                   # parenthesis, turning on dotall mode
    <ins               # <ins literally
    (?:(?!</ins>).)*?  # anything else lazily afterwards
                       # making sure not to overrun </ins>
    "adsbygoogle"      # adsbygoogle
    .*?                # rest
    </ins>             # closing tag
)

完全删除这些匹配,请参阅a demo on regex101.com