如何使用正则表达式从html获取链接

时间:2017-11-16 11:13:16

标签: html regex

某些内容通过外部链接发送垃圾邮件 如何在正则表达式中选择网址标记和文本

例如

This is a legit content. It was Created by the admin

垃圾邮件后

This is a legit <a href="http://www.fakesite.com">Buy shoes</a> content. It was Created by <a href="http://www.veryfakesite.com">Buy Really nice shoes </a> the admin

在这种情况下,我想突出显示并擦除它,以便原始内容保持

This is a legit content. It was Created by the admin

1 个答案:

答案 0 :(得分:0)

根据您使用的正则表达式引擎/工具,以下查找和替换应该有效:

<强>查找

\s*<a href[^>]*>.*?</a>\s*

<强>替换

(a single space)

这应该让你非常接近你想要的。除了匹配每个锚垃圾邮件标签之外,我还拉入两侧的所有空格,然后用一个空格替换整个模式匹配。

Demo