我需要从html字符串中删除指向某些网站的所有链接,例如http://my-domain.com。我知道如何使用Jsoup做到这一点,但我不想解析html,我认为可以使用regexp达到我想要的目的。
例如,我有一个字符串:
<p> Hello</p> <a href="http://my-domain"> My site</a> and <a href="http://google.com> Google </a>
替换我的字符串后,应该像这样:
<p> Hello</p> and <a href="http://google.com> Google </a>
您能帮我做正则表达式吗?
答案 0 :(得分:1)
String html = "<p> Hello</p> <a href=\"http://my-domain\"> My site</a> and <a href=\"http://google.com\"> Google </a>";
System.out.println(html.replaceAll("<a href=\"http://my-domain\">.*?</a>", ""));