我正在尝试替换文档中包含锚标记的URL中所有非锚标记的URL。所以给出了字符串:
I have two urls for google: <a href="http://www.google.com/">google</a> and http://www.google.com/
我想用这个替换它:
I have two urls for google: <a href="http://www.google.com/">google</a> and <a href="http://www.google.com/">http://www.google.com/</a>
有没有人知道用Java做一个干净的方法?
答案 0 :(得分:1)
这可能会让你开始(它适用于给定的例子):
public class test {
public static void main(String[] args) {
final String test = "I have two urls for google: <a href=\"http://www.google.com/\">google</a> and http://www.google.com/";
System.out.println(test.replaceAll("(?<!\\<a\\ href=\")http:\\/\\/[^ ]*",
"<a href=\"$0\"/>"));
}
}
它有一些问题:
这适用于简单的示例,我不确定您是如何编写完整的解决方案。