如何使用正则表达式剪切URL

时间:2011-01-07 01:42:13

标签: java html split

我正在尝试在java中删除包含多个信息的字符串。 文字是这样的:

<a href="http://www.hootsuite.com" rel="nofollow">HootSuite</a>

我正在考虑使用需要正则表达式的.split方法.. 我希望它将这个字符串拆分成没有引号的URL .. http:// ...... .com 然后标签之间的文本..这种情况HootSuite ..

我将非常感谢您的帮助 谢谢

1 个答案:

答案 0 :(得分:5)

你不想这样做。您希望使用像org.w3c.dom这样的XML或HTML解析套件。你为什么问?因为you can't parse HTML with regex