Java:如何从HTML标签中删除文本内容?

时间:2013-09-29 04:15:03

标签: java html regex parsing

让我们考虑一下这个HTML代码:

<html<body><p><b>Hi there</b></p><a href="a.com">click here</a></html>

我想从这个HTML代码中删除html标签之间的内容并检索html结构。像这样:

<html<body><p><b></b></p><a href="a.com"></a></html>

1 个答案:

答案 0 :(得分:2)

这会满足吗?

txt.replaceAll(">[^<]*<","><")