标签: java html regex parsing
让我们考虑一下这个HTML代码:
<html<body><p><b>Hi there</b></p><a href="a.com">click here</a></html>
我想从这个HTML代码中删除html标签之间的内容并检索html结构。像这样:
<html<body><p><b></b></p><a href="a.com"></a></html>
答案 0 :(得分:2)
这会满足吗?
txt.replaceAll(">[^<]*<","><")