我认为在java中使用html的最好的库之一就是使用JSOUP,但我找不到那个只从我的文件中获取标签的库。只是'<之间的tagName tagName>'如果没有JSOUP根本没问题。
[IN]
<html>
<head><title>TITLE</title></head>
<body><!comment>
<h2>This is<br>important</h2>
<b>The most important by now</b>
</body>
</html>
[希望退出]
<html>
<head><title></title></head>
<body><!comment>
<h2><br></h2>
<b></b>
</body>
</html>