解析HTML并获取所有节点

时间:2012-03-13 06:13:11

标签: java html parsing

我需要在java中解析HTML文件。与XML不同,没有重复的标签。所以我需要一个可以解析html文件并到达所有节点的代码,它包含嵌套标签......等HTML代码不是固定的。换句话说,给定任何HTML代码,我需要访问HTML中的所有标记。

2 个答案:

答案 0 :(得分:1)

答案 1 :(得分:0)

我认为你需要这个......

var els=document.getElementsByTagName("*");
for(var i=0;i<els.length;i+)document.write(els.nodeName+"<br />");