我需要在java中解析HTML文件。与XML不同,没有重复的标签。所以我需要一个可以解析html文件并到达所有节点的代码,它包含嵌套标签......等HTML代码不是固定的。换句话说,给定任何HTML代码,我需要访问HTML中的所有标记。
答案 0 :(得分:1)
试试这个HTML Parser http://htmlparser.sourceforge.net/samples.html
答案 1 :(得分:0)
我认为你需要这个......
var els=document.getElementsByTagName("*");
for(var i=0;i<els.length;i+)document.write(els.nodeName+"<br />");