我正在使用HTMLCleaner操纵DOM。我的XHTML非常令人费解和混乱。
我想删除这两个按钮。标记在某种程度上表现出以下结构,
<table>
<tr>
<td/>
<table>
</table>
</tr>
<table>
<tr>
<input type="button"/>
<input type="button"/>
</tr>
</table>
是否有任何方法可以有效地执行删除?
TagNode node = cleaner.clean(html);
Object[] found1 = node.evaluateXPath("//input");
if (found1.length>0 ) {
for (int i=0; i<found1.length;i++) {
TagNode a = (TagNode) found1[i];
a.removeFromTree();
}
}