将org.w3c.dom.Document转换为org.apache.html.dom.HTMLDocumentImpl

时间:2010-08-18 23:41:50

标签: java html apache parsing document

无论如何都要将org.w3c.dom.Document的实例转换为org.apache.html.dom.HTMLDocumentImpl。

我需要解析Document中的图像,HTMLDocumentImpl有一个提取图像的方法。

我尝试了几种方法,比如类型转换和importNode,但它不起作用。

1 个答案:

答案 0 :(得分:1)

由于您说过您尝试过投射,我会假设您拥有的Document实例不是org.apache.html.dom.HTMLDocumentImpl。有两件事可能值得一试:

1)getImages()方法实际上是在接口org.w3c.dom.html.HTMLDocument上定义的,更可能由您拥有的任何类型的Dom文档实现。因此,您应该能够执行以下操作:

if (doc instanceof HTMLDocument) {
    images = ((HTMLDocument) doc).getImages();
}

2)如果这不起作用,getImages()方法实际上不会做任何比这更好的方法:

images = doc.getElementsByTagName("img");