无论如何都要将org.w3c.dom.Document的实例转换为org.apache.html.dom.HTMLDocumentImpl。
我需要解析Document中的图像,HTMLDocumentImpl有一个提取图像的方法。
我尝试了几种方法,比如类型转换和importNode,但它不起作用。
答案 0 :(得分:1)
由于您说过您尝试过投射,我会假设您拥有的Document
实例不是org.apache.html.dom.HTMLDocumentImpl
。有两件事可能值得一试:
1)getImages()
方法实际上是在接口org.w3c.dom.html.HTMLDocument
上定义的,更可能由您拥有的任何类型的Dom文档实现。因此,您应该能够执行以下操作:
if (doc instanceof HTMLDocument) {
images = ((HTMLDocument) doc).getImages();
}
2)如果这不起作用,getImages()
方法实际上不会做任何比这更好的方法:
images = doc.getElementsByTagName("img");