无法在linux上解析xhtml文档

时间:2011-12-09 05:31:03

标签: java windows linux parsing xhtml

我正在尝试使用DocumentBuilder解析一个xhtml格式良好的文档,要求是我将解析xhtml文档,我将内容附加到xhtml文档的正文部分。为了解析文档我使用下面的代码

org.w3c.dom.Document document=null; 
DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance();
factory.setNamespaceAware(false);   
DocumentBuilder builder = factory.newDocumentBuilder();
document=builder.parse(file);

该文件是我要解析的xhtml文件 它在Windows机器上工作正常,当我试图在linux机器上运行相同的代码时,它无法解析文档并给出异常

java.net.SocketException: Unexpected end of file from server
        at sun.net.www.http.HttpClient.parseHTTPHeader(HttpClient.java:723)
        at sun.net.www.http.HttpClient.parseHTTP(HttpClient.java:589)
        at sun.net.www.http.HttpClient.parseHTTPHeader(HttpClient.java:720)
        at sun.net.www.http.HttpClient.parseHTTP(HttpClient.java:589)

任何人都可以帮我解释为什么它不能在linux机器上工作。

提前致谢...

1 个答案:

答案 0 :(得分:0)

我想到的是解析器正在尝试从HTTP服务器获取架构。您可以尝试禁用验证:

factory.setValidating(假)

或者确保您可以使用wget命令(而不是浏览器)正确下载文档中的模式。