如何从URL读取XML文档

时间:2014-03-18 18:05:49

标签: java java-ee xml-parsing saxparser domparser

您好我正在使用Document Class。当我从本地系统读取文件时,它正在工作,当我想读取文件并尝试从某个URL加载XML文档时,它无效。

private static Document loadTestDocument(String fileLocation) throws Exception {
    DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance();
    factory.setNamespaceAware(true);
    DocumentBuilder db = factory.newDocumentBuilder();
    File file = new File(fileLocation);
    System.out.println(db.parse(file).toString());
    return  db.parse(file);
}

所以这个方法返回Document如果我有一个返回xml的服务,我想要使用它我该怎么做呢?我想直接从服务GET url加载。

我试过这个,但它不起作用

File file = new File("http://someservice/getdata");

错误:找不到文件 然后我尝试从输入流加载它也没有从我工作。

InputStream input = new URL("http://someurl:32643/api/values").openStream();

错误:

[Fatal Error] :1:1: Content is not allowed in prolog.

现在我怎么能实现这一点任何帮助将不胜感激我想加载从服务收到的数据,并希望返回一个文档,因为我在我的方法中返回。

1 个答案:

答案 0 :(得分:1)

以下代码适用于我。

TestXML.java

import java.net.URL;
import javax.xml.parsers.DocumentBuilderFactory;
import org.w3c.dom.Document;

public class TestXML {

    private static Document loadTestDocument(String url) throws Exception {
        DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance();
        factory.setNamespaceAware(true);
        return factory.newDocumentBuilder().parse(new URL(url).openStream());
    }

    public static void main(String[] args) throws Exception {
        Document doc = loadTestDocument("http://www.enetpulse.com/wp-content/uploads/sample_xml_feed_enetpulse_soccer.xml");
        System.out.println(doc);
        doc = loadTestDocument("http://localhost/array.xml");
        System.out.println(doc);
    }
}

array.xml

<?xml version="1.0"?>
<ArrayOfstring xmlns:i="w3.org/2001/XMLSchema-instance" xmlns="schemas.microsoft.com/2003/10/Serialization/Arrays">
    <string>value1</string> 
    <string>value2</string> 
</ArrayOfstring>

你真的需要/使用xmlns属性吗?