java dom getTextContent()问题

时间:2011-04-03 02:33:51

标签: java xml dom textnode

当我尝试从我的servlet的doGet方法访问我的xml数据时,它只将值输出到空格,包括整个值。

XML文件:

<RealEstate>
    <Property>
            <Type>Apartment</Type>
            <Bedrooms>2</Bedrooms>
            <Bathrooms>2</Bathrooms>
            <Suburb>Bondi Junction</Suburb>
            <Rent>1000</Rent>
    </Property>
</RealEstate>

然后我从doGet中的Java Servlet调用Suburb:

Node suburb1 = doc.getElementsByTagName("Suburb").item(i);
out.println("<tr><td>Suburb</td>" + "<td>"+suburb1.getTextContent()+"</td></tr>");

它只输出“邦迪”而不是“邦迪交界”

有人知道为什么吗?

2 个答案:

答案 0 :(得分:4)

我已经用你的xml尝试了你的代码,它为我打印出了整个文本内容,非常奇怪。无论如何,Node#getTextContext方法返回当前节点及其后代的文本内容。 我建议你使用node.getFirstChild().getNodeValue(),它打印出你节点的文本内容,而不是它的后代。另一种方法是迭代Suburbs节点的子节点。 您还应该看看here

这是我的主要使用getFirstChild().getNodeValue()getChildNodes().item(i).getNodeValue()两次打印相同的文字:

public static void main(String[] args) throws SAXException, IOException, ParserConfigurationException  {

    DocumentBuilderFactory docBuilderFactory = DocumentBuilderFactory.newInstance();
    DocumentBuilder docBuilder = docBuilderFactory.newDocumentBuilder();
    Document doc = docBuilder.parse(new File("dom.xml"));

    NodeList nodeList = doc.getElementsByTagName("Suburb");
    for (int i = 0; i < nodeList.getLength(); i++) {
        Node node = nodeList.item(i);
        if (node.hasChildNodes()) {

            System.out.println("<tr><td>Suburb</td>" + "<td>"+node.getFirstChild().getNodeValue()+"</td></tr>");

            NodeList textNodeList = node.getChildNodes();
            StringBuilder textBuilder = new StringBuilder();
            for (int j = 0; j < textNodeList.getLength(); j++) {
                Node textNode = textNodeList.item(j);
                if (textNode.getNodeType() == Node.TEXT_NODE) {
                    textBuilder.append(textNode.getNodeValue());
                }
            }
            System.out.println("<tr><td>Suburb</td>" + "<td>" + textBuilder.toString() + "</td></tr>");
        }
    }
}

这是我的xml输出:

<tr><td>Suburb</td><td>Bondi Junction</td></tr>
<tr><td>Suburb</td><td>Bondi Junction</td></tr>

答案 1 :(得分:2)

尝试迭代suburb1的子节点和所有包含的文本节点的连接值。在大多数DOM实现中,getTextContent()方法非常有问题。很少有开发人员认为应该做的事情。