XML无法使用Escape字符进行解析

时间:2011-11-18 14:05:26

标签: java xml sax

我正在尝试编写一个简单的SAX解析器,我正在接收来自Web服务响应的输入,并且它包含转义字符<和>当我尝试使用我的代码解析它时,我得到 prolog中不允许引用。错误,就好像我将转义字符更改为正常<和>它正在解析而没有任何问题,我想我只是在这里错过了一些非常简单的东西......有人可以帮忙吗?

import java.io.ByteArrayInputStream;
import java.io.FileReader;
import java.io.InputStream;

import org.xml.sax.XMLReader;
import org.xml.sax.Attributes;
import org.xml.sax.InputSource;
import org.xml.sax.helpers.XMLReaderFactory;
import org.xml.sax.helpers.DefaultHandler;

public class Test extends DefaultHandler {

    public static void main(String args[]) throws Exception {
        XMLReader xr = XMLReaderFactory.createXMLReader();
        Test handler = new Test();
        xr.setContentHandler(handler);
        xr.setErrorHandler(handler);

        String xml_string = "<rootnode><a>hello</a><b>world</b></rootnode>";
        InputStream xmlStream = new ByteArrayInputStream(xml_string.getBytes("UTF-8"));
        xr.parse(new InputSource(xmlStream));
    }

    public Test() {
        super();
    }

    ////////////////////////////////////////////////////////////////////
    // Event handlers.
    ////////////////////////////////////////////////////////////////////

    public void startDocument() {
        System.out.println("Start document");
    }

    public void endDocument() {
        System.out.println("End document");
    }

    public void startElement(String uri, String name, String qName, Attributes atts) {
        if ("".equals(uri))
            System.out.println("Start element: " + qName);
        else
            System.out.println("Start element: {" + uri + "}" + name);
    }

    public void endElement(String uri, String name, String qName) {
        if ("".equals(uri))
            System.out.println("End element: " + qName);
        else
            System.out.println("End element:   {" + uri + "}" + name);
    }

    public void characters(char ch[], int start, int length) {
        System.out.print("Characters:    \"");
        for (int i = start; i < start + length; i++) {
            switch (ch[i]) {
            case '\\':
                System.out.print("\\\\");
                break;
            case '"':
                System.out.print("\\\"");
                break;
            case '\n':
                System.out.print("\\n");
                break;
            case '\r':
                System.out.print("\\r");
                break;
            case '\t':
                System.out.print("\\t");
                break;
            default:
                System.out.print(ch[i]);
                break;
            }
        }
        System.out.print("\"\n");
    }
}

2 个答案:

答案 0 :(得分:3)

您不应在xmlstring中使用转义字符。您需要将<>用于xml标记。只有当你需要包括&lt;或者&gt;作为属性/元素内容的一部分而不是元素标签本身。

答案 1 :(得分:1)

对于普通标签,应该使用&lt;和&gt;喜欢&lt; root&gt; ...&lt; / root&gt;。仅在真实文本中&lt;和&gt;应该逃到&amp; LT;和&amp; GT;