StAX不返回字符串

时间:2016-10-12 11:32:43

标签: java xml stax

我一直在尝试使用StAX创建XML控制器类。 我的问题是我没有得到一个元素的完整字符串,而是我得到了字符串的一小部分。 (请注意,出于安全原因,某些内容已被隐藏,这些内容将显示为{content}

Characters characters = event.asCharacters();
if (!characters.isWhiteSpace()) {
    System.out.println(characters.getData());
}

上面的代码不会返回完整的字符串。

我期望收到的是:
{responseType} \([0-9]+\) ACC: [0-9]+,[0-9]+,[0-9]+,[0-9]+,[0-9]+,[0-9]+,[0-9]+,[0-9]+

我得到的是5个单独部分中的上述字符串:
{responseType} \([0-9]+\) ACC: [0-9]
+,[0-9]+,[0-9]
+,[0-9]+,[0-9]
+,[0-9]+,[0-9]
+,[0-9]+

我的代码:

public static ArrayList<SmsCommand> readXML() {
    if (init()) {
        try {
            while (eventReader.hasNext()) {
                XMLEvent event = eventReader.nextEvent();
                switch (event.getEventType()) {
                case XMLStreamConstants.START_ELEMENT:
                    StartElement startElement = event.asStartElement();
                    String qName = startElement.getName().getLocalPart();
                    if (qName.equalsIgnoreCase("command")) {
                        Iterator<Attribute> attributes = startElement.getAttributes();
                        command = new SmsCommand(attributes.next().getValue());
                    }
                    break;
                case XMLStreamConstants.CHARACTERS:
                    Characters characters = event.asCharacters();
                    if (!characters.isWhiteSpace()) {
                        command.addResponse(characters.getData());
                    }
                    break;
                case XMLStreamConstants.END_ELEMENT:
                    EndElement endElement = event.asEndElement();
                    if (endElement.getName().getLocalPart().equalsIgnoreCase("command")) {
                        commands.add(command);
                    }
                    break;
                }
            }
        }
        catch (XMLStreamException e) {
            e.printStackTrace();
        }
    }
    return commands;
}

和我的xml:

一样
<?xml version="1.0" ?>
<root>
  <command type="{command}">
    <response>{responseType} \([0-9]+\) ACC: [0-9]+,[0-9]+,[0-9]+,[0-9]+,[0-9]+,[0-9]+,[0-9]+,[0-9]+</response>
  </command>
</root>

2 个答案:

答案 0 :(得分:1)

当您知道只有XMLStreamConstants.START_ELEMENT文本时,可以致电http://docs.oracle.com/javase/7/docs/api/javax/xml/stream/XMLEventReader.html#getElementText()

答案 1 :(得分:1)

STAX解析器只是按相同的顺序将字符拆分成更小的部分。您可以使用StringBuilder重建它,同时添加一些长度检查以确保安全性。或者你可以设置一个标志来默认组合它。

“默认情况下,StAX解析器会将(通常是latge)CHARACTER事件分解为多个部分以避免创建大字符串。您无法控制发生此中断的位置。”

“您可以使用工厂属性”javax.xml.stream.isCoalescing“来控制此行为,并强制它将相邻的CHARACTER事件合并到一个事件中。”

http://helpdesk.objects.com.au/java/stop-stax-breaking-character-event