在单个输入流上使用多个InputReader

时间:2013-08-26 14:54:24

标签: java xml jaxb inputstream streamreader

我正在尝试使用JAXB从单个输入流中读取多个xml文档。由于JAXB本身不支持这一点,因此我创建了自己的XmlReader。但是,这迫使我在这个单个输入流上使用多个XMLEventReaders(彼此之后,而不是并行)。

但这似乎不起作用。正确读取第一个XML文档。但第二个不是。根据XML,有时它只是在第一个XML文档之后停止,有时它只返回XML中间的任意标记(不知道这是怎么发生的)。

这是我用来读取XML的代码:

import java.io.File;
import java.io.FileInputStream;
import java.io.InputStream;
import java.util.Stack;
import javax.xml.stream.XMLEventReader;
import javax.xml.stream.XMLInputFactory;
import javax.xml.stream.XMLStreamException;
import javax.xml.stream.events.XMLEvent;

public class XmlReader {

  private final XMLInputFactory infactory = XMLInputFactory.newInstance();
  private final InputStream inStream;

  private String lastInvalidInput= null;

  public XmlReader(final InputStream inStream){
    this.inStream= inStream;
  }


  public String readXml() throws XMLStreamException{
    final XMLEventReader eventReader= infactory.createXMLEventReader(inStream);

    final StringBuilder sb= new StringBuilder();
    final Stack<String> openTags= new Stack<String>();
    boolean endOfXml= false;
    while (eventReader.hasNext() && !endOfXml){
      try{
        final XMLEvent nextEvent= eventReader.nextEvent();
        sb.append(nextEvent.toString());
        if (nextEvent.isStartElement()){
          openTags.add(nextEvent.toString());
        }else if (nextEvent.isEndElement()){
          openTags.pop();
          if (openTags.isEmpty()){
            endOfXml= true;
          }
        }
      }catch(XMLStreamException e){
        //FIXME: There must be cleaner way to recognize the end of the stream.
        if (e.getMessage().endsWith("ParseError at [row,col]:[1,1]\nMessage: Premature end of file.")){
          if (openTags.isEmpty()){
            return null;
          }else{
            lastInvalidInput= sb.toString();
            throw new XMLStreamException("Unfinished XML stream", e);
          }
        }else{
          lastInvalidInput= sb.toString();
          throw e;
        }                                                                                                                                       
      }
    }

    eventReader.close();
    return sb.toString();
  }


  public String getLastInvalidInput() {
    return lastInvalidInput;
  }


  public static void main(String[] args) throws Exception {
    final File f= new File("/tmp/test.xml");
    final XmlReader r= new XmlReader(new FileInputStream(f));

    String xml;
    while((xml= r.readXml()) != null){
      System.out.println("------------");
      System.out.println(xml);
    }
  }
}

这是一个示例XML文件:

<?xml version="1.0" encoding="latin3"?>
<myxml>
  <eins>
    <zwei>
      <drei>
      </drei>
    </zwei>
  </eins>
  <vier>
    <fuenf>
    </fuenf>
  </vier>
</myxml>
<?xml version="1.0" encoding="latin1"?>
<yourxml>
  <one>
    <two>
      <three />
    </two>
  </one>
  <four>
    <five>
    </five>
  </four>
</yourxml>

为什么这种奇怪的行为?我想在关闭第一个XMLEventReader(根据Javadoc,没有关闭输入流)之后,可以使用下一个来从流中读取。不是这样的吗?

有没有更好的方法来实现这一目标?

1 个答案:

答案 0 :(得分:0)

请参阅旧的thread这可能会对您有所帮助 使用

MultiXMLDocReader xmlReader = new MultiXMLDocReader(new InputStreamReader(anyInputStream));
ObjectA a = (ResponseHeader) u.unmarshal(xmlReader);
ObjectB b = (SubmissionProgress) u2.unmarshal(xmlReader);