Stax Parser解析CDATA值

时间:2010-10-04 23:25:46

标签: java stax

我正在使用Stax Implementation SJSXP1.0。因此,它一直运作良好,但现在面临一个奇怪的问题。

正在解析的XML包含错误的HTML片段作为某些标记的值。这些值包含在CDATA部分中,因为我们期望CDATA不被解析器解析(就像我们使用DOM解析器的情况一样)。但是当我们使用STax时,parser.next()方法失败如下 javax.xml.stream.XMLStreamException:[row,col]处的ParseError:[1374,10] 消息:元素类型“col”的结束标记必须以“>”结尾定界符

有没有办法让我告诉解析器完全忽略CDATA标签,只需将它们作为值读取

1 个答案:

答案 0 :(得分:0)

我认为不可能以这种方式改变解析器行为,因为XML格式本身嵌入在解析器中,你无法做任何事情。但这并不妨碍你捕捉异常并围绕它做出一些逻辑。