我正在尝试解析一些无效的xml,因为属性不在引号中,有什么方法可以解决这个问题吗?下面是一个简单的例子,以及java代码。
XML
<car id=1>
.
.
</car>
Java
SAXParserFactory factory = SAXParserFactory.newInstance();
factory.setValidating(false);
SAXParser saxParser = factory.newSAXParser();
saxParser.parse(page, handler); //page is an input stream where the xml is.
感谢。
答案 0 :(得分:7)
您所拥有的是格式良好问题,而不是验证问题(您发布的代码仅禁用验证)。 XML解析器需要良好的xml,并且大部分都是为了原谅验证问题。可能如果你看一下像JSoup这样的html解析器你有更好的机会,因为他们对形式良好以及他们试图自动纠正它们感到宽容。
Read this article了解良构和有效性之间的区别。