有人向我发送xml 1.0文件。 该文件中包含&#x1E之类的非法字符,我对此无能为力,这个初始条件是问题的陈述。
Java解析器(dom4j-1.6.1.jar)当然会失败。 在标头中尝试将xml版本替换为1.1,因此无法正常工作。还是解析器版本问题,我不知道。
我想知道可能的最佳解决方案。
我目前的解决方法: -在解析之前对错误的字符进行正则表达式
这真的是唯一的解决方案?我可以使用任何架构或外部实体(?)定义吗?或另一个解析器? 非法字符在属性中。我认为CDATA无法正常工作
这确实是一个令人讨厌的问题。
xml是由Windows Web服务框架生成的,我不知道是哪个框架。我不知道是否可以从代方面进行一些简单的修复。但是它必须非常简单,否则,Web服务提供商将不会实现它。