如何为HtmlUnit XML解析器定义新实体?

时间:2010-06-28 16:36:48

标签: xml htmlunit

我遇到了HtmlUnit解析器的问题,我试图从网站上获取一些XML(使用网站的API)快速解析生成的XML,然后将XML保存到文件中(所有在API的权利范围内)。 (sample content

不幸的是,网站在一些请求的页面中返回一个实体¿,虽然这是一个有效的HTML实体,但HtmlUnit在解析过程中抛出异常并显示消息:

  

引用了实体“iquest”,但没有声明。

如何将iquest定义为有效实体?

1 个答案:

答案 0 :(得分:1)

除非您编辑收到的数据,否则无法定义¿(数据不是XML,因为任何验证器都会显示,例如first one I found on google

该网站没有提供有效的XML,因此最好的方法是要求它修复XML。

如果失败,那么搜索并替换¿或添加定义实体和iquest的DOCTYPE。