我遇到了HtmlUnit解析器的问题,我试图从网站上获取一些XML(使用网站的API)快速解析生成的XML,然后将XML保存到文件中(所有在API的权利范围内)。 (sample content)
不幸的是,网站在一些请求的页面中返回一个实体¿
,虽然这是一个有效的HTML实体,但HtmlUnit在解析过程中抛出异常并显示消息:
引用了实体“iquest”,但没有声明。
如何将iquest
定义为有效实体?
答案 0 :(得分:1)
除非您编辑收到的数据,否则无法定义¿(数据不是XML,因为任何验证器都会显示,例如first one I found on google
该网站没有提供有效的XML,因此最好的方法是要求它修复XML。
如果失败,那么搜索并替换¿或添加定义实体和iquest的DOCTYPE。