java sax parse不是很好的形成xml

时间:2012-03-13 17:22:44

标签: java rss sax well-formed

我正在使用Java和SAX从搜索引擎实现RSS搜索功能。但是,某些搜索结果的格式不正确,即某些条目的<title>标记的正文包含&字符而不是&amp;等(例如,类似的内容,例如,{ {1}})。

在解析RSS时,我得到Starsky & Hutch,导致整个搜索中断并且什么都不返回。

我希望我的解析器能够解决这些错误,就像Firefox的RSS阅读器一样。解决此问题和解析RSS提要的可能性是什么?

1 个答案:

答案 0 :(得分:1)

SAX实现通常用于检测错误并抛出异常,并且没有标准的方法来解决这个问题。我能想到的最合理的事情是尝试修补错误,例如流浪和放大错误。流式传输到SAX之前的字符。