我正在使用Java和SAX从搜索引擎实现RSS搜索功能。但是,某些搜索结果的格式不正确,即某些条目的<title>
标记的正文包含&
字符而不是&
等(例如,类似的内容,例如,{ {1}})。
在解析RSS时,我得到Starsky & Hutch
,导致整个搜索中断并且什么都不返回。
我希望我的解析器能够解决这些错误,就像Firefox的RSS阅读器一样。解决此问题和解析RSS提要的可能性是什么?
答案 0 :(得分:1)
SAX实现通常用于检测错误并抛出异常,并且没有标准的方法来解决这个问题。我能想到的最合理的事情是尝试修补错误,例如流浪和放大错误。流式传输到SAX之前的字符。