忽略SAX中的一些XML标记

时间:2010-02-15 21:26:39

标签: java xml sax

我正在使用Java中的SAX解析XML文档 我正在使用描述不同领域研究出版物的XML 其中有像“抽象”这样的元素,很快就会描述研究论文的内容。在该字段中允许基本的HTML格式,但我不希望SAX威胁HTML标记(如i,b,u,sub,sup等)作为真正的XML标记和fire strartElement()和endElement( )关于那些元素的事件。

有没有办法告诉SAX忽略一些预定义的XML标签集,并将他们的XML代码按原样传递给characters()方法?

1 个答案:

答案 0 :(得分:0)

我怀疑没有,没有一些工作。当你遇到不同的元素时,我可能会插入不同的SAX处理程序,并将它们从堆栈中推出/弹出。因此,当您遇到<abstract>元素时,您将插入SAX解析器委派给的新处理程序, 足够智能以根据需要处理HTML元素。我担心这不是一个简单的解决方案。