使用JSP的HTML或XML解析器

时间:2012-10-27 17:12:47

标签: jsp xml-parsing html-parsing

我正在开发JSP搜索引擎我想使用它的链接解析html页面并搜索其中的一些单词 谢谢

2 个答案:

答案 0 :(得分:0)

对于解析html(仅xhtml)或xml,您可以使用xslt处理器(Saxon,MSxsl)。您可以使用xsl样式表生成另一个xml,html或文本文件。

答案 1 :(得分:0)

您应该考虑使用TagSoup或类似的东西。不要使用XML解析器。无法保证每个网页都符合XML标准。