标签: jsp xml-parsing html-parsing
我正在开发JSP搜索引擎我想使用它的链接解析html页面并搜索其中的一些单词 谢谢
答案 0 :(得分:0)
对于解析html(仅xhtml)或xml,您可以使用xslt处理器(Saxon,MSxsl)。您可以使用xsl样式表生成另一个xml,html或文本文件。
答案 1 :(得分:0)
您应该考虑使用TagSoup或类似的东西。不要使用XML解析器。无法保证每个网页都符合XML标准。