如何在android中解析(格式不正确)HTML?

时间:2009-11-26 22:04:00

标签: java android xerces xom

如何在android中解析格式不正确的HTML?

我尝试使用XOM和TagSoup,但在创建Builder时出现以下错误:

11-26 20:42:39.294: ERROR/dalvikvm(1298): Could not find method org.apache.xerces.impl.Version.getVersion, referenced from method nu.xom.Builder.

我必须安装Xerces才能使用XOM,或者我可以使用不带XOM的tagsoup吗?

2 个答案:

答案 0 :(得分:2)

您可能会发现JTidy(http://jtidy.sourceforge.net/) - HTMLTidy的端口足够轻量级。它根据请求输出XHTML

答案 1 :(得分:0)

XOM可能要求Xerces位于类路径中 - 它可能取决于Java的版本。目前我们使用

xercesImpl-2.8.0.jar