任何其他解析器而不是Jsoup?

时间:2011-08-15 08:11:44

标签: java android html parsing jsoup

如果我的情况下Jsoup.parse由于文件大小而崩溃,那么轻量级解析器是否更好用?

我的代码在这里并不重要,但在这里:

            Document doc = Jsoup.parse(html);

            Element table = doc.getElementsByTag("table");
            return table;

好的,这实际上有效,但如果我在PC(dalvik虚拟机)或Android设备(为Android OS开发)上运行此代码,则会有所不同。我不确定究竟是什么问题,但似乎设备上的内存(堆大小)更大,但到目前为止我还没有检查过 - 这只是一个假设。 所以我可以说Jsoup - 它是我想的最快和最小的库,适合我的情况来解析和清理基于DOM的纯HTML代码。如果你需要根据标签(tr,table,...等)来扩展HTML的某些部分,那么Jsoup是最好的开源HTML解析器。在代码中应用它时,只需要两行,如上例所示。获取elemnet或提取HTML的某些部分后得到的结果是一个简单的String,其中包含您使用Jsoup选择的标记。我相信它有更多的功能,只是从来没有使用过更复杂的东西。

1 个答案:

答案 0 :(得分:1)

我猜你试图解析html尝试杰里科