如果我的情况下Jsoup.parse由于文件大小而崩溃,那么小,轻量级解析器是否更好用?
我的代码在这里并不重要,但在这里:
Document doc = Jsoup.parse(html);
Element table = doc.getElementsByTag("table");
return table;
好的,这实际上有效,但如果我在PC(dalvik虚拟机)或Android设备(为Android OS开发)上运行此代码,则会有所不同。我不确定究竟是什么问题,但似乎设备上的内存(堆大小)更大,但到目前为止我还没有检查过 - 这只是一个假设。 所以我可以说Jsoup - 它是我想的最快和最小的库,适合我的情况来解析和清理基于DOM的纯HTML代码。如果你需要根据标签(tr,table,...等)来扩展HTML的某些部分,那么Jsoup是最好的开源HTML解析器。在代码中应用它时,只需要两行,如上例所示。获取elemnet或提取HTML的某些部分后得到的结果是一个简单的String,其中包含您使用Jsoup选择的标记。我相信它有更多的功能,只是从来没有使用过更复杂的东西。
答案 0 :(得分:1)
我猜你试图解析html尝试杰里科