我正在使用Jsoup.parse()的所有String版本:
parse(String html, String baseUri)
排除连接速度以对其性能进行基准测试。
在典型的低端Android手机上,在一个不那么罕见的长维基百科页面(~600KB)的html字符串上调用Jsoup.parse()
, 9秒!
我的客户端不愿意接受这种延迟,我想要将Jsoup转储到不同的引擎,自己解析网页(仍然使用Java),或者在NDK中使用一些C / C ++解析器(如果可用)。 / p>
但我更愿意继续尽可能多地使用Jsoup。
有没有办法加快Jsoup.parse()
?
答案 0 :(得分:6)
我尝试使用大页面(,如果可能,并且您只想在页面上显示某些信息)尝试最小化文本以解析先前识别您想要的区域,然后用JSoup解析想要的区域。
通过这种方式,您可以在Java中组合自己的解析来减少数据,然后将JSoup用于商品。