如何使用Java仅下载HTML文档的一部分

时间:2014-09-09 14:19:42

标签: java html jsoup web-crawler

我尝试像亚马逊一样从网页抓取数据,但我只对产品的价格感兴趣。当我尝试抓取大量数据时,需要花费太多时间来下载完整的HTML文档。因此,我希望只下载HTML文档中Price的部分(如第一个300kb)。如果可能的话,最好只下载HTML文档中间的一部分,但是如何只下载特定数量的字节就足够了。我正在使用Jsoup来抓取数据。如果有人能够并且愿意帮助我,那就太好了。)

0 个答案:

没有答案