标签: java html jsoup web-crawler
我尝试像亚马逊一样从网页抓取数据,但我只对产品的价格感兴趣。当我尝试抓取大量数据时,需要花费太多时间来下载完整的HTML文档。因此,我希望只下载HTML文档中Price的部分(如第一个300kb)。如果可能的话,最好只下载HTML文档中间的一部分,但是如何只下载特定数量的字节就足够了。我正在使用Jsoup来抓取数据。如果有人能够并且愿意帮助我,那就太好了。)