如何以编程方式下载网页的所有内容,而不仅仅是Java中的源代码

时间:2014-12-14 07:41:51

标签: java javascript android html css

我知道如何在java中下载网页的源代码。但是网页还包含图片网址,CSS和JS脚本网址,需要稍后下载,如:

<LINK REL="STYLESHEET" HREF="htmlatex.css">
<img src=p10012.gif>

如果我只下载网页来源,则以离线模式呈现该网页时,需要在离线模式下下载此htmlatex.cssp10012.gif个结果。我的目标是以编程方式下载网页的所有内容,并将其作为Android应用程序的资产提供。我可以在java中做到这一点。

注意:如果我的问题不够明确,请告诉我。

1 个答案:

答案 0 :(得分:0)

我建议使用JSoup库来做它非常好的HTML解析。您可以解析HTML而不是迭代资源来下载它们。我不确定,但是你应该在同一主题上有一个例子。