我正在学习编写实验性爬虫。我打算用JSoup。我的问题是,例如,如果加载facebook.com是JSoup将下载CSS,JS,&作为该页面一部分的图像。
简单来说 JSoup是否加载资产,例如链接样式表,JS,图像等?
答案 0 :(得分:0)
Jsoup
仅下载该页面中的html
代码。它不会下载 JavaScript生成的HTML ,链接的css或js或图片。
但是,对于图片,您可以使用img
提取Jsoup
标记,然后使用URL
和Input/OutputStream
分别下载java
1}}。