假设您有一个网站
example.com
并且你有一些图像被调整到非常低的质量。点击图片后,您会转到“view_image”页面,例如
example.com/view?image=image_related_temp_code
在此页面上,图像以完整质量加载。但是,如果您通过Chrome开发者控制台检查其src
属性以下载/浏览该src
链接,则会收到另一张图片,上面写着Go back as text,这可能会禁止您直接下载文件链接。因此,这意味着您无法通过src
链接获取图片。此外,每次刷新网页时src
都会更改。
我的问题:您将如何使用Java / Jsoup / Javascript,以便您可以直接从网页或浏览器内容获取和保存缓存的图像,而无需使用src
属性
我尝试过只使用Jsoup。我执行了Jsoup connect()
和get()
,通过Jsoup-Document使用适当的类组合搜索<img>
标记。并实施了getSRC()
方法,并实施了使用srcToFile()
方法保存图片的Files.copy()
方法。但是,直到现在,我只能一次又一次地获得Go Back图像。
我无法共享网站网址,因为它是在大学服务器上本地托管的。这可能是由于.htaccess
文件,是否有可能以某种方式保存缓存的图像?
答案 0 :(得分:0)
您的HTML包含<img src='#nothingToKnow'>
。
在body.onload()中,您通过服务器的Ajax调用来读取图像。
但服务器必须发送base64(imagedata)。使用结果字符串,您可以将图像更改为document.getElementById("theImgId").src = 'data:image/png;base64,'+resultstring;