列出要下载的PDF文件的8,000多个HTTP链接。读取每个链接并调用我的方法downloadFile()并将其保存到本地Window $ PC。跨越2种链接格式:
第一种类型(直接)始终有效。第二个不起作用。当它将文件保存为pdf时,它看起来像:
<div id="error">
<ul>
</ul>
</div>
<form id="download" name="download" method="post" action="/careManager/DownloadFormController.do?AttachmentId=2000">
<input type="hidden" name="attachID" value="2000" >
</form>
<script language="Javascript" type="text/javascript">
document.forms[0].submit();
</script>
</body>
</div>
当我在浏览器的开发者工具中关注非工作链接时,它会被javascript文件重定向到HTTPS站点(将协议更改为HTTPS)。
我错过了什么?
我尝试设置cookiehandler,将系统属性http.strictPostRedirect设置为true,将连接setFollowRedirects和setInstanceFollowRedirects设置为true,如果转发/移动则创建新的URL连接,设置连接setReadTimeout,为SSL创建HttpsURLConnection。所有这些都没有为servlet工作。
public static void downloadFile(String downloadUrl, String fileName) throws Exception {
CookieHandler.setDefault( new CookieManager( null, CookiePolicy.ACCEPT_ALL ) );
// String cookie = CookieManager.getInstance().getCookie( downloadUrl.toString() );
URL url = new URL( downloadUrl );
File file = new File( "C:\\temp\\smc1\\" + fileName );
HttpURLConnection c = (HttpURLConnection) url.openConnection();
System.setProperty("http.strictPostRedirect", "true");
int responseCode = c.getResponseCode();
InputStream is;
if( responseCode == HttpURLConnection.HTTP_MOVED_PERM
|| responseCode == HttpURLConnection.HTTP_MOVED_TEMP
|| responseCode == HttpURLConnection.HTTP_SEE_OTHER ) {
// Get new URL (https) from HttpURLConnection frowarding
URL newUrl = new URL( c.getHeaderField("Location") );
HttpURLConnection sc = (HttpURLConnection) newUrl.openConnection();
sc.setFollowRedirects(true);
sc.setInstanceFollowRedirects(true);
responseCode = sc.getResponseCode();
// sc.setReadTimeout(15*1000);
is = sc.getInputStream();
} else {
c.setFollowRedirects(true);
c.setInstanceFollowRedirects(true);
responseCode = c.getResponseCode();
is = c.getInputStream();
}
// System.out.println( " Code: " + responseCode );
FileOutputStream fos = new FileOutputStream( file );
int bytesRead;
byte[] buffer = new byte[ 1024 ];
while( ( bytesRead = is.read(buffer) ) != -1 ) {
fos.write(buffer, 0, bytesRead);
}
if( fos != null ) {
fos.flush();
fos.close();
}
if( is != null ) {
is.close();
}
}
我是servlet的使用者,只有链接作为访问权限。 提前谢谢!
答案 0 :(得分:1)
这将从不工作,无论您编写多少额外的代码,这些代码在重定向时默认执行Java已经执行的操作。
HTML页面会自动发布一个表单,该表单在浏览器加载时会导致下载。 Java代码永远不会执行它。
答案 1 :(得分:0)
我能够通过以下方式解决我的问题:
我的默认浏览器是chrome。我还看了多少个标签被打开以自动关闭浏览器并启动一个新标签。