HttpURLConnection从Servlet下载文件无法正常工作,直接链接工作

时间:2015-03-16 22:53:28

标签: java servlets pdf httpurlconnection

列出要下载的PDF文件的8,000多个HTTP链接。读取每个链接并调用我的方法downloadFile()并将其保存到本地Window $ PC。跨越2种链接格式:

  • http://example.com/docs/pdfs/Downloadable.pdf
  • http://example.com/docs/download.do?AttchmentId=2000

    第一种类型(直接)始终有效。第二个不起作用。当它将文件保存为pdf时,它看起来像:

    <div id="error">
        <ul>
        </ul>
    </div>
    <form id="download" name="download" method="post" action="/careManager/DownloadFormController.do?AttachmentId=2000">
    <input type="hidden" name="attachID" value="2000" >  
    </form>
    <script language="Javascript" type="text/javascript">
     document.forms[0].submit();
    </script>
    </body>
    </div>  
    

    当我在浏览器的开发者工具中关注非工作链接时,它会被javascript文件重定向到HTTPS站点(将协议更改为HTTPS)。

    我错过了什么?

    我尝试设置cookiehandler,将系统属性http.strictPostRedirect设置为true,将连接setFollowRedirects和setInstanceFollowRedirects设置为true,如果转发/移动则创建新的URL连接,设置连接setReadTimeout,为SSL创建HttpsURLConnection。所有这些都没有为servlet工作。

    public static void downloadFile(String downloadUrl, String fileName) throws Exception {
    
        CookieHandler.setDefault( new CookieManager( null, CookiePolicy.ACCEPT_ALL ) );
        // String cookie = CookieManager.getInstance().getCookie( downloadUrl.toString() );
        URL url  = new URL( downloadUrl );
        File file = new File( "C:\\temp\\smc1\\" + fileName );
    
        HttpURLConnection c = (HttpURLConnection) url.openConnection();
        System.setProperty("http.strictPostRedirect", "true");
    
        int responseCode = c.getResponseCode();
        InputStream is;
    
        if( responseCode == HttpURLConnection.HTTP_MOVED_PERM
                || responseCode == HttpURLConnection.HTTP_MOVED_TEMP
                || responseCode == HttpURLConnection.HTTP_SEE_OTHER ) {
    
            // Get new URL (https) from HttpURLConnection frowarding
            URL newUrl = new URL( c.getHeaderField("Location") );
            HttpURLConnection sc = (HttpURLConnection) newUrl.openConnection();
    
            sc.setFollowRedirects(true);
            sc.setInstanceFollowRedirects(true);
            responseCode = sc.getResponseCode();
            // sc.setReadTimeout(15*1000);
    
            is = sc.getInputStream();
        } else {
            c.setFollowRedirects(true);
            c.setInstanceFollowRedirects(true);
            responseCode = c.getResponseCode();
            is = c.getInputStream();
        }
        // System.out.println( " Code: " + responseCode );
    
        FileOutputStream fos = new FileOutputStream( file );
    
        int bytesRead;
        byte[] buffer = new byte[ 1024 ];
        while( ( bytesRead = is.read(buffer) ) != -1 ) {
            fos.write(buffer, 0, bytesRead);
        }
    
        if( fos != null ) {
            fos.flush();
            fos.close();
        }
        if( is != null ) {
            is.close();
        }
    }  
    

    我是servlet的使用者,只有链接作为访问权限。 提前谢谢!

  • 2 个答案:

    答案 0 :(得分:1)

    这将从不工作,无论您编写多少额外的代码,这些代码在重定向时默认执行Java已经执行的操作。

    HTML页面会自动发布一个表单,该表单在浏览器加载时会导致下载。 Java代码永远不会执行它。

    答案 1 :(得分:0)

    我能够通过以下方式解决我的问题:

    1. 修改默认浏览器的默认下载位置
    2. 开发循环以使用url启动浏览器并下载默认位置的每个文件
    3. 我的默认浏览器是chrome。我还看了多少个标签被打开以自动关闭浏览器并启动一个新标签。